中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法_TianshiYan

http://blog.sina.com.cn/u/1182679860

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法

(2006-01-18 21:59:13)

分类： ●日语学习&电脑技巧

有一个Web项目，Web.Config中requestEncoding和responseEncoding都是gb2312，而从数据库中取出的简介数据可能是中文和韩、日文混合的内容，这时候如果直接输出到页面上，其页面会出现乱码，其中的韩文内容无法正确显示。当然如果项目的编码都使用Utf-8的话将没有这个问题，但这个项目是一个老项目，为了尽量不要影响已有的程序，所以无法将编码改为Utf-8,只能在本页面上动脑筋。

经过研究，发现这个问题可以通过Html实体的方法解决。

对于Html实体请参考：

Character entity references in HTML 4

HTML Document Representation

测试代码：

Byte[] bComments = Encoding.UTF8.GetBytes("一ンブル????中文");
char[] cComments = Encoding.UTF8.GetChars(bComments);

StringBuilder charBuilder = new StringBuilder();
foreach(char c in cComments)
{
if(c > '\u0800')
{
charBuilder.Append("&#");
charBuilder.Append((int)c);
}
else
{
charBuilder.Append(c);
}
}
Response.Write(charBuilder.ToString());

这段代码的作用是将所有的中文、韩文、日文字符通过硬编码输出成为html实体。而Html实体是不受ResponseEncoding和页面编码集影响的。

说明：

\u0800 以上的为中、韩、日字符。

中文的范围：\u4e00 - \u9fa5，日文在\u0800 - \u4e00，韩文为\u9fa5以上。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：HP素材搜集+创意设计

后一篇：未公布消息：2005年度公司岗位明星当选

新浪BLOG意见反馈留言板　欢迎批评指正