发博文
个人资料
星星
星星
  • 博客等级:
  • 博客积分:100
  • 博客访问:204
  • 关注人气:0
评论
加载中…
留言
加载中…
音乐播放器
访客
加载中…
好友
加载中…
博文
(2006-06-09 12:32)

 资料来源http://china.eceel.com/article/study_for_character_encoding_java.htm

--字符集编码

1. 概述

本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。

在下面的描述中,将以'中文'两个字为例,经查表可以知道其GB2312编码是'd6d0 cec4',Unicode编码为'4e2d 6587',UTF编码就是'e4b8ad e69687'。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来'表示'。

2. 编码基本知识

最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。

2.1. iso8859-1

属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母'a'的编码为0x61=97。

很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然'中文'两个字不存在iso88

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 



  我已经在新浪BLOG安家了,欢迎你时常过来做客,大家多多交流哦。我会把一些新鲜有趣的东西记录下来一块与你分享。也希望你记住我的BLOG地址,你可以把她添加到你的收藏夹,也可以把她复制下来告诉你的朋友们。

  :)

  我的BLOG地址:  http://blog.sina.com.cn/u/1225825984

阅读  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有