--字符集编码
1. 概述
本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。
在下面的描述中,将以'中文'两个字为例,经查表可以知道其GB2312编码是'd6d0 cec4',Unicode编码为'4e2d 6587',UTF编码就是'e4b8ad e69687'。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来'表示'。
2. 编码基本知识
最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。
2.1. iso8859-1
属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母'a'的编码为0x61=97。
很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然'中文'两个字不存在iso88


加载中…
添加到我的博客