加载中…
个人资料
果果爸
果果爸
  • 博客等级:
  • 博客积分:0
  • 博客访问:233,583
  • 关注人气:29
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

mysql utf8 length test

(2010-09-07 22:31:28)
标签:

mysql

utf8

length

test

杂谈

分类: mysql
 1.一个汉字占多少长度与编码有关:
         UTF-8:一个汉字=3个字节
         GBK:一个汉字=2个字节
 2.varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别
 3.MySQL检查长度,可用SQL语言:
        select LENGTH(fieldname) from tablename 来查看
涉及到了字符长度问题,搜索了一下,几乎千篇一律, 所以决定自己测试一下,彻底弄清楚字符长度问题.
编码一律为 UTF-8 编码 :
先来测试一下 php 把一个汉字认作几个字节:

<?php
header('Content-Type:text/html;charset=UTF-8');
$str='我';
echo strlen($str);
?>
输出 3 , 证明在 UTF-8编码下, 一个汉字被认作3个字节长度.

而如果我们用 php 多字节扩展函数 mb_strlen($str,'utf8'); 这个时候输出 1

下面来测试一下 mysql char 和 varchar 字节长度.

创建一个数据库 (txt) :
CREATE DATABASE IF NOT EXISTS txt DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
创建一个表 (test) :
create table test(txt_char char(2) null, txt_varchar varchar(2) null ) ENGINE=MyISAM
确认一下我们表的字符集: 确实是UTF8编码的.

插入两条记录:

INSERT INTO test(txt_char,txt_varchar) VALUES ('abcdef','uvwxyz') , ('我是中国人','北京欢迎你') ;

在看看查询结果:
mysql> select * from test;
+----------+-------------+
| txt_char | txt_varchar |
+----------+-------------+
| ab       | uv          |
| 我是      |北京         |
+----------+-------------+
2 rows in set (0.01 sec)

mysql> select length(txt_char),length(txt_varchar) from test;
+------------------+---------------------+
| length(txt_char) | length(txt_varchar) |
+------------------+---------------------+
               2 |                   2 |
               2 |                   2 |
+------------------+---------------------+
2 rows in set (0.01 sec)

证明 mysql 并不会对超过长度的字符报错,而是直接截断了.

并且 char(2) 和 varchar(2) 都能存储 2个汉字,或者是两个英文字符.
证明 mysql 的 char(n) 可以直接存储 n 个汉字. 而不是 n/3 个
mysql 屏蔽了具体的存储细节,而直接以实际字符的个数来决定 char存储的个数.

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有