加载中…
个人资料
IT视野
IT视野
  • 博客等级:
  • 博客积分:0
  • 博客访问:281,956
  • 关注人气:91
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

SQL语句 SELECT LIKE like用法详解

(2013-01-10 14:47:47)
标签:

第二

测试结果

做一个

字母

中包

it

分类: 数据库技术

LIKE语句的语法格式是:select from 表名 where 字段名 like 对应值(子串),它主要是针对字符型字段的,它的作用是在一个字符型字段列中检索包含对应子串的。 

  假设有一个数据库中有个表table1,在table1中有两个字段,分别是name和sex二者全是字符型数据。现在我们要在姓名字段中查询以“张”字开头的记录,语句如下: 

   select from table1 where name like "张*" 

   如果要查询以“张”结尾的记录,则语句如下: 

  select from table1 where name like "*张" 

   这里用到了通配符“*”,可以说,like语句是和通配符分不开的。下面我们就详细介绍一下通配符。 
  多个字符 
  * 
  c*c代表cc,cBc,cbc,cabdfec等 
  它同于DOS命令中的通配符,代表多个字符。 
  多个字符 
  % 
  %c%代表agdcagd等 
  这种方法在很多程序中要用到,主要是查询包含子串的。 
  特殊字符 
   

a代表a*a 
  代替* 
  单字符 
  ? 
  b?b代表brb,bFb等 
  同于DOS命令中的?通配符,代表单个字符 
  单数字 
  # 
  k#k代表k1k,k8k,k0k 
  大致同上,不同的是代只能代表单个数字。 
  字符范围 
  - 
  [a-z]代表a到z的26个字母中任意一个 
  指定一个范围中任意一个 
  续上 

排除 
  [!字符] 
  [!a-z]代表9,0,%,*等 
  它只代表单个字符 
  数字排除 
  [!数字] 
  [!0-9]代表A,b,C,d等 
  同上 
  组合类型 
  字符[范围类型]字符 
  cc[!a-d]#代表ccF#等 
  可以和其它几种方式组合使用 
  例:假设表table1中有以下记录: 
  name sex 
  张小明    男 
  李明天    男 
  李a天     女 
  王5五     男 
  王清五    男 
  下面我们来举例说明一下:
  查询name字段中包含有“明”字的。 
  select from table1 where name like '%明%' 
  查询name字段中以“李”字开头。 
  select from table1 where name like '李*' 
  查询name字段中含有数字的。 
  select from table1 where name like '%[0-9]%' 
   查询name字段中含有小写字母的。 
  select from table1 where name like '%[a-z]%' 
  查询name字段中不含有数字的。 
  select from table1 where name like '%[!0-9]%'

         我们着重要说明的是通配符“*”与“%”的区别。 
   select from table1 where name like '*明*' 
   select from table1 where name like '%明%' 
  大家会看到,前一条语句列出来的是所有的记录,而后一条记录列出来的是name字段中含有“明”的记录,所以说,当我们作字符型字段包含一个子串的查询时最好采用“%”而不用“*”,用“*”的时候只在开头或者只在结尾时,而不能两端全由“*”代替任意字符的情况下。

大家在写sql 语句的时候, 如果是 select .. where 类型的语句, 有注意到条件的前后顺序吗?我今天做个小实验。

比如查询地址里 包含“海口市”及“振兴路” 两个关键字的数据, 一般时候可能会用

select from dm_addr where addr like '%海口市%' and addr like '%振兴路%' 的形式,但其实这种查询效率不高,原因在于条件的前后顺序。以下是测试结果

mysql> select count(1) from dm_addr where addr like '%振兴路%' and addr like '%海口市%';
+----------+
count(1) |
+----------+
96 |
+----------+
row in set (0.82 sec)

mysql> select count(1) from dm_addr where addr like '%海口市%' and addr like '%振兴路%';
+----------+
count(1) |
+----------+
96 |
+----------+
row in set (0.91 sec)

我做了很多次查询

where addr like '%海口市%' and addr like '%振兴路%' 总是比 where addr like '%振兴路%' and addr like '%海口市%'

慢,原因是查询是先处理第一条件,然后在处理第二个条件,先查询出所有 包含“海口市”的记录,再在这些记录中查询包含"振兴路" 的记录。 对于地址情况, 包含“海口市”的记录可能大于"振兴路" 的记录,我做测试的表有2万条数据, 已经有大概0.1s的差别。如果碰到大数据,这个差别会更大。

按以上的分析结果, 我们写SQL语句的时候, 对于select ...where ... 类型的语句,应该把查询结果范围小的条件放在前面,查询范围大的条件放在后面,这样会提高效率。

对于OR的情况:

测试如下:

mysql> select count(1) from dm_addr where addr like '%海口市%' or addr like '%振兴路%';
+----------+
count(1) |
+----------+

39168 |
+----------+
row in set (0.84 sec)
mysql> select count(1) from dm_addr where addr like '%振兴路%' or addr like '%海口市%';
+----------+
count(1) |
+----------+
39168 |
+----------+
row in set (0.95 sec)

OR语句的处理过程是这样, 对于每一条地址, 逐个分析条件,如果符合第一个条件,就不做第二条件的判断,那么我们应该把容易做判断的条件放在前面, 比如查询地址里 包含“海口市”或“振兴路” 个关键字的数据,按地址一般排法,XX市应该在XX路前。所以如果用第一种方式,那就效率高,判断有海口市就可以确认这行地址有效了。 所以在写OR类型的条件时, 应该把容易判断的条件写在前面。大地址写在前,小的写在后边

再做一个NOT ... OR .. NOT ... 测试,查询不包含 海口市 或者不包含 振兴路 的数据
mysql> select count(1) from dm_addr where addr not like '%海口市%' or addr not like '%振兴路%';
+----------+
count(1) |
+----------+
38752 |
+----------+
row in set (0.92 sec)

mysql> select count(1) from dm_addr where addr not like '%振兴路%' or addr not like '%海口市%';
+----------+
count(1) |
+----------+
38752 |
+----------+
row in set (0.86 sec)

因为每条数据都有海口市, 所以对于第一个查询,判断第一个条件都失败了, 都需要判断第二个。
对于第二个查询, 只要判断第一个条件为真就可以确定这个记录, 不需要判断第一个条件, 所以第二个查询效率高过第一个。

结论:对于select ... where ... 类型的语句。

对于OR条件, 需要把命中率高的条件放在前面。

对于AND条件,需要把条件限制范围小的条件放在前面。

希望这些实验能提高phper 的程序效率。以上测试是对于mysql 5.0 win 做的。好象记得ORACLE刚好相反, 是先判断最后的条件。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有