加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

谷歌图书搜索需要一个更牛逼的OCR

(2007-03-05 19:14:44)

2007年03月05日 星期一
天气:倒春寒

谷歌说他们推出了图书搜索中文试用版,Google说他们很早很早以前就推出英文测试版啦。抱着试试看的态度,我决定搜索一下,毕竟我是Google的用户和粉丝。可是我搜索什么呢?我没有写过书,最近也没有看什么正经书,还真的不知道应该搜索一些什么。只好按照自己的想法,搜索了一个常用词:牛逼。

其实我这么搜索,只是想赞叹一下Google的技术,Google一直是很牛逼的。可惜,很牛逼的技术来到中国之后就变得不怎么牛逼了,甚至有一些狼狈。不知道为什么,谷歌总是给我一些莫明其妙的搜索结果,比如下面这副图片,呵呵:

 

谷歌图书搜索需要一个更牛逼的OCR




好牛逼的搜索结果

非常震惊啊,原来“牛逼”这个词在清朝的时候就有人用了,还写在当时的书目里面~赶紧点击进去看看到底是怎么一回事,呵呵。结果就是,谷歌欺骗了我。他们用的OCR技术并不是那么牛逼。以至于把一个“牛運震(牛运震)”识别为了“牛逼震”-。-

当然,我们不能对谷歌如此苛刻,毕竟这还是一家很牛逼的公司。而且中华汉字之复杂,世界都公认了。我写这篇日志,只是希望谷歌能够有一个更牛逼的OCR技术,呵呵。别在Blog上继续教大家什么是OCR了,让工程师们好好研究研究OCR技术呗。如果OCR技术不改进,难保不会出现二个“牛逼震”。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有