王瑞斌

数码相机和DV的普及使得互联网上的图片与日具增,尤其是Web2.0概念下图片、视频分享网站的风起云涌使得图像搜索正成为更核心的一项互联网应用。根据调查公司 Hitwise的相关数据,目前图片搜索占据了网络搜索8%的访问量,Google和Yahoo 每个月要接受2.7亿次图片搜索要求。因此,面对应接不暇的用户需求和彼此之间的激烈竞争,如何提高图片搜索的性能,如何更快速更准确地找到目标图片,是摆在各大搜索引擎面前一个重要课题。同时围绕着图片搜索,也有新进的各路诸侯展开了种种探索和角逐,试图瓜分市场。因而近来图片搜索成为互联网搜索业内一个相当热闹的领域。
被比尔.格罗斯(Bill Gross)当作挑战Google利器的搜索引擎Snap在2006年12月19日推出了视觉化的图片搜索功能。尽管Snap提供的搜索结果和其他搜索巨头们提供的并没有什么两样,但是Snap独特的双栏界面,还是给了我们非常酷的感觉和体验。Snap.com独特的视觉化呈现搜索结果技术允许用户找出网上的图片,并且通过图片预览功能快速选择和处理图片。这为用户提供了一种持续、独特、更为有效的方法来获得搜索结果并与搜索结果展开互动。
Snap的运营者 Perfect Market Technologies公司的首席执行官 Tom McGovern说“我们期望通过增加Snap的图片搜索功能更进一步增强互联网搜索体验。我们一直相信,视觉化预览是搜索体验不可或缺的一部分。将我们这种独特的能力用于为用户提供图片搜索是再自然不过的事情了。”
尽管Snap在UI(用户界面)设计上取得了长足的进展,为用户图片搜索提供了更为丰富的使用体验。但这种做法并没有对图片搜索的现状作出根本改变。目前主要几大搜索引擎的图片搜索依据的还是元数据搜索,即依靠对于图片文件的文本描述,并不搜索照片内的数据,而是搜索与照片“相伴”的“身份数据”。这种方式提供的图片数据是外在的、有限的,当然无法满足用户的搜索需求,在提高图片搜索的精准程度上有所作为。
但是一些新兴企业如Riya和Polar Rose等公司依据独特的图片搜索演算系统,推出了新式图片搜索服务,以期在某种程度上解决这一问题。
以面部图像识别技术而闻名的照片搜索服务公司Riya,在2006年11月8日发布了一款名为Like.com的虚拟图像搜索引擎。Like.com是一个购物搜索引擎,提供了文字和图像两种查询方式,主要针对购物中的产品图片进行像素对比的搜索(更多的颜色条件),能搜索出类似图形样式的产品。Like.com比较有特色的地方在于使用了非常强大的图像识别技术,它会自动识别照片中用户选择的某一区域的内容,并据此返回搜索结果。而且在结果中还可调整颜色、形状及图案等元素,以便寻找到更精确的物品。还能够通过不同的颜色对比限定(搜索条目中),以及不同的局部条件(比如挂带的搭扣等等),来更新搜索结果。由于Like.com刚刚启动,所以在搜索返回的结果中目前只包括鞋子、珠宝、手提包和手表四种类型,随着网站发展今后会有更种类添加进来。如果用户点击的搜索结果图片来自另一个电子商务公司,Riya将从其中获得中介费用。
与Like.com相似,ChezImedla也是一个视觉化购物搜索网站,用户可以浏览所有基于颜色和形体等视觉化提示的图片。双击任何一个图片用户都会得到类似鞋子的图片。ChezImedla 是Pixsta 公司于2006年10月份发布的一个 demo网站。Pixsta由Alexander Straub 和Daniel Heesch.创建,是一个集中于视觉化浏览和搜索技术的新兴公司。尽管公司诞生不久,但Pixsta的搜索技术底层技术所依赖的系列算法已经开发了近10年。Pixsta技术通过图片的颜色、外型和纹理特征来建立图片的关系,这克服了现存搜索技术的局限。为提高图片搜索的精确度提供了一种可能。
来自瑞典的创新企业—极地玫瑰(Polar Rose)也计划将在2007年初推出一项更加有效的互联网图片搜索服务。极地玫瑰(Polar Rose)位于瑞典隆德—玛尔摩大学(universities of Lund and Malmö),他们在计算机数码图像和视频分析方面的研究已经得到了公众的认可。这个由自主研发者、数学博士及技术经济学家组成的仅有13人的团队已经引起了风险投资人的高度关注,在2006年11月份Polar Rose公司已经成功地从哥本哈根的北欧风险投资公司(Nordic Venture Partners)募集了它的第一笔价值510万美元的风险投资。

Polar Rose正试图将独特的面部识别算法和用户智能结合起来,提供一种不同于目前图片搜索功能的新的图片搜索服务。Polar Rose的面部识别技术源于公司CTO Jan Erik Solem 在瑞典隆德—玛尔摩大学(universities of Lund and Malmö)就读博士之时所研究的项目。它的独特之处在于可以从二维图象中提取三维信息,有效地克服了现存面部识别技术的缺点。在图片中识别出人来,是一个不小的挑战,因为计算机必须在纯粹的象素层面上解释图片并提取信息,就象我们人类日常所做的那样。当我们与真实的照片打交道的时候,主要的问题是每张照片上面部表情、光线、姿势都是有变化的。软件将这些要素复制下来,创建一个人的虚拟三维肖像,这样我们可以将之分解出来再合成各种效果。这一技术基于运用普通照片进行三维数据计算的电脑视觉研究。在我们从二维图象中观察到的要素和这些要素可能的三维变化之间存在的统计关系给予了我们一种方法,可以使我们从一张纯粹的照片中得到三维图象信息。即使这一三维肖像只是一种近似图象并不确实,也增加了识别的可能性。

极地玫瑰的CEO Nikolaj Nyholm表示:“极地玫瑰的技术是希望能使人们在各类网站里分类、检索朋友、名人、家人的照片变得更加便捷高效。”极地玫瑰的图象搜索技术可以将一幅二维图片转换成三维模型,从这个三维模型出发 Polar Rose可以因特网和像Flickr这些公共的图片站点搜索与之数据相匹配的图片。虽然这些三维模型是虚拟的,但其演算系统可以将光线、拍摄角度、物体表明角度等相关的差别过滤成两张或更多的图片。这些差异就能够过滤掉很多搜索结果。公司的创始人兼首席技术官Eric Solem表示,通过对差别进行过滤,搜索的结果就会变得更加精确。尽管有些图片只是直接的头部照,但是Polar Rose的搜索引起能够把它转换成大半身像与侧面照。
尽管这种独特的面部识别技术和三维信息提取算法使得 Polar Rose在目前图片搜索中成为一支异军突起的黑马,为图片搜索带来一种新的境界,但Polar Rose并不仅仅依赖这种技术,而是将之与Web2.0倡导的利用用户的集体智慧相结合起来,来对以前系统未曾见过的人作出命名和标记。Tim O'Reilly曾将用户与计算之间的这种联系命名为“仿生软件”——计算机帮助用户,反过来用户也帮助计算机。首先极地玫瑰会识别图片上与要寻找的人相似的部分,如果要找的人不在 Polar Ros的数据库里,相应的应用程序会询问是否认识图片中的人。如果 Polar Rose数据库可以识别该人或有可能相匹配的,该图片会被显示出来并询问用户的意见或要求重新输入。促使用户参与来提供描述数据。无疑会使数据信息更为丰富,可以极大地提升图片搜索的准确度有。而用户输入数据也可以进一步扩展图像的数据库。
有关该技术和产品更进一步的细节将会在2006年底披露,而Polar Rose网络图片搜索的测试版本将会在2007年第一季度发布。据悉Polar Rose目前还在开发一个用于搜索视频流中人面的工具。
分析师指出,目前市场上还没有一个十分准确有效的、能够通过互联网搜索照片的方法。市场调研公司Jupiter的分析师Gary Stein指出,面部识别是一种“奇难”的技术,如果成功,将把图片搜索带入全新的境界,美国的市场研究机构Inside Digital Media的高级分析师菲尔·利(Phil Leigh)指出:“这项技术无疑是非常有意义的,重点在于它能够运行的有多好。”
除了上述Riya、Pixsta、Polar Rose等公司在图象搜索领域展开另类探索之外,包括IBM、3VR Security、EverNote在内的其它公司也在图象搜索领域大展拳脚,EverNote已经开发了能够识别图像中单词的技术,IBM、3VR Security已经开发出了识别视频片断中图像的技术。而英国视频搜索引擎Blinkx也采用了面部识别技术,能够识别500-1000位名人的脸。比如对“George W. Bush”进行搜索,搜索结果将包含用户在标注中提到“George Bush”,或在对话中提到“George Bush”,或者所有画面中出现George Bush的脸的视频剪辑。
可见图象搜索领域内一场新的技术革命已经是山雨欲来风满楼。尤其是坊间流传的Google欲并购Riya的传闻和Yahoo!将全球领先的搜索新技术——Vespa平台技术运用到图片搜索中来的举动,使得图片搜索领域内的逐鹿之战更为惊心动魄。
在这场图片搜索的群雄之争中,无论是谁最后胜出,都将会是迈向未来搜索王座的关键的一步。