标签:
微软亚洲研究院最新技术成果展示互联网搜索组搜索技术 |
分类: 技术 |
文:《互联网周刊》
市场现状是,搜索引擎能够认字,却无法识图。无论是基于桌面的图片管理软件还是基于互联网的图片搜索,都还停留在一个浅显的层次,主要依靠图片本身的文件名称和简介来获取一幅图片的含义。给搜索引擎一张图片,它很难像搜索关键字那样,搜索出与之相关的图片。
通常户外的背景较为柔和,树木、蓝天及地平线的元素较多;而城市内建筑物的线条均有棱有角,背景变化较大。根据这些特征做成分类器,用几万张图片训练出一个模型,每当有新照片时,系统便可根据分类器将其自动分类。而由于某些照片并不能准确地归为室内/室外,或是城市/风景,因此该系统基于前者的分类准确率大致为90%以上,而后者目前能达到80%以上,并自动拒识有可能分错的图片。
最为有趣的一点是,系统可以对一张已导入的图片中的人脸进行标注,并在图片库中查询与之相似的图片。比如,你和朋友结伴游玩,拍摄了好多照片,想找到自己的照片时,利用这项技术可以省去很多麻烦。首先,你要对一张人物照进行标注,让计算机知道这张人脸属于谁。而后,你可以通过几次确认,训练计算机的认知,它便可以自动识别了。
人在看到一幅图像时,通常会将目光停留在某一个点上,这也是摄影家们所称的“兴趣中心”。如今,计算机也能够做到这一点。这项技术能够构建一个用户注意力模型,从视觉、心理学、色彩反差等多个角度判定图片中的哪个部分会比较吸引用户。张磊博士为记者演示了一个自动寻找图片中的兴趣中心的屏保。随意选中几幅图片,系统可以从人类感观角度生成一个浏览路径,始终围绕着兴趣中心对图片进行缩放。这个由系统自动生成的屏保,看起来就像是由电视导演剪切好的拉伸镜头一样精彩。
目前,一些商业图片和互联网上带有上下文的图片信息,有助于帮助完成标注训练工作,但噪音仍很大。借助几百万张已被标注的图片库,系统可以自动标注新的图片。对于一个新的图片,系统可以在图片库中寻找相似的其他图片,并对结果进行分析和聚类,就可以得新图片的标注。这将是一种能够搜索到图片里面的技术。它使计算机不仅认识了落日和晚霞,也认识了人和动物,但显然仍有许多问题等待进一步探索和解决。