百度图片标注新算法 准确率超谷歌
(2012-08-25 22:02:03)
标签:
百度搜索引擎标记标注机器学习算法it |
Google在海量数据处理上的自动标注算法可以说已经代表了世界技术的先进水平,不过目前百度新研发的图像标注算法实现了新的突破,在内部的一项评测中,获得了比Google公开发表的结果更好的准确率,而在内存计算的开销上却基本没有增加。
“我们通过利用机器学习中的多标记学习技术,修改目标函数,创新标注模型,改善优化技术等等手段,大幅提高了自动图像标注的性能,同时还能保证快速的训练时间和极低的内存开销,目前的算法在单机上就能处理海量数据。”
“多标记机器学习”是带来技术突破的关键。如果只给图片做单一的标记往往不能完整的描述其语义。黄圣君打了个比方:“一幅图像往往会包含了多个语义对象。比如一幅海边落日的图像可能同时具有“大海”,“日落”,“沙滩”,“人”,“船”多个标记。因此,相比于传统的单标记学习,用多标记学习技术来处理图像标注的任务将更符合实际情况。”
第一个工作是关于多标记学习中一个非常重要的任务:让机器自动从数据中发掘对学习任务有帮助的标记关系。黄圣君所做的就是让机器在学习一个标记的时候,会自动的发现其他标记上已经训练好的模型哪些是对自己有用的,然后进行最优重用。同时,这种重用还是非对称的。“有海洋标记的图片必定有水,但有水标记的却可能是一个游泳池,我们在论文中提出的方法让机器学会了自动优化重用模型的过程,还能学习出不对称的标记关系。”
第二个工作是关于如何恰当的利用标记关系的。以往的方法往往简单的把标记关系应用在所有样本上,会出现副作用的情况。“通常树和山是同时出现的,但实际上图片中有沙丘这种类似山的形态的图像时却未必有树,因此在这种情况下算法通过山预测出的树就会出现反作用,我们要做的就是通过一个编码向量来建模分析,哪些关系对哪些样本是有帮助的,而哪些又是有误导的,从而利用标记关系的局部特性来提升多标记学习的性能。”