在一个国际会议上获奖很难,在一个领域的顶级会议上获奖更难,在一个顶级国际会议上获得两项大奖更是鲜有先例。但是,微软亚洲研究院做到了。在今年9月底于德国慕尼黑旁小城奥格斯堡召开的ACM多媒体大会
(ACM Multimedia
2007)上,我们同时获得了最佳论文奖和最佳演示奖。
ACM Multimedia –
多媒体领域顶级盛会
ACM Multimedia
是多媒体领域最高级的会议,参与者多是多媒体内容分析、多媒体应用、系统和交互方面的研究人员。会议通常包括长论文、短论文、演示和视频演示等不同的板块,其中长论文是最富挑战性的,近年来每年只收50至60篇左右,收稿率在20%以下。微软亚洲研究院从2003年以来在这个会议上一直有很好的表现,尤其是今年,研究院共有八篇长论文被接受,创下新高,占论文总数(57篇)的14%。其中我带领的多媒体内容分析和搜索小组就有五篇被接收(包括与中国科技大学合作的文章),而且我与中国科技大学实习生齐国君以及其他四位同事合作的论文在评审后被选为四篇候选最佳论文之一,将在大会上角逐最佳论文奖。

(上台领奖——最佳论文奖)
今年会上发表的论文的主流(约占三分之一)是多媒体搜索及其相关的应用,包括视频和图像标注、视频搜索、视频广告、媒体推荐等。研究院的八篇长论文都与这个主题相关。这显示出互联网飞速发展对多媒体领域的巨大影响,以及学术界和工业界十分看重视媒体技术在互联网上的传播、共享、搜索、推荐和广告等应用。视频监控、移动设备上的多媒体应用、媒体交互、视频传输等也是热点讨论的主题。
今年也是研究院参加ACM
Multimedia人数最多的一年,包括实习生共有十二人。会上还碰到好几位以前研究院的实习生,他们现在都在国外知名大学继续学习,并在这次大会也有文章发表。
最佳论文 – 我在大会上第一个做报告
入选世界顶级学术会议最佳论文候选名单并非易事,最佳论文的讲演也是论文是否能获奖的重要参考指标。我有幸作为所有作者的代表,在大会的第一个技术Session“最佳论文竞赛”中做第一个报告,也就是整个会议的第一个技术讲演。在来奥格斯堡之前,在同事和我们小组实习生的监督评判下,我们已经演练多次。上台前虽略有紧张,但信心十足。经评审团讨论,我们的工作脱颖而出。在第二天长达五个小时的晚宴上,我们如愿获得了最佳论文奖。

(大会上华先胜博士用前一天在奥格斯堡市区拍的图片作现场演示)
获奖论文是一项关于视频搜索和机器学习的最新工作,主要研究如何利用语义概念(关键词)之间的联系来提高自动视频标注的准确率。视频标注是基于内容的视频搜索的关键步骤,自动标注好的视频就可以利用文本搜索的技术进行索引。已有的多概念学习方法可以分为两类,一类其实是将多概念独立处理,将多概念学习转化为多个两类分类问题。这类方法的缺点是没有利用语义概念之间的联系。在实际问题当中,语义概念之间互相联系,而这种联系可以用来提高标注的效果,甚至可以利用易于检测的语义概念来帮助检测难于检测的概念。第二类方法基于融合的方法,但融合是在第一类方法的基础上进行的,也就是通过融合独立分类器的输出结果来改进标注准确率。这类方法利用了语义之间的联系,但是这种“两步”策略不能解决误差传播的问题,有时甚至会降低标注效果。我们提出的是一种同时为语义概念以及概念之间关系建模的新方法,称之为“多概念关联学习”(Correlative
Multi-Label Learning
(CML))。这种方法克服了已有方法的缺点,在大数据集上取得了可喜的实验结果。具体论文参见:http://research.microsoft.com/~xshua/。
加载中,请稍候......