加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

我希望实习生比我更优秀

(2008-04-17 12:05:40)
标签:

微软亚洲研究院

明日之星

实习生项目

基础研究

论文写作

指导实习生

分类: 人才
      刘铁岩是微软亚洲研究院互联网搜索与数据挖掘组的一名研究主管,主要从事两个方面的研究工作,一是通过机器学习解决信息检索中的排序问题(Learning to Rank),二是大尺度图的数据挖掘(Large-Scale Graph Mining)。凭借他在大学期间丰富的学生工作经验,在工作后不久就担负起了全组实习生的管理工作。作为一名辅导员,铁岩很快便与学生们打成一片,也由此得到了一个“孩子王”的称号。下面是一名研究院实习生与这位“孩子王”的对话。
 
作者:刘东 中国科学技术大学博士生
 

“改行”是偶然也是必然

 

Q:我从您的个人主页上注意到,您有一篇论文获得了Journal of Visual Communication and Image Representation的Most Cited Paper Award,是关于视频内容分析的。这似乎和你目前从事的信息检索不是很相关?

 

A:视频内容分析是我在清华读博士期间的研究课题。其实我在2003年刚刚进入微软亚洲研究院的时候,入职的组也是当时的媒体计算组。2004年研究院有过一次内部结构调整,媒体计算组被拆分,于是我转入了所在的互联网搜索与数据挖掘组,才“改行”开始做信息检索这方面的研究。

 

从我个人的角度,之所以选择信息检索有两个原因:一是它更能够顺应目前产业发展的趋势,互联网时代可以大有作为;二是信息检索的素材(如文本)和多媒体相比语义性更强一些,不存在所谓的semantic gap;由于这个差别,在从事信息检索的研究时,我们能够把更多的精力放在模型、算法和理论层面,而不是特征处理的层面。

baodao-for blog.jpg

Q:但是这次“改行”跨度是很大的,今天我们回过头看,您在信息检索这个领域有了很大的成绩,而且是在很短时间内就取得了。您有什么样的经验和心得可以介绍一下吗?

 

A:我觉得读博士期间主要的收获在于学会研究的方法(methodology),而不是只能应用于某个领域的专业知识,所以“改行”并没有想象中那么困难。主要的难点在于如何比较快的入门。在这一点上,首先研究院特别是互联网搜索组给我们提供了一个很好的环境,一个非常高标准的平台,通过向同事们学习和请教就可以基本了解这个领域最前沿的发展。其次我们也需要知道“别人在做什么”或者说“我们还没有做什么”,发现缺失的部分,从而更好地定位我的工作。这个学习的过程是很重要的,我带了几个实习生一起,从理论开始学起。我们用了半年到一年的时间边学习边做“讲座”,把信息检索和机器学习的相关理论系统都梳理了一遍。学完之后我们大概可以算得上整个组里面最懂理论的了(笑)。学习的形式,我们最常用的就是讲座,因为这种形式不仅可以检验你自己是否已经真正学透了这方面的知识,同时也帮助你提高向别人讲述问题和说明问题的能力。现在看来,这个半年到一年的入门期是很关键的。

 

Q:请您给我们简单介绍一下您现在的研究方向,特别是大尺度图的数据挖掘具体是指怎样一个问题?

 

A:我现在从事的研究方向主要有两个,一个是通过机器学习解决信息检索中的排序问题。这是目前信息检索中非常热的一个分支。我们在这个领域取得的成果是比较领先的,在学术界已经产生了不小的影响。另一个就是大尺度图的数据挖掘。这里的图指的是由网络上的超链接关系(hyper-links)形成的大规模的有向图,粗略估计仅中国区就包含大约10至20亿个节点,全球共有几百亿个节点。分析这样大规模的数据是相当有挑战的,无论对计算资源还是对理论分析都有挑战。以前通过分析小规模的图得到了一些结论;这些结论在大尺度下还能否适用,是否会出现从量变到质变的过程,这些都还没有答案。我们准备构建一个我们称之为Graphor的系统,借助分布式计算平台来处理这样大尺度的图,期望从中得到有意义的结论。

 

我对实习生说:希望你比我更强

 

Q:我从您的实习生那里得到一些信息。他们说您对他们的指导非常认真细致。您对实习生项目怎么看?

 

A:我刚加入互联网搜索组的时候,我们组的负责人马维英博士就让我负责我们组的实习生工作,比如组织seminar, project review, BestRank Camp, 还有winedown等等,我做了大概2年这样的工作。其实,能为实习生提供帮助和指导是一件非常荣幸的事情。与此同时,我把指导自己的实习生进行高水平的学术研究看成是我的一项重要的,甚至可以说是一定时期内的主要工作。我是抱着非常真诚和严肃的态度看待每一位来到研究院实习的学生。其实,实习生的导师把他们送到研究院来,是希望他们能够在这里得到更大的进步;我可以肯定地说,研究院不会把实习生作为“劳动力”;我们真正希望的,是和国内的高校、研究所建立长期的合作关系。举个例子,我以前在清华时候的导师张旭东教授,以及中科院数学所的马志明院士把他们的博士生送过来进行长期的实习,我们共同取得了很多非常好的研究成果。

 

就我本人来说,我对我的实习生是很有感情的。早期我的几个实习生,例如现在还在实习的秦涛,和已经成为员工的高斌,都是和我一起从头开始做信息检索这个课题的。我觉得我们是一起成长、一起进步的。我本人是“土博士”,由于我们实验室的局限性,在我读博士的时候还没有接触到国际顶级的研究成果,甚至不太熟悉国外的同行都有谁做得非常出色。我很希望我的实习生们,既然来到研究院,既然有了这样好的一个平台,就能够做出更好的研究,能够比我更优秀。

 

Q:我知道您对实习生项目倾注了很多心血。您会事无巨细的指导您的学生,手把手的教他们解决问题。但是我也听到另一种说法,就是这样指导会让他们养成一种依赖性,离开您的帮助自己就做不了研究了。您怎么看?

 

A:这一点我需要解释一下。我的学生开始做研究,例如准备第一篇顶级会议论文的时候,我对他的指导的确是非常周到的。从选题,我会帮他选;到做实验,我们会一起讨论,我也会帮他解决具体问题;到最后写出论文,我会帮他改,甚至改很多遍。这些都是很细致的事务,但目的不在于代替学生做,而在于让学生熟悉和体会整个做研究的过程。聪明的学生在此过程中已经可以学到自己未来该怎么独立地从事学术研究。等到第二次、第三次,我不会再帮这么多忙,而主要是提供方向性的把握和关键技术问题的指导,会让他自己完成更多甚至全部的论文工作。我不会让我的学生不动脑子,仅仅靠我帮忙做研究。从实际情况来看,我的实习生们思维活跃,胆量也很大,brainstorming的时候总是积极发言,踊跃“拍砖”,甚至有些员工形容他们是“目中无人”。我觉得非常好,我鼓励他们目中无权威。

 

 

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有