加载中…
个人资料
微软亚洲研究院
微软亚洲研究院 新浪机构认证
  • 博客等级:
  • 博客积分:0
  • 博客访问:5,504,312
  • 关注人气:10,912
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

一只松鼠的圆梦之旅

(2009-08-19 22:27:37)
标签:

微软亚洲研究院

学术交流

研究心得

科学松鼠会

自然语言处理

分类: 人才

作者:孙天齐 南京航空航天大学

 

七年前,我在杂志上与微软亚洲研究院相遇。我想象着那个令比尔·盖茨赞赏的梦工场,决定有一天要走进那里。对刚上初中的我,那是一个遥远的愿望。但佛经说,七步生莲。于是七年之后,我走出地铁站,远望希格玛大厦上那行“Microsoft”。它已不再是杂志上的插图,它七年来就在那里默默地等着我。我告诉七年前的自己:嘿,你的愿望实现了!

一只松鼠的圆梦之旅

 

8月3日,骄阳似火。我就在最火的时间,来到全球最火的计算机实验室,像盗火的普罗米修斯,希望窃得些许火种,为学习与科研助燃。MSRA拥有许多自然语言计算的研究成果,而这些研究大多基于统计学习方法。我是一个比较坚定的神经主义者,不支持统计方法。就这样带着不同的观点,我在MSRA先后得到了宋謌平老师,林钦佑老师和张峥老师的指导。三位老师热情的帮助让我感到科学的兼收并蓄。与张老师、林老师的谈话,恰好对应一句名言的上下两句:海纳百川,有容乃大;壁立千仞,无欲则刚。而宋老师则用一个实际例子,向我展示了统计方法的力量。

 

观点分歧在理论研究中并不少见,重要的是我们面对分歧的态度。谨以此文送给如我一样的初学者们,共享我在微软亚洲研究院得到的启示。

海纳百川 有容乃大

 

用这句话概括张峥老师最合适不过。一进他的办公室,张老师首先询问我现在的研究方向。耐心听完我对自然语言神经关系模型的介绍后,他又提出一些更具体的问题。虽然张老师并非研究自然语言处理,但他一定听出来,我对联结主义人工智能强烈而单一的推崇。他说,对于神经方法,当然可以学习,但不需要因为支持它而排斥其它模型。每一种模型都有其值得借鉴的价值。随后我们又谈到Marvin Minsky,他的研究本身就海纳百川:作为神经网络之父,联结主义的领袖,Minsky在学术生涯后期提出智能不是单一机制的产物,而是不同策略共同作用的结果。他认为这种多样性是必要的。这些道理虽简单,但是我没有做到。由于所学甚少基础不牢,我的观点之片面,我对神经模型之狂热,恐怕Sydney Lamb本人都要一笑了之了。林钦佑老师在邮件中对我说,极端可以使你深入,但胸怀宽广一些,可以使你的观点完善而包容。是的,这才是科学工作者应有的胸怀。有自己的信仰,同时对各种观点不偏不倚、领会接受。如此,才会有新的突破。

 

海纳百川,有容乃大,是之谓也。

 

壁立千仞  无欲则刚

 

无欲则刚是为官之道,放在科研中,似乎有所不当。但在与林钦佑老师的谈话中,我却感受到一个科学家“无欲”的至高境界。林老师说,对于金融趋势,有人说涨,有人说跌,最后说对的人就成功了。对于你来说,你希望自己成功,但对于金融趋势来说,你成功还是他成功,并无大碍。我恍然大悟:统计和神经是两种不同的模型,支持其中哪一个,对我来说是个问题,但对于整个科学而言,这并不成其问题。大家各自探索,孰胜孰败,对于科学而言都是进步。至于成功属于谁,人事浮沉,实则很随机。我钦佩林老师的视角。持有这种想法需要参悟人生,需要宽广的胸襟。作为一个科学家,谁不希望自己是那个成功者。而林老师站在整个科学的立场上去定义“成功”,此境界,已然一览众山。不关乎学派之分,条条路兼容并包,研究者只需上下求索,只有虚荣和欲望才成之负担。在学校里,我的老师刘绍翰也常借佛经之语教导我不要“妄执”,勿被一花一草挡住世界大千。站在这样的高度上俯视我对待不同模型的态度,看似强硬,实则软弱无比。

 

痴迷从来只为己所累。壁立千仞,因无欲而刚。

 

打开视野的第一课

 

在有容与无欲的启示后,我更经历了一次激烈的反省。对神经模型的迷信,不但没有使我的研究加速,反阻碍了其前行的道路。在MSRA这个多元开放的环境中,我终于认识到自己一叶障目的狭隘。在宋謌平老师的办公室里,他用他的研究成果为我上了打开视野的第一课。这个我所见过的最优秀的TTS(文语合成),让我亲身认识到自己不屑的“脱离自然机制的东西”,实则有多么强大的力量。那是一个外形很像“M&M巧克力”的小人头,能流利读出文本,而且能读得抑扬顿挫,读得平仄阴阳。它能口吐不同方言,能配合嘴唇的动作,给它一个midi乐谱,它甚至能一展歌喉,表现出美声唱法的颤音。如果这项技术能与文本问答技术相结合,通过动画和语音进行输入和输出,就能达到Loebner提出的图灵测试最高标准了。宋老师接着说,如果能把神经模型的成果结合到统计学习模型中,那就可以减少对训练数据的需求,还可进一步提高学习性能。那时我突然意识到,MSRA的每一位老师都在向我传达着同一个理念:兼收并蓄。

 

MSRA一天,收获沉甸甸的。但之于这个全球智商密度最高的地方,我仅窥其一斑。走出大楼,我回眸,它依然默默站在那里。但不再遥不可及。我想将来有一天,我还能再次来到这里,而那时的自己已不再行囊空空,而是满载着知识与力量。

 

作者介绍:

孙天齐,南京航空航天大学本科一年级学生,科学松鼠会科普作者,研究机器学习与自然语言处理。

 

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有