加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

微软首席研究官里克•雷斯特在2013微软技术节上的主题演讲

(2013-03-27 14:12:55)
标签:

it

微软技术节

里克&bull

雷斯特

分类: 技术

微软首席研究官里克•雷斯特在2013微软技术节上的主题演讲

 

编者按:在近期举行了2013微软技术节公众开放日(TechFest 2013 Public Day)上,微软首席研究官里克•雷斯特博士为到场的观众奉上一场精彩的主题演讲。在演讲中,他首先回顾了举办微软技术节的初衷以及多年来坚持不变的使命,随后简单介绍了微软研究院在过去21年收获的丰硕成果并回答了微软为何投资基础研究的疑问。演讲最后,里克•雷斯特博士揭开了本次微软技术节的聚焦的两大主题:大数据和自然界面,并向现场观众展示了微软“语音机器翻译实时演示”实现惊人突破的视频。

 

 

 

 

大家好!希望诸位能在这里度过非常有趣的一天。至少对我来说,这里很有趣。我总觉得微软研究院主办技术节已经有很长一段时间,但它实际上是从2001年才开始的。因此,这是我在微软研究院第13次参加“微软技术节”活动。

 

忆往昔,微软技术节初登台

当然,第1届技术节是不能与今天的规模相提并论的,因为当时只对员工开放。活动的场地面积也没有这么大。而且,我们甚至不知道会有多少人出席那次活动。实际上对于为员工举办技​​术展示的整个想法,我曾经是最强烈的怀疑者之一,因为我不能确定有多少人会来参加。我一直说:“天哪,举办一次微软技术节的工作量太大了,我不知道它是否真的有价值,值得去做,但如果你们坚持要做的话,那好吧。”

 

那年的活动为期2天,我想大概有4000名来自普吉特海湾办公室的员工参加了活动。当然,微软在当时还是一家比现在小得多的公司,所以这个出席人数已经在我们的普吉特海湾员工队伍中占了很大的比例。-事实证明,前往参加活动的研究人员都感到很兴奋,因为他们能够与那么多同事进行交流和互动,在某种程度上把自己的想法“推销”给他们,并炫耀一下自己的工作成就。观看展览和演示的员工也给出了积极的反馈:“活动非常鼓舞人心!”他们甚至没有意识到,微软做了那么多事情,研究工作覆盖了那么多不同的领域。

 

所以,从那一刻开始,技术节真正地诞生了,而且从那时起就一直快速发展!几年前,我们增加了公众开放日(Public Day),允许外界人士观看一部分演示,并与我们的一些研究人员见面。今天,我也欢迎大家来到这里!

 

记廿载,微软研究院使命始终如一

1991年加入微软来筹建微软研究院,并从那时起就一直管理微软的研究工作。在这么长期间里,微软研究院只有一项使命。这项使命包含了三个部分,而其中的顺序很重要。我们的使命中最重要的部分是:作为一家基础研究机构,微软研究院的目标是推进所涉及的各个领域的研究工作,并始终走在前沿。它如此重要的根本原因在于,如果我们不能推进研究,如果我们不走在所属领域的前列,那么我认为对于微软这样的公司而言,我们根本就没有存在的价值。我们需要不断挑战极限,聘请有能力的人,既能够创造新技术又能够探索这些技术所带来的可能性。

微软首席研究官里克•雷斯特在2013微软技术节上的主题演讲

目前,我们在这个方面做得很不错,所以才能谈到第二个部分。记住,第一部分并不包含任何有关微软的内容。它只是说,如果我们要从事某一特定领域的研究,我们就应该是最好的;我们要聘请这一领域的最优秀人才,由他们去推动该领域的前沿。

 

一旦我们获得了有意义的奇妙想法,那么第二部分就开始起作用了——也就是说,我们希望这些想法发挥效益。我当初进入计算机科学领域,就是因为我有一个令自己异常激动的想法:我的智慧和头脑将能够让原本没有生命的硬件“活”起来,我可以为别人创造一些东西,让他们生活得更好,或者以某种方式帮助他们。这也是我们的研究人员希望做到的。他们希望影响世界,而做到这一点最好的方式是通过微软的产品,真正让我们的技术转化为产品,并把它们交到数亿甚至数十亿用户的手中。

 

接下来,前面所有的努力都将转化成为第三个部分,也就是说我们最终的目标不仅是为了确保微软及其产品有所发展,还要真正地从根本上确保计算机科学领域乃至整个技术领域充满希望。作为一个研究领域,我们需要不断向前移动标杆。我们需要把工作不断向前推进。如果我们希望能够继续提供附加价值,并且在未来社会中继续发挥重要作用,我们就要不断地改善自己的工作,并确保它们前景光明。

 

说到这里,大家想必已经明白了在过去21年半期间这里到底发生了什么事情。我们已经在全球各地建立了几座研究院,并聘请了一些全世界最棒的研究人员。大家所看到的只是我们获得的一些奖项,以及我们拥有的是一群什么样的人。

 

展风采,微软研究院收获丰硕成果

为了让大家了解微软研究院今天所处的地位,我可以说,我们已经成为计算机科学领域内首屈一指的基础研究机构。我们在计算机科学领域发表的研究成果数量超过了其他任何组织。我们大约有850名博士研究人员,也就是说,微软研究院内的博士人数超过了许多大学的博士人数;例如,我们的博士人数就超过了布朗大学。再比如说,我们的美国国家工程院(National Academy of Engineering, 简称NAE)院士数量超过了整个华盛顿大学的院士数量。这些数字能够让大家大致了解我们的运作规模,以及我们在推进整个​​计算机科学领域的前沿上所发挥的重要作用。

 

大家也可以看到我们的组织在世界各地的拓展情况。人们有时会问我:“你们为什么会把这些实验室设在不同的地方?”答案就是:我们要尽一切可能确保拥有最优秀的人才。如果我们把所有的研究实验室设在同一个国家——例如美国,我们的运作规模可能只会有今天的一半左右。然而事实上,微软研究院大约有一半的实验室设在美国,而另一半则在美国以外的国家和地区。这个世界每年能够培养的杰出研究人员数量是有限的,所以我们需要确保能够在世界各地捕捉到这些杰出的人士,并提供他们所希望的生活和工作的环境,由他们去创造自己希望创造的东西。

 

大家可能已经注意到,目前我们还没有涉足赤道以南地区。但我们今年早些时候——实际上去年年底就已经宣布,将于今年晚些时候在巴西里约热内卢设立创新中心。这将是我们在南半球设立的第一个实验室。我与曾参与创建工作的Rico Malvar开玩笑说我们可以把它称为微软南半球研究院,但这个名字听起来有点太过“夸张”了。我们设立了微软亚洲研究院,可它在某种程度上并不涵盖印度。所以,我想我们过去在命名的过程中就有过不一致的地方。

 

但这里的关键点是,我们已经发展成为世界基础研究领域内的重要参与者,而且在世界上每一个我们开展业务的地区,都与当地的学术团体紧密合作。我们与大学以及其他公司下设的研究实验室都开展了紧密的合作,特别是与那里的学生。微软研究院开展着技​​术领域内规模最庞大的博士生实习项目。每一年都会有1000多名博士实习生在微软研究院的某些部门里参与研究工作。为了便于比较,我们可以说,研究生在微软研究院的累计工作时间超过了世界上任何其他学术机构。

 

答疑惑,微软公司缘何投资基础研究

现在,你可能要问这样的问题:我们为什么要这样做?微软早在1990年就做出了一个重要决定,并由此引发了1991年微软研究院的创建。我们做了一项投资于长期基础研究的决定。当时的微软还是一家规模很小的公司,销售收入刚刚达到大约10亿美元,而现在我们的销售额已经接近80亿美元。因此,大家可以想见我们当时的规模有多小,即便如此,公司仍然做出决定,进行长期投资,并投资于基础研究。

 

我们为什么要这样做呢?人们开展基础研究的原因有很多。我列出了其中一部分,它们都在某些方面与我们的情况相符。它们都有意义,而且也都是从事基础研究的组织所能创造的价值。有时你可能会说,“嘿,我们是知识产权、新产品所需的技术的来源。”我们在这方面已经做了非常多的工作,你会在后面的演示中看到其中一些。

微软首席研究官里克•雷斯特在2013微软技术节上的主题演讲

 

1.获得知识产权和新产品所需的技术

我们贡献了微软公司大约四分之一的专利——它们都来自微软研究院。而且从一定意义上讲,它们是最有价值的——是真正的科学专利,能够撬动杠杆的专利。

 

多年来,IEEE一直在考察微软的众多专利,并认为它是技术领域的顶级科学资产组合之一,而这些专利的背后便是我们所做的工作。所以,这是真正的价值所在。但是,从另外一种意义上说,这又不是开设基础研究实验室的原因所在。最好的表达方式是:实验室的意义更在于它的衍生价值。如果你有一座了不起的研究实验室,你自然会收获其中的价值。

 

2.解决问题:

我们有一群绝顶聪明的人才,他们非常了解自己所从事的领域,而且他们喜欢解决问题。这就是他们的专业所长:你给我提出一个问题,而我恰恰喜欢解决这个问题,我偏偏喜欢对付困难的问题。我们的很多研究人员就是这样。因此,我们的产品组真的给我们提出了问题,这也是基础研究机构能够拿的上台面的重要价值之一。我们确实帮助解决了一些真正棘手的问题。但是,再次说明,我只把它看成一个结果,而并不一定是原因。

 

3.拥有早期预警系统

最后是早期预警系统:很多人在谈论研究时总离不开这个话题。他们经常说:“你们是早期预警系统。你可以告诉人们未来会是什么样,因为你们所研究的问题总会有好几年的提前量。”当然,这也是真的。但是再说一次,我会把它看成“我们拥有一座伟大的研究实验室”这一事实的结果,而不是要这样去做的理由。我并不认为这是一种价值——上述事物是个整体,其中任何一个部分都不值得我们说:“嘿,这就是我们为长期研究而投入资金的原因。”

 

我们做这件事的真正原因(每当我谈论研究工作时,我总是会这样说,而且它不只是适用于微软研究院,对于任何研究都是如此——无论是美国政府或是欧盟在基础研究方面进行的投资。我想,他们有着同样的理由:对基础研究的投资从根本上是关乎生存的),关键在于确保在一项新技术或一家新竞争对手出现时或商业环境发生改变时,你总会有一个好主意和知识产权的宝库,而且有人能够帮助你做出改变,帮助你逆转局势,可以帮助你重新投入战斗,以一种新的方式向前行进,或解决一个重要的问题。

 

Vannevar Bush帮助创建了美国国家科学基金会(National Science Foundation, 简称NSF)。如果你读过他的著作,你就会明白为他什么主张美国应该投资于基础研究——他提出了相同的理念。美国那时刚刚从一场可怕的战争中走出来,技术是赢得那场战争的重要原因之一。他提出,我们需要投资并构建这样的创意和人才宝库。这样,如果再来一场新的战争、一次饥荒或一场瘟疫,我们都将作为一个社会而生存下来。所以我认为这是真正的关键点所在,也是这些投资的重要性所在。

 

很多情况下微软研究院决定去做某些事情的时候,它们尚未凸显出非常明确的价值。我可以给大家讲一个很简单却很久远的故事,这是微软研究院早期历史上最重要的故事之一。早在1992年,也就是微软研究院创建一年之后,当时只有二十几名员工,我们中的一名研究员与另外几个同事合作开发了一种技术,它能够大大减少了32位程序的工具尺寸。如果你不是编程语言或操作系统专业人士,可能不会了解它的真正意义所在:我们终于找到了一种减少程序代码占用空间的方式,把程序调入内存中执行的数据量减少到原来的二分之一,而现在大部分工作都是数学计算了。我的意思是说,它们就像黑板上的大量符号。但是这项技术真的很酷,我们非常兴奋——因为这是一项真正的突破。

 

接着,我们去找产品组的同事——我记得自己参加了很多诸如此类的会议——而且是了不起的会议。我们解释自己在做什么,展示它如何影响程序的执行以及我们如何节省大量的存储空间。在当时,内存空间是非常宝贵的。这些都是很了不起的会议,双方充分交流。我们约见了许多个产品组,而每次会议结束时,产品组的人都会对我们说,“你们真的很聪明——看看黑板上的这些符号,你们就是很聪明。但是我们并没有遇到这个方面的问题——因为在1992年,我们只有16位代码,还没开发出32位的代码。我们会开发出32位代码,这在我们的计划之中,我们确定它会出现。不过,那时候内存也会变得大很多,因为有那么多曲线显示,内存价格每年都会下降到原来的二分之一,而内存的大小也在增加。所以,我们确实不会面临这个问题。不过你们确实很聪明,回去接着好好工作吧。我相信有一天,你们会拿出一些我们真正需要的东西。”我不知道这一天什么时候会到来。

 

说这番话的人已经算是客气的了。当时我们约见了一个产品组,他们确实有32位代码——那就是Windows NT组。我们谈得非常愉快,他们也是很聪明的家伙。会议结束时,这个组的负责人来找我,他是一个身材魁梧的家伙,他看着我的眼睛,说:“除非我死了,否则你们甭想对我们的代码动手脚。”18个月后,他给了送来了一个非常好看的便签,上面写着:“我真的要感谢你们的辛勤工作。如果没你们,我们的产品就不能上市。”这也直接带动微软发生了一个重要的变化。1995年,我们跃迁到了32位Windows和32位Office,并推出了Windows 95和Office 95。在此期间,也就是1992年到1995年左右,如果大家观察过RAM的价格,就会发现它们实际上并没有什么变化。中间或许有些小幅度的起落,但大部分时间是持平的。所以公司在1995年推出32位产品时,所面临的情况是市场上绝大部分计算机的内存大小只有大约4-8兆字节。为了便于对比理解,我可以告诉大家,今天大多数儿童玩具的内存都要大得多。

 

但是,当时办公用计算机看起来就是那个样子。不幸的是Windows 3.1,也就是我们的16位产品,只能用这样的内存量来运行。对于我们的32位产品来说,这是不够的。因为我们从1992年起就一直在努力研究刚才所说的那项技术,所以我们的产品组能够拿来就用。这项技术成为架构标准的组成部分之一,我们也能如期推出Windows 95和Office 95,而且它们才能在那种内存量的机器上正常运行。

 

这种重要性的原因是多方面的。它很重要,并不仅仅是因为能让我们挣到钱。更重要的是,当时微软虽然只是一家小型公司,但已经看到了行业发展历史中的关键点。我们的代码从16位转向32位。这是一个很大的变化,而我们的竞争对手却没有掌握这项技术。例如,WordPerfect和Lotus确实没有此类技术,而这一点带来了市场上的巨大差异。

 

如果你跟Ray Ozzie沟通过——当然,他当时在Lotus效力——他会告诉你,当时他们就已经知道我们掌握了这项技术,而且知道这项技术将会是他们的掘墓人。但他们所不知道的是我们如何开发这项技术的。这仅仅是一个很小的例子——一种仅凭几个人的头脑想出来的算法,而这恰恰又是我们公司乃至我们所处的整个行业的转折点,这也是基础研究机构所能做到的。从一定程度上讲,这些就是我们获得回报的时刻。我们总是能够获得这样回报,因为新技术不断涌现——比如我前面列举的一些范例,它们都是我们所获得的日常回报。这样的重大转变是非常关键的。

 

看今朝,自然界面与大数据将现万丈光芒

在介绍了我们的使命之后,现在谈谈行业的前沿。我曾经指出在计算机科学领域,我们所发表的基础研究成果超过了其他任何组织。对我们而言,技术转移部分也是非常重要的。大家看到的这个列表只是自去年秋季以来进入到微软产品的微软研究院技术成果。我进入研究领域大概已经35年了,当我回头去看自己曾经去过的所有研究实验室,去看技术领域的其他研究实验室,我从来没有见过其他任何一个机构能够像我们一样,既能够在前无古人的程度上推进技术研究的前沿,尤其是以如此宏大的规模进行。与此同时,又能保持着这样一种的亲密关系,让我们的理念非常迅速地融入到微软的产品中,并产生巨大的影响。再次重申,我们的影响随处可见。有时候,这些东西作为单项技术进入了我们的产品。但在某些情况下,我们直接推出了完整的产品。例如Kinect就是一个全新产品的范例,它是基于微软研究院的技术,我们与IEB团队合作创造的。

微软首席研究官里克•雷斯特在2013微软技术节上的主题演讲

1.大数据

当然,在今年的微软技术节上,大家将要看到的主题之一,就是大数据(Big Data)这个概念。当今世界上,我们不仅可以真正地存储和访问数据,而且还能够在全球范围内收集数据。大家也可以看到,我们甚至可以表达和展示全球规模的数据。我认为,这是我们与这个世界的互动方式的一项重要变化。

 

同时,我认为这个概念的另一部分是我们不仅可以获得所有这些数据,而且还能够从中获得启发。我们可以基于数据,按照既定原理进行分析。在过去,人们曾经谈论过专家系统,但是,直到不久以前,所谓的专家系统还只是能够捕捉人类智慧和人类数据的系统——当然,这已经难能可贵。我的意思是说,人类能够将一套规则或一组有关事物的看法转化成代码,但它不一定是原则性的,而且往往非常脆弱。现在我们可以收集大量的真实数据,并对此加以利用。

 

2.自然界面

与此同时,今年技术节上的另一大主题就是自然界面(Natural Interface)这个概念。一方面,我们一直在建立全球规模的数据中心,并且向其中注入令人难以置信的大量信息和处理能力;另一方面,我们也一直试图让我们随身携带或围绕在我们身边的计算机获得像我们人类一样的感知能力——计算机也会像我们一样能够听到和看到,知道自己在哪里,感受甚至理解运动和形状。我们实现这些目标的过程中,开辟出来一些令人难以置信的新机会,并且已经把它们与机器学习相联系。

 

让我们看看Kinect和类似的设备,它刚一面世,就在实时3D计算机视觉领域掀起了一次革命,而这一点则是建立在机器学习的基础之上。它是如此具有革命性,以至于在大学环境中催生了一波全新的研究浪潮,而且在那一天以前,还没有人真正地获得这样的工具——人们从来没有在这个价位和这种规模上获得过如此根本的技术。而且与此同时,我们也展示了如何通过机器学习技术,让实时三维计算机视觉变得非常可靠,可靠到足以放在家中,与孩子、宠物、祖父母们以及任何人一起,即便这样,它仍然能工作,并且为人们提供大量的价值、娱乐和满足。

 

为了让大家直观地了解世界的变迁,我给你们举一个非常简单、有趣而又极其令人信服的例子。走进99号楼的微软研究院——它位于520园区的另一侧,也是我们的主要研究设施所在——如果你朝着电梯走,当你到达电梯时,门就会自动为你敞开。为什么会是这样呢?我们安装了一套实时计算机视觉系统,它经过训练,能够观察电梯周围的人的动作。经过一段时间的培训,它学会了如何分辨想乘坐电梯的人与单纯站在电梯周围的人。所以当你走向电梯时,它就知道你打算乘坐。这时它已经呼叫了电梯,而当你到达电梯门的时候,电梯已经就位了。

 

这套系统是如此强大,以至于几个星期前当它出了故障停止运行时,人们仍然习惯地站在电梯前等候开门。他们已经忘了需要按下按钮才能呼叫电梯了。让我们的计算机学会感知,它们就可以预测我们的真实需要;而通过先进的机器学习,我们就可以很好地理解别人的意图,好到以至于人们开始依赖于它。我想,这个例子能够让大家有所体会。

 

有关这些自然界面的另一个问题是,我们的办公室和会议室都配备了越来越多的触摸屏,我们可以借助它们进行互动和沟通,它们改变了微软员工们开会的习惯。当然在研究环境中,我们也有了许多这样的设备。同时,它们也带来了全新的可能性:我们如何能够借助自然界面技术,改变与这些显示器互动的方式,以便能够更好地做演示,并享有更好的会议和环境体验。通过无处不在的显示,我们能够建立更自然的互动形式,不仅能够帮助我们讲故事,而且还能够挖掘并分析数据。

 

举例子,语音机器翻译实时演示实现惊人突破

现在,我要给大家讲最后一个小故事。你们中间有些人可能已经看过下面内容的一部分,因为它从去年11月起就在互联网上被多次播放了。我去年10月曾访问中国,实际上在过去两年间我一直在与我们的语音识别和机器翻译团队合作,而我心中只有一个目标:我希望能够在中国发表演讲时能够一边说一边把讲话内容翻译成中文。

 

这项工作确实花了一些时间,尤其是它需要引入一项新技术,我们称之为“深度学习”,或者“深度神经网络(Deep Neural Network, 简称DNN)”。你们中间熟悉语音识别的人可能知道,很长一段时间以来,对在普通环境中任意语音的讲话的识别准确率总是很低,错误率徘徊在22%至25%之间,也就是说每4个词中就有1个是错误的。

 

10多年来,准确率都没有得到太大的提升。但大约两年前——确切地说是18个月以前​​,我们的一些研究人员与多伦多大学的研究人员合作,找到了一种执行机器学习任务的新思考方式,而且可以运用于一项非常困难的任务——语音识别。这就是所谓的“深度学习”,或称之为“深度神经网络”。我们是第一家在这一新领域发表重大研究成果的机构,与先前的技术相比,我们的研究成果使语音识别的准确率提升了30%

 

在一个很长时间以来没有进展的领域突然出现30%的改善,如果标注在曲线图上,其走势一定是直线上升。对于一个系统而言,这样的改善已经带来了质的飞跃,我自己经过验证后也确信可以登上舞台公开尝试了——我可以说帮我准备登台的团队比我自己更加紧张。我演示了这项技术,而且当时感觉非常有自信。他们当然会很紧张,因为他们能否保住饭碗就靠它了。

 

我记得在活动前一天晚上进行彩排,地点就在中国天津的会议中心。这是我们第一次架设这套系统并进行声学调试。有一个在那里帮忙的员工可能是过于紧张,他问我:“如果演砸了,我是不是要卷铺盖走人了?”我回答道:“你不用走人,但你的老板会被炒鱿鱼的!”回想起来,还是觉得很有意思。

 

所以,我今天要在台上给大家播放一段视频剪辑,关键是要大家记住,我们在使用微软研究院研发的深度神经网络技术对我的发言进行底层识别,把讲话转换成英文文本。然后,我们使用同样来自微软研究院的必应翻译技术,将文字翻译成中文文本。最后,我们使用了微软亚洲研究院开发的另一项技术,它使得我能够用自己的音色说中文——也就是读取中文文本,并将其渲染成我的声音朗读出来。下面让我们观看视频。

 

 

刚才大家有机会看到了这段视频。当然,我那时一直在盯着灯光,确实有些看不清观众的反应。我低下头就能够看到显示器,这样我就可以知道系统的工作情况如何。有一刻,我侧脸去看躲在幕布后面的人,以便确认演示是否一切正常。

 

观众中有些是微软的研究人员,但是更有趣的是中国学生的反应——现场有大约3000名中国学生,他们似乎都对这一项技术非常感兴趣。我们的一名研究人员说,离他不远的一名年轻女学生居然激动地哭了,这是他们从来没有见过的东西,而且有可能将改变他们的生活。所以,我们所从事的是一份非常令人兴奋的工作。

 

为了让大家对错误率有个相对的概念,顺便说一下,这套设备确实完成了我整个演讲的识别,而我们的错误率大约只有7%,这已经非常难得。我的意思是说,如果让真人执行同样的任务,通常也会有2%-4%的错误率。所以,在某些任务上,我们已经非常接近人类的识别率,这一点也是非常令人兴奋的。

 

________________________________________________________________________________ 

相关阅读

自然人机交互和大数据——“计算机研究领域盛宴”2013微软技术节开幕啦!

 

欢迎关注

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有