加载中…
个人资料
世界博览
世界博览
  • 博客等级:
  • 博客积分:0
  • 博客访问:2,401,196
  • 关注人气:11,482
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

全球领先的Nuance公司发力中国语音应用市场

(2012-12-28 15:53:11)
标签:

语音技术

语音应用

nuance

财经

分类: 商业

本刊记者 赵国贺   

 

    2011年10月,苹果公司推出iPhone 4S,其最大的亮点便是Siri这一智能语音工具。近一年后,中文版Siri让国内的苹果用户开始热衷于对着手机说出指令。在“调戏”Siri的热潮逐渐褪去后,人们发现,Siri的更方便之处在于设定闹钟、记录备忘、查询天气、搜索地图,而并非只用来消遣。之后的Siri“涉黄”——理解“嫖娼”之义并搜索不良场所的新闻虽不光彩,却从侧面映衬出智能语音软件正越来越“强大”。

    “语音识别其实在2008年就发展到比较成熟的程度了,但因为之前的经验,很多公司担心最终效果,不敢做大规模推广。”郑裕庆是语音和语言解决方案提供商Nuance通讯公司大中华区的总经理,他向《世界博览》记者表示,自己十年前也用过语音产品,光录入本人的声音都要半个小时以上,现如今则是另一番面貌。“很多不同的厂家都希望把语音变为自家产品的功能之一。”

 

最早用于呼叫中心

    普通消费者可以触及的语音产品远非Siri一个,在竞争对手Android平台上,Google就推出了与强大搜索功能结合的语音助手Google Now;在智能手机的软件商店里,国产的讯飞语点、小i机器人等一批类似Siri产品竞相面世;不只在移动设备上,三星、长虹等家电厂商推出了多款智能语音电视,三洋推出了全语音系列的微波炉;在奔驰、福特等品牌的汽车上,语音助手也逐渐成为了一项标准配置。

    面对着硝烟四起的国内语音市场,Nuance公司正逐渐从幕后走向台前。并不为普通消费者所熟知的Nuance是全球领先的语音技术公司,在全球语音市场占据着2/3的份额。总部位于美国马萨诸塞州的Nuance成立于1992年,与之合作的企业清单上囊括了各个领域的知名跨国企业:埃森哲、通用、IBM、微软、三星、诺基亚、福特……超过2/3的财富100强企业使用了Nuance的语音解决方案,装载其语音技术的手机在全球有五亿部以上。这当中,苹果手机上的Siri最让人联想到Nuance的语音技术。

    Nuance在英国、德国、日本、巴西等主要国家和地区有35个区域办事处,产品遍及70多个国家。如今,它正将目光聚焦在中国市场,这里在其全球商业版图中地位愈发重要。郑裕庆从2008年开始任职,这个长驻北京的香港人在IT行业从业近20年,在业务拓展、运营管理、产品布局以及不同市场的推广方面拥有丰富的经验。“我的工作一直以来都是进入刚刚快速成长、市场前景广阔的公司。未来十几年间语音将是人与机器交互最快的输入方式,”郑裕庆在英国Essex大学计算机系人工智能专业获得硕士学位,他表示,“我看好这个市场中的机会,只是没有预料到一切发展得这么快。”

    早在2000年左右,Nuance公司就已经进入中国内地。当时的语音市场尚未成熟,但该公司通过合作伙伴将Nuance的语音技术引入中国,其中企业用户的呼叫中心是Nuance在中国的两大重头业务之一。郑裕庆解释说,例如订餐电话中心如果用按键输入,多层级的菜单不方便找到消费者需要的菜品。“通过自然语音理解技术提供导航系统,使菜单扁平化,消费者打入电话,用自然语表达,机器帮忙分析、处理需求,用户体验就能得到提升。”呼叫中心的语音技术应用如今已相当成熟。

    十年前语音技术尚未得到普及,当时国内市场对文字输入的需求相对较高,这也是Nuance进入中国的重要契机——除了语音识别,它还是全球领先的文字输入方案提供商,在触摸屏、十二键、九键等不同手机上,多数大厂家都在用Nuance的T9文字输入产品。

 

语音的普及源自汽车

    Nuance 的语音解决方案提供丰富和广泛的语音、语言、文本和图像产品组合,支持多达35种主要语言。“进入中国后,我们希望能用领先的语音技术去帮助国内OEM厂家(原始设备制造商)开拓国际市场。与我们合作的厂家都是比较国际化的,希望在中国和国际市场有所作为。他们能够利用语音技术使产品在全球市场具备差异化的竞争优势。”郑裕庆说。

    在中国地区,Nuance涉猎的两大业务对象分别是企业类和移动类用户,前者主要是呼叫中心,用于语音导航。对于后者,Nuance提供的是针对移动设备的语音解决方案,对象包括手机、电视、电脑、家电、汽车等厂商,例如三星、LG、松下等厂商的电视都采用了Nuance语音技术实现语音控制。

 

全球领先的Nuance公司发力中国语音应用市场

    然而真正将语音技术从呼叫中心带到普通消费者身边的是汽车。

    驾车者开车的同时按动中控台的按钮十分不便,接打电话或输入短信则会让基本安全都难以保证,如果能够实现在汽车上的语音输入,对车主带来的便捷不言而喻。比亚迪最近在广州车展发布的“思锐”车型便采用了Nuance的语音技术。Nuance与国内厂商一般合作的模式是:大型的OEM希望利用语音技术开发特色功能,Nuance提供技术,由厂家自己设计或开发应用。

    起初,语音技术被应用于奔驰一级的高级车型上,随着技术发展普及,这项便捷服务也得以延伸到更多品牌和级别的汽车上,使用者数量大幅增加。这个过程中不可忽视的一点是技术的进步。

在汽车上,停车、30公里、100公里、开窗、雨刷、人的谈话声、开音响等等是完全不同的声音环境。Nuance利用独有的算法,专门去除风噪声,其他脉冲形成的声音抑或扬声器播出的声音,也可以被语音系统屏蔽掉,从而只识别驾驶者发出的命令。

    “这项技术叫作回声消除(Echo Cancellation)。抗噪技术最大的难题是副驾驶和后排乘客的说话声,声音聚集到一起最难处理。我们还有Beanforming(定向)技术,分辨驾驶者位置上的声音来源。在降噪方面,我们有一系列的先进技术和针对不同噪声的处理办法。”

    郑裕庆表示,Nuance公司的技术优势在于对噪音的处理和远距离的语音识别,公司已经有十多年的经验积累。“车内噪音会直接影响终端用户的体验,所以很关键,但如何去除噪音同时保持高识别率是非常不易的。”

抗噪技术不止应用在汽车上,最常见还有语音智能电视。使用Nuance语音技术的电视,观众坐在沙发上就可以对着屏幕通过命令换台、调节音量以及搜索网络内容,同时电视声音照样放出、家人坐在沙发上尽兴聊天,这其中运用的也是回声消除和定向技术。

   “中国是全新的市场,很多公司还不知道如何测试语音效果,我们也慢慢地教给他们测试标准。一些国内的竞争对手价格便宜,甚至做完产品再收费,但厂商们逐渐发觉便宜并不是好事,用户体验无法保证。”郑裕庆说,国内厂家并不像国外的知名厂商,后者习惯先投入开发再看结果,而国内厂商因为人力、时间等成本限制,更乐于看到结果再去应用。因此,Nuance也开发了一些语音应用,然后由厂商进行定制,但变化幅度不会太大。“Nuance在中国的策略非常灵活,看合作者是想自己研发还是由我们去帮他们去开发,我们在国内也有自己的团队。”

 

在移动终端发力

    在语音技术发展的十余年间,Nuance最具革命意义、最为国外用户熟识的产品是在电脑上使用的Dragon Naturally Speaking软件,它能够通过语音指令对PC完成多项操作,如文字输入、打开浏览器、发送邮件等。这款软件早在1998年前就已推出,但由于当时的中国软件市场不太成熟,所以未能进入中国。

    而Nuance在中国真正发力也应该算是郑裕庆加入之后。“我来公司时,Nuance大中华区只有17个人,没有技术支持和开发团队,支持中文的产品也很有限。”经过数年发展,目前Nuance在国内已有两个研发中心:北京的研发中心专门负责文字输入产品,上海研发中心负责中文的语音解决方案。国内市场团队几年前仅有二三十人,现在已超过100人,研发团队也在不断扩大。

    在中文领域,Nuance采集了南至广州福建、北到黑龙江乃至西北等全国各地的语音数据,这使其产品在识别带口音的普通话时准确率也很高。中文语音数据的收集工作,1999年左右就已有专门的数据员走南访北。

    Nuance的语音方案目前可以支持粤语、普通话、台湾国语,其中的普通话覆盖各地口音。在口音的问题上,郑裕庆坚信“外来和尚更会念经”:“你可以测试国内语音厂家的引擎和我们的引擎,我们对口音的处理比他们好得多。”

    Siri的问世,对国内智能语音市场起推波助澜N,很多厂家加入到语音产品的开发队伍中,不同行业的大量厂商也对语音技术有所需求。Nuance在中国的业务增长每年都能达到50%以上,盈利主要来自企业用户。郑裕庆透露说,通过与手机、PND(导航系统)、汽车等各大厂商合作,Nuance如今在个人消费市场上的业务比重相对呼叫中心更高。

    2009年12月,该公司在北美推出著名的Dragon Dictation(声龙听写)和Dragon Search(声龙搜索)应用,前者能够将用户的语音转化为文本信息、邮件或Twitter发送,后者利用语音实现搜索并同时呈现多家网站的结果,在中国可以显示雅虎、新浪爱问、优酷、淘宝和大众点评的搜索结果。二者都在苹果的App store获得了良好口碑和超过百万的下载,Dragon Dictation还被《时代》评为2010年十大iPhone应用软件。

    郑裕庆并未在采访中回答任何关于苹果Siri的问题,但值得注意的一点是,Dragon Dictation和 Dragon Search 比起Siri的面世时间要早近两年,可以推断这两款广受欢迎的语音应用对后来Siri的推出有怎样的引导意义。

    “Nuance的软件在Android Play Store和 App Store分别都有免费应用下载,我们想让用户免费体验产品,同时进行数据收集,提高语音引擎的准确度,这样产品才能更加成熟,”郑裕庆说,“如果我们不前期先投入,相信到今天没有一个厂家会愿意采用我们的产品,放在他们手机或汽车上面。”这些客户囊括摩托罗拉、诺基亚、HTC、三星等品牌的世界八大手机制造商以及全球十大汽车制造商。

    而面对数量越来越多的国内合作者,Nuance公司今年已将服务器搬到中国。在学习人工智能出身的郑裕庆看来,未来的语音输入、手势控制和面部识别将会整合为一个整体解决方案,但在输入方面,语音输入仍是最快捷的方式,“实现语音输入,一定要有最好的语义理解引擎才行。”

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有