科大讯飞刘庆峰发布智能语音门户——“灵犀”

标签:
杂谈 |
注:科大讯飞动作不断:1、英语口语测试通过广东省验证,为实现正式应用扫除了障碍;广东乃发达省份,影响力巨大,在该省的成功意味着一个广阔的前景;
科大讯飞刘庆峰发布智能语音门户——“灵犀”
http://dev.10086.cn/cmdn/supesite/attachments/information_attachments/20121205111259_31226.jpg
科大讯飞董事长刘庆峰
http://dev.10086.cn/cmdn/supesite/attachments/information_attachments/20121205111253_50524.jpg
科大讯飞董事长刘庆峰
http://dev.10086.cn/cmdn/supesite/attachments/information_attachments/20121205111226_83680.jpg
科大讯飞董事长刘庆峰真机演示
2012年12月5日,2012年中国移动全球开发者大会(CGDC2012)在广州国际会议中心盛大开幕!中国移动数据部副总经理刘昕为大会主持三大产品发布:NFC产品、智能语音门户和MM云2.0。由中国移动数据部副总经理沈红群女士为大家首先发布NFC产品,由科大讯飞董事长刘庆峰为大家发布智能语音产品“灵犀”,由中国移动广东公司副总经理丘文辉发布MM云2.0.而刘昕更以“身有彩云双飞翼,心有灵犀一点通”来形容今天发布的几大产品。
主持人刘昕:下面有请科大讯飞董事长刘庆峰先生做更多介绍,掌声有请刘总上场!
刘庆峰:谢谢灵犀,谢谢大家。尊敬的各位领导、各位开发伙伴和媒体朋友大家上午好!非常高兴参加中国移动全球开发者大会,作为中国移动和科大讯飞的合作代表,发布战略合作的联合品牌产品——灵犀。
科大讯飞发布首款语音门户——“灵犀”
从互联网时代开始,用户使用的入口成为产业关注的前沿,从新闻门户网站,到浏览器到搜索,得人口者得天下。在移动互联网时代,这种争夺显得更为激烈,由于移动终端的便携式和用户个性化的操作使用,在移动互联网时代,人们对操作使用的个性化,方便快捷的智能化和人性化提出了越来越多的要求。
语音是人类沟通和获取信息最自然的便捷手段和方式,2010年10月份,科大讯飞发布了第一款语音平台,到今天用户已经突破1个亿,去年发布了苹果语音助理Siri.在这样的大背景下,中国移动和科大讯飞推出了智能语音门户产品。
灵犀的功能,一是手机语音操控,通过语音实现打电话、发电信,设置日程,启动手机的各项操作;二是互联网内容的入口,可实现对音乐、航班、天气、股票、餐饮、住宿等相关非常丰富的移动互联网各种业务、服务和使用操控;三是问答式的特色服务,包括可以问流量、话费,包括趣味诗歌问答等等。
灵犀在有趣的语音助理迈向实用性的步伐。
下面我为大家演示一下,大家看我手上拿的是普通的智能手机,只要装上灵犀软件就可以操作,使用。
(刘庆峰在现场使用真机操作包括名字、打电话给中国移动、叫肯德基外卖、天气、航班、查流量和话费、听歌并即时设置彩铃,同时还可以与MM云平台对接进行汉英和英汉翻译,真机演示操作精准、速度响应快等赢得了现场的阵阵掌声!)
大家可以看到,完全是灵犀后台的服务,对老百姓日常关心的叫外卖、到机场都可以实现,欢迎大家会后去体验。
“灵犀”的核心业务
要把灵犀这样的语音门户做好,首先是语音核心技术,我们蝉联了七连贯,这张表格是我们的比赛表格,大家可以看一下我们在现场的语音合成效果。
除了高自然度的语音合成,为了满足移动互联网的应用,下一步还会给用户提供科大讯飞最具个性化的语音合成。有了个性化的合成,以后可以让灵犀用大家最喜欢的声音和你交流对话,提供服务。
科大讯飞除了提供业界最好的普通话识别,在识别领域,由于3G和云计算,通用识别已经不是很难的事。最难的是怎么满足各种方言、语种和口音的适用。现在我们的粤语识别已经在输入法中提供了,下个月就可以实现了。维语、藏语接下来也将提供,接下来还将提供更多方言的覆盖,及法语、西班牙语等等外国语言。
语音识别还有一个最大的挑战,虽然后台我们有着非常高的语音识别准确率,但是受网络环境的限制会经常出现不稳定,当4000人在会场时,当信号很弱时,很多操控就没办法完成。在灵犀中,必须要联网,而对基本操控,我们提供了业界最领先的嵌入式中文语音听写。小的预算和存储和后端云计算是完全不同的概念,是非常困难的,我首先把Wifi关道,现在再用灵犀,打电话、发短信通通可以用本地完成。
打电话给江涛。
灵犀:马上为您呼叫。
发短信给江涛,明天下午4点钟在三楼会议室开会。可以看到短信已经生成了。
通过最好的嵌入式语音技术,会使灵犀以后在各种网络环境及在流量节省方面做出更大的特色。目前业界超过85%以上对于常见语音文本,只有科大讯飞一家。除了刚才看到的语音合成和识别,灵犀中还包含了很多语言理解方面的技术,包括语义抽取、机器翻译、知识问答等等,可以保持灵犀在核心技术的领先。
科大讯飞在过去十年构建了非常好的产学研合作体系,目前拥有业界唯一的国家级研发平台,并且和中国科大、清华大学、中科院自动化所进行了源头的整合,我相信未来随着核心技术的突破,可以不断的在灵犀中给大家带来新的惊喜。
大家一定期待什么时候能够用到灵犀,今天中午12点在移动应用商场就要首发,今天下午2点在各大商店。通过我们核心技术的不断进步,真正未来能够实现“我的手机我说了算”。
主持人刘昕:谢谢刘总精彩的演示,看完后我也捏了一把汗,刘总坚持要用真机演示。看完后我发现第一技术真的过硬,第二学好普通话很重要。
语音的合成、语义的理解、语音的识别这些关键技术在业界已经有了高的领先段,把这些技术和移动互联网技术结合在一起,能够真正解放我们的双手,改变我们使用手机的方式,这是我们对灵犀最大的期待。