阿里云小Ai:只有想不到,没有算不出
(2016-08-15 10:00:20)
来源:《浙商》杂志
“小Ai”不仅会速记,它同样能“看”能“算”。它主要基于神经网络、社会计算(social
computing)、情绪感知等原理工作,能担任人类社会中各种各样复杂的工作。未来,“小Ai”还能干成些什么,恐怕就连马云都没法定义。
这是国内首例由人工智能程序替代书记员完成庭审笔录的案件,这款程序来自阿里云,被称为“小Ai”,准确率高达96.2%。
如今,人工智能已经在浙江司法领域颇为常见。作为全国探索以录音录像代替书记员庭审笔录的首开先河者,浙江省高院为缓解案多人少的矛盾,开始借助“小Ai”之力。2016年1至5月,浙江省司法系统以录音录像代替书记员庭审笔录案件达10.8万件,约占开庭案件总数的52.3%。
“小Ai”就像是一个“超级速记员”,能够“聪明”地“听”到案件庭审情况,并高效且准确地直接记录下来,反映到显示屏上。而提供这项技术的阿里云,是目前世界上人工智能语音识别领域的前沿技术解决方案提供商。
“小Ai”战胜全球速记亚军
如果把“小Ai”看成一个人类,那么这次浙江省高院所借助的技术依赖的就是他的“听觉”。负责与浙江省高院合作项目的阿里云人工智能高级专家陈一宁介绍,“小Ai”背靠云计算,采用深度学习技术,可以轻松做到万小时级别的语音数据在天级别内训练完成。
在此之前,“小Ai”已在现场实录战役中拥有辉煌战绩。阿里云2016年年会上,“小Ai”与世界中文速记大赛亚军进行了一场PK。据现场最终评测,机器人在准确率上以0.67%的微弱优势战胜了第50届国际速联速记大赛全球速记亚军姜毅。
由于司法体系内存在大量庭审笔录的场景,“小Ai”在速记上大显身手后,引来了了浙江省高院的关注。
“为了配合法院的工作流程和语言环境,我们做了一系列工作。首先是在法院现有庭审设备的基础上进行了系统与硬件的调试,然后按照司法程序的特点,帮助小Ai‘学习’司法体系的语境与庭审流程。这牵涉到大量的数据工作。最后,经过一系列的优化,我们做到了令‘小Ai’能根据预先设置的角色,自动注明发言人身份,准确区分庭审发言对象及发言内容。”陈一宁介绍。
“小Ai”的“学习”能力解放了庭审中的书记员,更便于二审法官了解一审的庭审情况,而且操作方便,使用人点击事先安装在电脑桌面上的客户端就可以启用。在前述10.8万件庭审笔录中,法院就是通过这样的“一键”操作,最终解放了人力。
目前,“小Ai”的速记能力主要针对普通话。未来,随着“小Ai”进一步“学习”以及阿里云大数据的支撑,可以实现部分方言的语音识别。陈一宁对《浙商》记者表示,未来,阿里云“小Ai”的再学习是他们的一大工作重点。
这一技术除了引来法院的青睐,检察机关等同样拥有类似需求的部门与企业亦纷纷对阿里云表示出合作意向。“小Ai”的技术同样可以应用于直播文字输出、电话客服记录等领域。
神秘的创新部门
事实上,对于阿里云而言,浙江省司法系统的这一项目只不过是研究成果的“衍生”产品。
陈一宁还有另外一个头衔——阿里云iDST的高级专家。在阿里云,iDST(Institute
of
Data
阿里巴巴集团技术委员会主席王坚对其定位为:“iDST要做阿里其他部门不愿做、也做不了的事情。”而在浙江法院显露身手的“小Ai”,正是这一部门的研究成果。
iDST和阿里云到底有多牛?去年10月,Sort
Benchmark在官方网站公布了2015年排序竞赛的最终成绩,阿里云不到7分钟(377秒)就完成了100TB的数据排序。Sort
Benchmark的排序竞赛包含4项比赛,其中Gray Sort和Minute
Sort主要评测计算系统的规模和效率,是四项比赛中含金量最高的两项。最终,阿里云飞天分布式计算系统,在这两项重量级比赛中打破了全部四项世界纪录。
“未来视频、音频数据、生物数据等非结构化数据将爆发式增长,我们需要在最短的时间内、用最小的资源准确计算。面对大数据,如何算得快、算得准、算得起?这是未来云计算的核心能力。”阿里云首席架构师唐洪在事后表示。
拥有这么牛的技术背景的“小Ai”不仅会速记,它同样能“看”能“算”。它主要基于神经网络、社会计算(social
computing)、情绪感知等原理工作,能担任人类社会中各种各样复杂的工作。
今年4月9日,《我是歌手》总决赛前夕,“小Ai”又露了一手。当天晚上,“小Ai”通过运行在阿里云大数据平台上的三个系统(爬虫系统、情绪分析系统、现场效果采集判断系统)协同工作,准确预测了最终结果。在这一案例中,“小Ai”的计算能力是最终成功预测的保障,意味着人工智能向理解人类情感世界迈出了关键的一步。
而以上种种成果,正是iDST在进行世界最前沿科学研究时,应用到实际生产、工作等场景中的实践。未来,“小Ai”还能做些什么,恐怕就连马云都没法定义。

加载中…