机器人技术 顺风耳
(2016-01-11 11:53:45)
神话中传说的“顺风耳”是指能听到很远声音的人;借指消息灵通的人;比喻有广远的听觉能力;也可以说是一种在较长距离间传达声波的传声器。这一切在机器人身上都可以做到。
在某些环境中,要求机器人能够测知声音的音调、响度,区分左右声源,有的甚至可以判断声源的大致方位、距离,进行数字和语音通信,有时我们甚至要求与机器进行语音交流,使其具备“人-机”对话功能,听觉传感器和互联网通信技术的存在,使得机器人能更好的完成任务。
机器人的听觉功能通过听觉传感器采集声音信号,经声卡输入到机器人大脑,能够千里传音入脑,或者在你周围,但是只有你一人才能听见。机器人拥有了听觉,通过语音的人工识别和理解,就能够听懂人类语言,人们通过语音就可以对机器人的活动进行控制。
智能机器人涉及的听觉技术如下:
1、 声音传感器
智能机器人的耳朵首先要有感知声音的“器官”--声音传感器。它与语音识别技术软件构成一个完整的机器人“耳朵”。声音传感器的原理同于麦克风的基本原理,就是有一个金属膜片经过声音的震动以后,在磁铁内运动,从而产生电信号。将震动转换成讯号的方式,一种是动圈式,也就是将振膜连到一个线圈的尾端,然后整个线圈套在一个磁铁上,就好像喇叭一样,当振膜震动时,在线圈里面就会产生讯号。另外一种是所谓的电容式,就好像电话的受话器一样,藉着振膜的震动来改变电容值,因而改变电阻,就能改变电流,变成讯号。电容式因为需要电流才能变成讯号,所以需要电源,比动圈式使用成本高。还有一种是压电式,用压电材料做成的“耳朵”之所以能够听到声音,其原因就是压电材料在受到拉力或者压力作用的时候能产生电压,这种电压能使电路发生变化。这种特性就叫做压电效应。当它在声波的作用下不断被拉伸或压缩的时候,就产生了随声音信号变化而变化的电流,这种电流经过放大器放大后送入电子计算机进行处理,机器人就能听到声音了。例如一种叫做钛酸钡的压电材料做成的“耳朵”比人的耳朵更为灵敏,即使是火柴棍那样细小的东西反射回来的声波也能被它“听”的清清楚楚。如果用这样的耳朵来监听粮库,那么在二到三公斤的粮食里的一条小虫爬动的声音也能被它准确地“听”出来。
2、 语音识别技术
语音识别技术,就是帮助机器人“听”懂人类的语言,并将自己的回应转化为语音“说”给人类听。人机交互技术的本质就是让机器人具有与人交流的能力,并且这一交流过程越自然越好。
如果从说话者与识别系统的相关性考虑,可以将语音识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。
语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用。
3、语音合成技术
语音合成,又称文字到语音的转换技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是文字语音信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人开口说话。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。
①第五代移动通信技术(5G):通过集成多种无线接入解决方案,5G技术将可以把人类社会彻底带入网络社会,实现万物互联。在人与物、物与物的通信领域,虚拟现实、感触性Internet、工业界控制、机器人对话等愿景都将在5G的世界里得到应用和改善。
③量子通信:量子通信是利用量子相干叠加、量子纠缠效应进行信息传递的一种新型通信技术,由量子论和信息论相结合而产生。量子纠缠证实了爱因斯坦的幽灵——超距作用的存在,它证实了任何两种物质之间,不管距离多远,都有可能相互影响,不受四维时空的约束。机器人之间的距离可以变得很远,但量子信息可以在不同地区,甚至国家间、星球间传递。“量子通信”还是绝对安全的信息传输方式。信息安全隐忧分为:一是窃听手段,包括终端、核心网络、传输线路;二是破译。而在“量子态隐形传输”中即便是传输中的量子态被人动了手脚,异地的光子也能瞬间感应到。其方法是量子测不准原理+量子不可被复制原理+一次一密的密钥交换体系(密钥随机产生,明文、密钥和密文的长度一样)——窃听就会被发现,且不能破译修改,量子保密实现对机器人的使用控制无条件安全。