加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Rokid:“中国女孩”叫板Google Home

(2016-08-12 09:58:30)

  来源:《浙商》杂志 作者:姚恩育

  随着智能硬件技术的开发与应用,智能家居正在越来越贴近人们的生活。家庭生活服务类机器人便是其中一环。Rokid与Google Home的诞生,意味着这一产业正在进入新的阶段。 

  今年5月份,Google I/O开发者大会上,Google发布了配有内置扬声器的语音激活设备Google Home。这款家庭智能终端集成了音频播放器,用一句“Okay, Google ”便能唤醒,实现人机交互。一时间,全球极客为之沸腾。 

  远在大洋彼岸的中国杭州,另一家家庭机器人企业Rokid的公众号就此事开起了玩笑:“真没想到谷歌这么慢!” 

  文章提到,“两年前,在Rokid刚成立的时候,有人说:‘我们未来最大的竞争对手是谷歌。’当时在场的人都笑了。不过,真没想到谷歌这么慢,Rokid等了你整整两年,上个月首批产品都已经全部卖完了,Google Home才姗姗来迟。” 

  就在Google Home推出前一个月,Rokid首销。据Rokid市场负责人黄超介绍,首销仅10分钟就售出了100台,备好的300台卖空后又临时追加了200台,连自己办公桌上放的Rokid都让朋友抱走了。以其5280元的定价而言,首批用户是极客发烧友的可能性颇高。随后,5月,Rokid再度开启官网全面预售,不到3个小时就成功打破此前在天猫TES生态峰会当天的总销售纪录。 

  以这两个事件作为坐标,业内隐约听到了家庭人工智能时代的步点。 

  为“陪伴”而生 

  随着智能硬件技术的开发与应用,智能家居正在越来越贴近人们的生活。家庭生活服务类机器人正是其中一环。 

  2014年,《超能陆战队》的上映让全世界陷入对“大白”的迷恋中。这个短腿、大肚子,柔软温暖的机器人映射出大部分人对于家庭服务类机器人的想像:呆萌可爱,能够提供陪伴,能够给予帮助,解决生活中各种各样的难题。 

  事实上,早在大白“诞生”之前,人类对于家庭服务类机器人的需求已经在各种科幻作品中存在,比如多啦A梦,比如Wall-E, 比如《星球大战》电影中的C3PO、R2D2和BB-8。但碍于技术、硬件设施等障碍,这一产业可以说是始终“只闻楼梯响,不见人下来”。 

  Rokid与Google Home的诞生,意味着这一产业正在进入新的阶段:至少,我们终于看到了产品。 

  与大白一样,Rokid的形象圆润可爱,远看就像两个“蛋”叠在了一起。按照Rokid方面的说法,它采用了自然有机曲面设计,在两侧提供了滑动触摸感应,可以控制音量和亮度。由于结合了深度学习的自然语音、准3D的UI、灯光和音效等多重输出手段,能够在人与机器之间实现良好的立体交互视听体验。 

  如今,Rokid也拥有了中文名“若琪”,这个听起来偏女性化的名字,配合内置的专业范儿的语音发声系统,让人联想到专业女性管家的角色。 

  除了给予Rokid拟人化的名字之外,在对产品的设计上,Rokid团队也努力朝拟人化发展。你可以把其前盖看作是她的脸,上面显示的蓝色圆环表达着她所有的情绪,是她传递情感的“眼睛”。你从旁边叫她,她会转过去看你;听不懂你的话时,会有个困惑的表情;你责怪她时,她会沮丧;夸奖她时,她会害羞。 

  开放式平台 

  黄超表示,Rokid拥有多项识别技术:声纹识别、人脸识别、手势识别、动作识别、远场语音识别、声音寻向、AEC自身音源消除等。你的每一句话、每一个手势、每一个动作都被她记在心里。你的每一个表情和语气,究竟是快乐还是忧伤,Rokid都会通过“学习”慢慢懂得。AEC自身音源消除技术让Rokid在放音乐的同时依然可以清晰地听到你在说话。声音寻向技术能辨认出你说话的方向,并同时屏蔽来自其他方向的声音,“专注”地听你对她说的每一句话。 

  那么,Rokid能做些什么?目前来看,Rokid更像是一个智能家居平台。在这一平台上嫁接着各项家庭生活服务中需要的应用。比如现在Rokid可以帮你在音乐应用上“点歌”,你也可以通过Rokid用滴滴出行打车,同时,通过与Lifesmart等智能家具品牌合作,Rokid可以成为你家中一切智能设备的“大脑”。只要对Rokid说一声“若琪,我想听歌”,或者“若琪,灯太暗了”,她就可以令室内响起音乐,或者让灯光调到适合你需要的亮度,她还可以用温柔的声音给你的孩子讲故事,陪着他们入眠。 

  在Rokid圆润可爱的外表之外,她试图成为一个开放式的应用平台。“一开始,高度可扩展性的硬件接口就是为开发者所准备的。”最终,Rokid或许可以做到“只要你说话,她就能控制一切”。 

  到目前为止,Rokid团队已经接收到不少应用合作的需求,在其现有产品中已经接入20多款应用。 

  工程师情结孕育的娃 

  在Rokid开售之前,这家公司还发生了一件大事。 

  1月,Rokid捧回了2016国际消费电子产品展(CES)家庭音频/视频类创新奖。CES始于1976年,旨在奖励消费类电子产品方面的卓越设计与尖端工程成果。荣获该奖项的产品反映了相关高科技产品及服务领域最前沿的设计和工程创新。对于成立于2014年7月的Rokid而言,获得这一奖项令其产品未卖先火。 

  黄超介绍,目前,Rokid的团队分布在杭州、北京与美国旧金山,其中杭州是其全球总部。团队中大拿无数,创始人Misa是前阿里巴巴M工作室领头人,负责深度学习,视觉和自然语言处理的研发。此外,这个60余人的团队中还有10余位博士和20多位硕士,多数来自三星、富士康、索尼、诺基亚和谷歌等跨国巨头公司。 

  到目前为止,除了代加工,Rokid所有技术都是公司团队自主研发的。在语音识别上,Rokid并没有使用第三方的语音识别服务,而是聘请了语音识别专家,自主对机器人进行语音识别训练。这使得Rokid的自然语言对话技术融合了基于大规模语料的统计机器学习方法和基于领域知识的专家系统方法,垂直领域识别准确率达到业界先进水平,也使之成为Rokid的重要竞争力。 

  一群技术大拿在一起会导致什么结果?大概就是格外较真了。比如说在“唤醒”这件事上,Rokid团队最终做到了只需两个音节就能唤醒机器人,而苹果的Siri则需要3个音节。这意味着,唤醒Siri你需要一直喊“Hey, Siri”,此后每执行一次命令都需要再重复一遍。而唤醒Rokid,你只需要叫一声“若琪”。 

  这听起来似乎只是细节,但在真正实行几次后,你就会发现,后者人性化很多。而单就这一细节,背后可是有大量语音交互方面的工作来支撑的哦。 

  “若琪”是很有魅力的。 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有