找回密码
 立即注册
搜索

车内语音辨认技术,让汽车活起来

rxcym 2019-11-21 12:24:27 显示全部楼层 阅读模式


随着CarPlay、Android Auto以及Echo Auto等平台浸透乘用车市场,车内语音辨认技术预期将成为主流;但仍有一个答案未知的成绩是:市场上有任何语音启动技术曾经预备好随机应对车内的关键义务了吗?


在往年1月举行的国际消费性电子展(CES)上,当媒体看到高通(Qualcomm)展现了在其车内Smart Audio平台上的Amazon Alexa语音辨认功能,就对将来发展有了一些想象。高通的展现预示,车内虚拟助理将会使得语音成为驾驶人与车辆之间的自然沟通接口。

高通的展现中最令人印象深入的一幕,是Alexa在高通的某个高层说话时打断他,说:“不对!这不是真的。”欧喔…在展现中发生这种小“突槌”事情在所难免;而且另一方面,目前的商用语音处理系统也会发生这种语音处理失误。

语音辨认系统通常辨识度不佳,特别是在吵杂的环境中;车内就是一个非常吵杂的环境。来自以色列的新创公司Hi Auto执行长暨共同创办人Roy Baharav在接受EE Times访问时就指出:“你可以想象坐后座的小孩们在吵闹、救护车从旁边呼啸而过,还有大雨打在车顶上…”

为了消弭噪音以及改善车内语音辨认的牢靠度,Hi Auto开发了一种视觉语音(audio-visual)处理方案,应用了面对驾驶人的摄影机以及单个麦克风,以深度学习算法追踪嘴唇运动,这种整合式的“视觉语音”处理方案会锁定驾驶人,同时肃清其他麦克风与噪音。

而预期的输入则是“干净的音讯”,Hi Auto宣称如此能完成更准确的语音辨认以及明晰的对话;该公司的计划是提供“只要软件”、不搭配特定硬件的系统。

车内语音辨认

语音输入可望成为终极语音接口,但也只是“可望”;昔日的语音输入技术相对较新,对很多人来说,跟一个没有生命的物体交谈还是感觉很怪。所以如何养成人们在车内运用语音控制接口的习气?毕竟Hi Auto的成功取决于语音控制普及性,特别是在汽车产业。

对此Baharav表示:“在很多高阶车款中,语音控制曾经被广泛采用,而且这种技术也渐渐浸透到大众车款;”这种趋向得益于支持语音控制接口的车用资通讯文娱系统越来越受欢迎。而且他以为,车内资通讯文娱系统的语音助理不只要文娱功能,“将担任关键义务。”

Baharav进一步解释,首先透过可视接口控制的各种车内安装功能,曾经变成驾驶人分心的缘由之一;其次,汽车产业正面临越来越严厉的安全法规;第三,曾经习气在家里运用Amazon Echo或是Google Home等语音助理的消费者,也在寻求车用的相似方案。


根据市场分析机构voicebot.ai的2019年最新调查,美国有60%消费者在购车时会将语音助理系统做为思索条件之一。(来源:Voicebot.ai)

而且Hi Auto也不是独一看好“会说话的车子”的公司;Baharav估计,目前该市场上约有5亿美元规模,长大也非常疾速。他举例指出,曾经在该市场上运营一段工夫的、从语音辨认业者Nuance独立而出的Cerence,就被以为一年的营收达到3亿美元;还有一家公司SoundHound在市场上的版图也持续扩张。

分析师预期,透过语音助理衍生的商业与广告支出将在2025年达到200亿美元,而且车用将会是次要的贡献者之一。而根据Baharav观察,对汽车产业来说更重要的是,车厂将车用资通讯文娱系统的差异化视为打品牌的关键,因此这是一个可应用的好机会。

Baharav解释:“随着语音控制变得越来越重要(Google预期2020年有五成的在线搜索是透过语音),车厂也觉得他们必需要支持这种接口;”假如有人忽略了疾速长大的语音搜索市场发展趋向,会有被淘汰的风险。

语音控制能用在关键义务?

语音控制最立刻性的运用是车用资通讯安装接口,驾驶人能以语音指令完成打电话、发简讯、播放多媒体,或是导航等等功能。还有什么其他需求跟车子说话的理由吗?

Baharav表示:“想象一下共乘车还有家庭用车;”当车内有不只一个的资通讯文娱系统需求控制,而且要一次处理好几个语音指令,高质量的车内语音技术会变得非常重要。此外随着先进驾驶辅助系统(ADAS)功能越来越多样化,他预见将来驾驶人可以出声指挥车子变换车道、超车,或者是停进某个停车格,而且其牢靠度以及抗噪音的才能会让人冷艳。

推进创新的基本力气,来自于车厂对于牢牢掌握数字体验方案的盼望;但并非让驾驶人习气CarPlay、Android Auto,而是希望消费者运用车厂自家的车用资通讯文娱系统(IVI)。Baharav指出,在这种状况下,车厂们将会提供原厂内建、运用者友善的IVI,而且支持抢手的音乐串流、数字广播或实时通讯运用程序。

他补充指出,对车厂来说,更重要的是“将IVI与自家开发的地图软件、广播、通话/简讯支持、车身控制、ADAS互动,还有触及其他车身硬件的软件程序结合;”随着这些车内运用程序不断增生,车厂必需要具有至少能与Google Assistant与Siri媲美的语音控制技术。

很遗憾的是,“目前个别处理方案在语音助理质量方面仍嫌不足,特别是在吵杂的环境中;”Hi Auto希冀能藉由针对车内环境永久存在的瞬间吵杂成绩、还有人们习气在车内交谈的状况提出处理方案来让本人异乎寻常:“我们必须确保车子听清楚驾驶人说什么。”

若是车内语音控制指令失效…

Hi Auto的明白目的是,藉由改善语音分离(speaker separation)以及强化语音辨认,在车用语音控制市场占据一席之地。我们讯问了Baharav目前的智能型手机或智慧扬声器在噪音消弭才能上不足的几个运用场景。

例如一个爸爸驾驶休旅车载女儿们还有她们的冤家们一同去练足球,他留意到汽油快没了,不过他们在高速公路上,需求改变导航的方向。他不想花太多工夫滑触控屏幕去找加油站,但是车子里的噪音太大了(很多小孩在叽叽喳喳),车子听不清楚爸爸的指令。

Baharav表示:“这种状况无法以最先进的指向性麦克风来处理,由于孩子们坐在爸爸后面;而噪音消弭也无法处理这个噪音,由于并非静态的,无法学习并消弭。”

另一个例子是,一位女性驾驶在大雷雨中开车上高速公路要去下班;在雷鸣闪电中,车子的报器响了,暖气的风扇曾经开到最大。她想告诉同事她下班会迟到,但发简讯太风险,所以她对着车内系统用讲的,但系统的反应却不断是:“抱歉,请说大声点…”

Baharav表示,这个状况也无法用最先进的指向麦克风来处理,由于噪音来自五湖四海。噪音消弭也无法处理噪音,由于这异样非静态,无法学习并消弭(瞬间噪音)。

Hi Auto近日解除了隐身形式,完成450万美元的种子轮募资,由一家以色列汽车出口商Delek Motors以及其现任董事长Zohar Zisapel主导。其他投资人还包括运输业者Allied Holdings、Goldbell Group与Plug & Play。

这家新创公司估计用种子资金完成第一款产品的开发,并展开支售与扩大团队;Hi Auto表示,曾经汽车业界指导厂商安排在2020年终测试其技术。在2020年的CES展之后,Hi Auto打算以软件开发工具包(SDK)的方式推出车内语音处理方案,透过简单的授权方式,或是以软件即服务(SaaS)的形式提供云端API。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

今生唯一Jacky 2019-11-21 18:41:16 来自手机 显示全部楼层
确实不错,顶先
回复

使用道具 举报

VGOD喹 2019-11-22 15:08:59 来自手机 显示全部楼层
佩服佩服!
回复

使用道具 举报

结束了嘛?有种还没完成的感觉,嘻嘻
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies