请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

百度新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组


智东西(公众号:zhidxcom)
文 | Lina

智东西11月28日音讯,在百度大脑开放日上,百度语音首席架构师贾磊推出了一款新的语音辨认模型——全名叫“基于复数CNN网络的语音加强和声学建模一体化的端到端语音辨认模型”,它与业内几乎一切语音辨认方案都不一样,打破了传统远场语音辨认技术的流程,可以将语音辨认准确率提高30%以上。

▲百度AI技术生态部总经理喻友平、百度语音首席架构师贾磊

在采访中,贾磊告诉智东西,这款语音辨认模型是百度前后历时近一年打造的。在三年之内,随着这一技术的不断发展成熟,远场语音辨认的准确率将能达到近场语音交互的程度,将来远场语音交互将会是主流。

百度AI技术生态部总经理喻友平则推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,以及基于智能家居、智能车载、智能IoT设备这三大场景的行业处理方案人,让智能硬件厂家更好、更快地集成AI语音才能。

百度CTO王海峰在还收场致辞中表示,目前,百度语音技术平台每天调用量曾经超过了100亿次。

一、颠覆传统远场语音辨认流程,准确率提高30%


贾磊表示,传统远场语音交互技术,首先要对声响停止数字信号处理(信号加强、波束生成等),接着再对其停止语音辨认,触及数字信号处理和语音辨认这两大学科。

而明天百度推出的基于复数CNN网络的语音加强和声学建模一体化的端到端语音辨认模型则是一款几近颠覆式的新形式,它打破了上述传统流程,以一套深度学习模型代替整个流程。

这套模型可以直接输入多路麦克风信号,输入目的语音文字,参数调整只要字准确率这独一的优化目的,不需求任何声学先验知识。

贾磊说,目前除了谷歌之外,业内一切次要玩家的语音交互都采用都是传统的方式。但是随着辨认率到达一定阶段,传统远场语音辨认的准确率很难再进一步提高。

百度的这款新模型搭配百度鸿鹄语音芯片,可以将语音辨认准确率提高30%以上。

在采访中,贾磊告诉智东西,即便设备没有搭载鸿鹄芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音辨认、初次唤醒准确率大幅提升。

贾磊说,深度学习的下一步方向就是这种跨范畴交融的技术,目前深度学习的端到端、跨学科整合方面正在疾速发展,不断对已有学科停止着颠覆。

二、推出三款AI语音开发板+三大行业处理方案


喻友平则在现场推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,为智能硬件厂家提供软硬一体的处理方案,让智能产品更好、更快地集成远场语音交互才能。

同时,针对细分场景,喻友平还在现场推出了基于鸿鹄语音芯片的智能家居、智能车载、智能IoT设备这三大场景的处理方案。

喻友平说,百度大脑开放平台目前是国内服务规模最大的AI开放平台,当前,其开发者群体超过150万(次要是企业开发者)、有228项开放的技术才能、可以在24小时内疾速集成。

而对于智能硬件来说,加入语音交互才能有三大次要难点:

1)唤醒、降噪、辨认的语音算法要求高;

2)软硬件适配复杂、周期长;

3)硬件选型难;

而百度明天推出的三款硬件模组和三大行业处理方案正是为了处理这些成绩所打造的。

三、王海峰:AI在运用场景中不断退化


百度CTO王海峰在收场致辞中表示,目前百度大脑曾经开放了200多项才能,语音才能是其中的重要方面。

百度从2010年末尾进军AI语音技术,2010年终末尾片面规划人工智能技术,2011年下半年末尾研讨深度学习,2012年终正式立项研讨开发基于深度学习的语音技术。

王海峰表示,人工智能是用电脑计算机模拟人的才能,人类在自然环境中不断退化,人工智能也在运用场景中不断退化。

当前,算力高速发展、算法持续提升、数据不断积累,从而推进AI技术不断退化。

同时王海峰还表示,目前,百度语音技术平台每天调用量曾经超过了100亿。

四、语音AI落地各行各业

除此之外,来自创维、瓴岳、子杰宝贝、华智水稻、善行智能的百度合作伙伴也分别引见了百度AI技术落地在家电、金融、护理、农业、智能眼镜等方面的落地。

创维AIoT研讨院产品经理李凯表示,从2017年末尾,创维就和百度停止了深度合作。创维集团AIoT研讨院成立于2018年,专注于AIoT相关技术的研发与合作落地。

李凯告诉智东西,目前创维的“Swaiot小维智联”AI系统的设备部署量曾经打破了千万台。创维电视目前也正在推进与百度鸿鹄语音芯片的合作落地。

此外,喻友平还在现场发布了百度大脑语音公益计划,将为听障、视障、举动不便等群体提供智能产品与服务的公益组织提供收费的语音辨认、语音合成技术,并以最低价钱提供语音硬件模组。


感激阅读。点击关注上船,带你浪在科技前沿!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评5

Tsubaki1314 2019-11-29 09:44:38 显示全部楼层
目前,百度语音技术平台每天调用量曾经超过了100亿次。
回复

使用道具 举报

为子怡拉票 2019-11-29 09:52:43 显示全部楼层
牛,等待大发展
回复

使用道具 举报

wangdaxia7 2019-11-29 19:50:42 显示全部楼层
话不多说,【抱拳了,老铁】。
回复

使用道具 举报

hykonglee 2019-12-1 16:13:03 显示全部楼层
支持你哈...................................
回复

使用道具 举报

嘟嘟之家 2019-12-2 07:51:46 显示全部楼层
一直在看
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies