门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
请选择
进入手机版
|
继续访问电脑版
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
语音识别
›
百度新款语音辨认模型,准确率飙升30%,还有三款AI语音 ...
返回列表
百度新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组
[复制链接]
lianhean
2019-11-29 09:41:15
显示全部楼层
|
阅读模式
智东西(公众号:zhidxcom)
文 | Lina
智东西11月28日音讯,在百度大脑开放日上,百度语音首席架构师贾磊推出了一款新的语音辨认模型——全名叫“基于复数CNN网络的语音加强和声学建模一体化的端到端语音辨认模型”,它与业内几乎一切语音辨认方案都不一样,打破了传统远场语音辨认技术的流程,可以将语音辨认准确率提高30%以上。
▲百度AI技术生态部总经理喻友平、百度语音首席架构师贾磊
在采访中,贾磊告诉智东西,这款语音辨认模型是百度前后历时近一年打造的。在三年之内,随着这一技术的不断发展成熟,远场语音辨认的准确率将能达到近场语音交互的程度,将来远场语音交互将会是主流。
百度AI技术生态部总经理喻友平则推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,以及基于智能家居、智能车载、智能IoT设备这三大场景的行业处理方案人,让智能硬件厂家更好、更快地集成AI语音才能。
百度CTO王海峰在还收场致辞中表示,目前,百度语音技术平台每天调用量曾经超过了100亿次。
一、颠覆传统远场语音辨认流程,准确率提高30%
贾磊表示,传统远场语音交互技术,首先要对声响停止数字信号处理(信号加强、波束生成等),接着再对其停止语音辨认,触及数字信号处理和语音辨认这两大学科。
而明天百度推出的基于复数CNN网络的语音加强和声学建模一体化的端到端语音辨认模型则是一款几近颠覆式的新形式,它打破了上述传统流程,以一套深度学习模型代替整个流程。
这套模型可以直接输入多路麦克风信号,输入目的语音文字,参数调整只要字准确率这独一的优化目的,不需求任何声学先验知识。
贾磊说,目前除了谷歌之外,业内一切次要玩家的语音交互都采用都是传统的方式。但是随着辨认率到达一定阶段,传统远场语音辨认的准确率很难再进一步提高。
百度的这款新模型搭配百度鸿鹄语音芯片,可以将语音辨认准确率提高30%以上。
在采访中,贾磊告诉智东西,即便设备没有搭载鸿鹄芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音辨认、初次唤醒准确率大幅提升。
贾磊说,深度学习的下一步方向就是这种跨范畴交融的技术,目前深度学习的端到端、跨学科整合方面正在疾速发展,不断对已有学科停止着颠覆。
二、推出三款AI语音开发板+三大行业处理方案
喻友平则在现场推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,为智能硬件厂家提供软硬一体的处理方案,让智能产品更好、更快地集成远场语音交互才能。
同时,针对细分场景,喻友平还在现场推出了基于鸿鹄语音芯片的智能家居、智能车载、智能IoT设备这三大场景的处理方案。
喻友平说,百度大脑开放平台目前是国内服务规模最大的AI开放平台,当前,其开发者群体超过150万(次要是企业开发者)、有228项开放的技术才能、可以在24小时内疾速集成。
而对于智能硬件来说,加入语音交互才能有三大次要难点:
1)唤醒、降噪、辨认的语音算法要求高;
2)软硬件适配复杂、周期长;
3)硬件选型难;
而百度明天推出的三款硬件模组和三大行业处理方案正是为了处理这些成绩所打造的。
三、王海峰:AI在运用场景中不断退化
百度CTO王海峰在收场致辞中表示,目前百度大脑曾经开放了200多项才能,语音才能是其中的重要方面。
百度从2010年末尾进军AI语音技术,2010年终末尾片面规划人工智能技术,2011年下半年末尾研讨深度学习,2012年终正式立项研讨开发基于深度学习的语音技术。
王海峰表示,人工智能是用电脑计算机模拟人的才能,人类在自然环境中不断退化,人工智能也在运用场景中不断退化。
当前,算力高速发展、算法持续提升、数据不断积累,从而推进AI技术不断退化。
同时王海峰还表示,目前,百度语音技术平台每天调用量曾经超过了100亿。
四、语音AI落地各行各业
除此之外,来自创维、瓴岳、子杰宝贝、华智水稻、善行智能的百度合作伙伴也分别引见了百度AI技术落地在家电、金融、护理、农业、智能眼镜等方面的落地。
创维AIoT研讨院产品经理李凯表示,从2017年末尾,创维就和百度停止了深度合作。创维集团AIoT研讨院成立于2018年,专注于AIoT相关技术的研发与合作落地。
李凯告诉智东西,目前创维的“Swaiot小维智联”AI系统的设备部署量曾经打破了千万台。创维电视目前也正在推进与百度鸿鹄语音芯片的合作落地。
此外,喻友平还在现场发布了百度大脑语音公益计划,将为听障、视障、举动不便等群体提供智能产品与服务的公益组织提供收费的语音辨认、语音合成技术,并以最低价钱提供语音硬件模组。
感激阅读。点击关注上船,带你浪在科技前沿!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有帐号?
立即注册
x
回复
使用道具
举报
大神点评
5
Tsubaki1314
2019-11-29 09:44:38
显示全部楼层
目前,百度语音技术平台每天调用量曾经超过了100亿次。
回复
使用道具
举报
为子怡拉票
2019-11-29 09:52:43
显示全部楼层
牛,等待大发展
回复
使用道具
举报
wangdaxia7
2019-11-29 19:50:42
显示全部楼层
话不多说,【抱拳了,老铁】。
回复
使用道具
举报
hykonglee
2019-12-1 16:13:03
显示全部楼层
支持你哈...................................
回复
使用道具
举报
嘟嘟之家
2019-12-2 07:51:46
显示全部楼层
一直在看
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
lianhean
金牌会员
0
关注
0
粉丝
80
帖子
Ta的主页
发布
加好友
最近发表
2023年全球智能可穿戴腕带出货量及竞争格局分析
智能穿戴概念8日主力净流出24.84亿元,光启技术、立讯精密居前
智能穿戴概念11日主力净流入5.62亿元,三六零、兆易创新居前
智能穿戴概念10日主力净流出23.94亿元,立讯精密、中兴通讯居前
智能穿戴概念9日主力净流入6998.51万元,水晶光电、九安医疗居前
云天励飞豪掷1.8亿收购智能穿戴IDH方案商,引领行业新潮流
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们