找回密码
 立即注册
搜索

百度大脑发布语音交互的新技术,辨认准确率提高 30%

11 月 28 日,百度大脑发布了基于复数 CNN 的语音加强和声学建模一体化的端到端辨认技术。这项技术无需任何数字信号处理和语音辨认学科的先验假设,复数 CNN 网络内存占用少于 200K,可以内置到百度鸿鹄芯片外部。应用进场数据和纯粹依托仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到辨认文字的一个端到端训练,整个优化过程只要字错误率两集一个优化准绳。

百度语音首席架构师贾磊表示,「这项技术完成了数字信号处理和语音辨认这两个范畴的技术革命,用端到端一个声学模型,不需求任何范畴行业的支持,处理两个跨范畴的语音辨认成绩。」

「我们获得了比目前百度音箱现有产品,超过 30% 以上错误率的下降,即语音辨认功能提升 30%,这也是目前我们在国际业内同行看到的提升最大的,应用深度学习来完成语音交互的系统。」



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

kulelala 2019-12-2 21:24:36 来自手机 显示全部楼层
很看好这个
回复

使用道具 举报

2691511542 2019-12-4 10:34:44 显示全部楼层
未完待续哈哈!
回复

使用道具 举报

minzhou 2019-12-5 07:36:23 显示全部楼层
给你我的小心心
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies