百度大脑发布语音交互的新技术，辨认准确率提高 30%

itbeach · 2019-12-2 14:38:27

11 月 28 日，百度大脑发布了基于复数 CNN 的语音加强和声学建模一体化的端到端辨认技术。这项技术无需任何数字信号处理和语音辨认学科的先验假设，复数 CNN 网络内存占用少于 200K，可以内置到百度鸿鹄芯片外部。应用进场数据和纯粹依托仿真数据，就可以获得足量的远场训练数据，整个过程是从原始多麦克信号到辨认文字的一个端到端训练，整个优化过程只要字错误率两集一个优化准绳。

百度语音首席架构师贾磊表示，「这项技术完成了数字信号处理和语音辨认这两个范畴的技术革命，用端到端一个声学模型，不需求任何范畴行业的支持，处理两个跨范畴的语音辨认成绩。」

「我们获得了比目前百度音箱现有产品，超过 30% 以上错误率的下降，即语音辨认功能提升 30%，这也是目前我们在国际业内同行看到的提升最大的，应用深度学习来完成语音交互的系统。」

kulelala · 2019-12-2 21:24:36

很看好这个

2691511542 · 2019-12-4 10:34:44

未完待续哈哈！

minzhou · 2019-12-5 07:36:23

给你我的小心心

		自动登录	找回密码
密码			立即注册

百度大脑发布语音交互的新技术，辨认准确率提高 30%

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们