智客公社

标题: 阿里达摩院开源语音识别模型DFSMN,准确率达96.04% [打印本页]

作者: DZZZZ    时间: 2022-8-26 19:01
标题: 阿里达摩院开源语音识别模型DFSMN,准确率达96.04%
Amoy 发自 凹非寺 量子位 报道 | 公众号 QbitAI

阿里巴巴达摩院又有新开源模型,这次是语音识别模型DFSMN。

近日,阿里达摩院机器智能实验室开源了新一代语音识别模型DFSMN,基于世界最大的免费语音识别数据库LibriSpeech,该模型将全球语音识别准确率纪录提高至96.04%。

阿里方面称,对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。

而采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。

[attach]783250[/attach]

相关详情可移步开源地址:

https://github.com/tramphero/kaldi



诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态
作者: icihdlfgxf    时间: 2022-8-26 19:01
语音输入还是讯飞厉害。
作者: 286716    时间: 2022-8-26 19:02
能达到这个准确率的模型就很厉害了
作者: 绿色de阳光    时间: 2022-8-26 19:02
语音识别只服顺丰。
作者: 中国传商    时间: 2022-8-26 19:03
转发了
作者: BKrJSNCZ    时间: 2022-8-26 19:03
转发了
作者: lucyklaoba    时间: 2022-8-27 07:02
秀起来~
作者: 郭少兵    时间: 2022-8-27 12:44
还有没有详细介绍?
作者: amwidtfhao    时间: 2022-8-27 18:56
发发呆,回回帖,工作结束~




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4