智客公社

标题: 阿里达摩院开源语音识别模型DFSMN，准确率达96.04% [打印本页]

作者: DZZZZ 时间: 2022-8-26 19:01
标题: 阿里达摩院开源语音识别模型DFSMN，准确率达96.04%

Amoy 发自凹非寺量子位报道 | 公众号 QbitAI

阿里巴巴达摩院又有新开源模型，这次是语音识别模型DFSMN。

近日，阿里达摩院机器智能实验室开源了新一代语音识别模型DFSMN，基于世界最大的免费语音识别数据库LibriSpeech，该模型将全球语音识别准确率纪录提高至96.04%。

阿里方面称，对比目前业界使用最为广泛的LSTM模型，DFSMN模型训练速度更快、识别准确率更高。

而采用全新DFSMN模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了3倍，语音识别速度提高了2倍。

[attach]783250[/attach]

相关详情可移步开源地址：

https://github.com/tramphero/kaldi

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

作者: icihdlfgxf 时间: 2022-8-26 19:01
语音输入还是讯飞厉害。

作者: 286716 时间: 2022-8-26 19:02
能达到这个准确率的模型就很厉害了

作者: 绿色de阳光 时间: 2022-8-26 19:02
语音识别只服顺丰。

作者: 中国传商 时间: 2022-8-26 19:03
转发了

作者: BKrJSNCZ 时间: 2022-8-26 19:03
转发了

作者: lucyklaoba 时间: 2022-8-27 07:02
秀起来~

作者: 郭少兵 时间: 2022-8-27 12:44
还有没有详细介绍？

作者: amwidtfhao 时间: 2022-8-27 18:56
发发呆，回回帖，工作结束~

欢迎光临智客公社 (http://bbs.cnaiplus.com/)