智客公社

标题: 语音辨认准确率97.03% 全球最新语音辨认世界纪录在渝诞生 [打印本页]

作者: 宇智波八夜 时间: 2020-6-14 13:08
标题: 语音辨认准确率97.03% 全球最新语音辨认世界纪录在渝诞生
华龙网10月29日19时讯（首席记者佘振芳实习生唐李琳）记者从两江新区获悉，重庆中科云丛科技有限公司在语音辨认技术上获得严重打破，该企业交融图像辨认与语音辨认的优势，推出了全新Pyramidal-FSMN语音辨认模型，音辨认准确率达97.03%，刷新了语音辨认世界纪录。

近年来，基于语音辨认技术的输入法、搜索和翻译等人机交互场景有了广泛的运用。2018年6月，阿里巴巴达摩院推出了新一代语音辨认模型DFSMN，将全球语音辨认准确率纪录提高至96.04%，错词率降低至3.96%。

由云从科技自主研发的全新Pyramidal-FSMN语音辨认模型在全球最大的开源语音辨认数据集Librispeech上刷新了世界纪录，准确率提升到97.03%，将Librispeech的错词率（Worderrorrate，WER）降低至2.97%，较之前提升了25%。

同时，该模型交融图像辨认与语音辨认的优势，将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,可以同时有效的提取空间和工夫上不同粒度的信息，对比目前业界运用最为广泛的LSTM模型，训练速度更快、辨认准确率更高。

“该打破将推进语音辨认技术的大幅提高，也使得语音辨认离更良好的智慧交互体验越来越近。”云从科技相关担任人告诉记者，此次打破标志着云从科技在往年4月刷新跨镜追踪技术（ReID）3项世界纪录后在新范畴再次获得严重成果，也是云从科技打造核心技术闭环途径中的关键一步。

记者了解到，云从科技核心技术闭环包括人脸辨认、智能感知与智能分析3个阶段，此次语音辨认打破属于智能感知中的一环。在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上，云从科技创始人周曦提出了人工智能发展的5个阶段，而核心技术闭环正是5个阶段的重要基础。云从科技在往年先后首发3D结构光人脸辨认技术及刷新跨镜追踪技术3项世界纪录，并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”，正稳步推进从核心技术到智能生态的五步走战略。

作者: 刘晓琼94 时间: 2020-6-14 18:30
结束了嘛？有种还没完成的感觉，嘻嘻

作者: oO泡泡之神Oo 时间: 2020-6-15 18:31
打酱油的人拉，回复下赚取积分

作者: __末世 时间: 2020-6-16 11:31
报告！别开枪，我就是路过来看看的。。。

欢迎光临智客公社 (http://bbs.cnaiplus.com/)