智客公社

标题: 语音辨认准确率97.03% 全球最新语音辨认世界纪录在渝诞生 [打印本页]

作者: 宇智波八夜    时间: 2020-6-14 13:08
标题: 语音辨认准确率97.03% 全球最新语音辨认世界纪录在渝诞生
华龙网10月29日19时讯(首席记者 佘振芳 实习生 唐李琳)记者从两江新区获悉,重庆中科云丛科技有限公司在语音辨认技术上获得严重打破,该企业交融图像辨认与语音辨认的优势,推出了全新Pyramidal-FSMN语音辨认模型,音辨认准确率达97.03%,刷新了语音辨认世界纪录。

近年来,基于语音辨认技术的输入法、搜索和翻译等人机交互场景有了广泛的运用。2018年6月,阿里巴巴达摩院推出了新一代语音辨认模型DFSMN,将全球语音辨认准确率纪录提高至96.04%,错词率降低至3.96%。

由云从科技自主研发的全新Pyramidal-FSMN语音辨认模型在全球最大的开源语音辨认数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率(Worderrorrate,WER)降低至2.97%,较之前提升了25%。

同时,该模型交融图像辨认与语音辨认的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,可以同时有效的提取空间和工夫上不同粒度的信息,对比目前业界运用最为广泛的LSTM模型,训练速度更快、辨认准确率更高。

“该打破将推进语音辨认技术的大幅提高,也使得语音辨认离更良好的智慧交互体验越来越近。”云从科技相关担任人告诉记者,此次打破标志着云从科技在往年4月刷新跨镜追踪技术(ReID)3项世界纪录后在新范畴再次获得严重成果,也是云从科技打造核心技术闭环途径中的关键一步。

记者了解到,云从科技核心技术闭环包括人脸辨认、智能感知与智能分析3个阶段,此次语音辨认打破属于智能感知中的一环。在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上,云从科技创始人周曦提出了人工智能发展的5个阶段,而核心技术闭环正是5个阶段的重要基础。云从科技在往年先后首发3D结构光人脸辨认技术及刷新跨镜追踪技术3项世界纪录,并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”,正稳步推进从核心技术到智能生态的五步走战略。
作者: 刘晓琼94    时间: 2020-6-14 18:30
结束了嘛?有种还没完成的感觉,嘻嘻
作者: oO泡泡之神Oo    时间: 2020-6-15 18:31
打酱油的人拉,回复下赚取积分
作者: __末世    时间: 2020-6-16 11:31
报告!别开枪,我就是路过来看看的。。。




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4