找回密码
 立即注册
搜索

语音辨认准确率97.03% 全球最新语音辨认世界纪录在渝诞生

华龙网10月29日19时讯(首席记者 佘振芳 实习生 唐李琳)记者从两江新区获悉,重庆中科云丛科技有限公司在语音辨认技术上获得严重打破,该企业交融图像辨认与语音辨认的优势,推出了全新Pyramidal-FSMN语音辨认模型,音辨认准确率达97.03%,刷新了语音辨认世界纪录。

近年来,基于语音辨认技术的输入法、搜索和翻译等人机交互场景有了广泛的运用。2018年6月,阿里巴巴达摩院推出了新一代语音辨认模型DFSMN,将全球语音辨认准确率纪录提高至96.04%,错词率降低至3.96%。

由云从科技自主研发的全新Pyramidal-FSMN语音辨认模型在全球最大的开源语音辨认数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率(Worderrorrate,WER)降低至2.97%,较之前提升了25%。

同时,该模型交融图像辨认与语音辨认的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,可以同时有效的提取空间和工夫上不同粒度的信息,对比目前业界运用最为广泛的LSTM模型,训练速度更快、辨认准确率更高。

“该打破将推进语音辨认技术的大幅提高,也使得语音辨认离更良好的智慧交互体验越来越近。”云从科技相关担任人告诉记者,此次打破标志着云从科技在往年4月刷新跨镜追踪技术(ReID)3项世界纪录后在新范畴再次获得严重成果,也是云从科技打造核心技术闭环途径中的关键一步。

记者了解到,云从科技核心技术闭环包括人脸辨认、智能感知与智能分析3个阶段,此次语音辨认打破属于智能感知中的一环。在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上,云从科技创始人周曦提出了人工智能发展的5个阶段,而核心技术闭环正是5个阶段的重要基础。云从科技在往年先后首发3D结构光人脸辨认技术及刷新跨镜追踪技术3项世界纪录,并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”,正稳步推进从核心技术到智能生态的五步走战略。
回复

使用道具 举报

大神点评3

刘晓琼94 2020-6-14 18:30:46 显示全部楼层
结束了嘛?有种还没完成的感觉,嘻嘻
回复

使用道具 举报

打酱油的人拉,回复下赚取积分
回复

使用道具 举报

__末世 2020-6-16 11:31:32 显示全部楼层
报告!别开枪,我就是路过来看看的。。。
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies