智客公社

标题: 科技热词|100秒了解语音辨认技术 [打印本页]

作者: lolitajia    时间: 2020-7-2 07:22
标题: 科技热词|100秒了解语音辨认技术
[attach]412513[/attach]


提起语音辨认,我们最容易想到的能够是不会讲笑话的 Siri;看过电影《Her》的冤家一定会对其中语音辨认和控制的情节印象深入;说句话就能控制一切电器开关、听音乐只需报出歌名……不断以来,人类都怀揣着与其他生物乃至机器停止语音交流的梦想,而如今,人工智能的飞速发展,使这一想象变为理想。

语音辨认技术的广泛运用,让智能语音产品浸透到我们日常生活的方方面面。

科技热词解析

[attach]412514[/attach]


#语音辨认技术#

简单来说其实就是应用计算机将语音信号自动转换为文本的一项技术,是将人类的声响信号转化为文字的过程。

所触及的范畴有信号处理、形式辨认、概率论和信息论、发声机理和听觉机理、人工智能等等,甚至还触及到人的体态言语(如人民在说话时的表情手势等行为动作可协助对方了解)。

其运用范畴也非常广,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务范畴的智能对话查询系统。

核心技术

▼▼▼

①信号处理及特征提取模块:该模块的次要义务是从输入信号中提取特征,供声学模型处理。同时,它普通也包括了一些信号处理技术,以尽能够降低环境噪声、信道、说话人等要素对特征形成的影响。

②统计声学模型:典型系统多采用基于一阶隐马尔科夫模型停止建模。

③发音词典:发音词典包含系统所能处理的词汇集及其发音。发音词典实践提供了声学模型建模单元与言语模型建模单元间的映射。

④言语模型:言语模型对系统所针对的言语停止建模。实际上,包括正则言语,上下文有关文法在内的各种言语模型都可以作为言语模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。

⑤解码器:解码器是语音辨认系统的核心之一,其义务是对输入的信号,根据声学、言语模型及词典,寻觅可以以最大概率输入该信号的词串。

[attach]412515[/attach]


在语音控制技术蓬勃发展的明天,语音助手的适用性和兴趣性在同步提高。

随着大数据、机器学习、云计算、人工智能等技术的发展,语音辨认在一步步解放我们的双手,语音输入框也大有取代鼠标、键盘之势。

2018年高交会1号馆信息技术与产品展,就有思必驰智能机器人研讨院深鉴科技等知名企业将带来语音辨认方面的最新技术。

[attach]412516[/attach]


全链路智能对话定制平台

展位号:1B40

[attach]412517[/attach]


思必驰在多年智能语音技术基础上,以Dialogue为核心,结合GUI和VUI,自主研发了全链路智能对话定制平台——DUI,为开发者提供超高度定制的人机对话处理方案,为传统厂商完成智能晋级,为创新企业提供核心交互才能。首创启示式智能交互技术,并结合复杂结构知识管理技术,推出新型对话机器人定制平台——会话精灵。会话精灵旨在经过人机交互范畴的前沿技术研讨,为企业提供真正的交互式智能助理服务。

笛卡尔高效语音辨认引擎

展位号:1A35

[attach]412518[/attach]


该语音辨认引擎应用深鉴科技独有的深度紧缩才能,可以在保持精度的同时将神经网络紧缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上,其核心加速引擎可以分明降低语音辨认的延时,同时达到更低的功耗。根据单句语音辨认反复测试的结果,DDESE端到端语音辨认的计算速度是同等级GPU的2倍,其中LSTM部的加速比超过2.5倍。该款产品次要运用于语音辨认场景,可为用户提供端到端语音辨认加速服务。

[attach]412519[/attach]


欢迎大家来高交会

亲身感受人机互动会话的魅力

▼▼▼点击阅读原文获取高交会更多信息
作者: z900721    时间: 2020-7-2 13:03
好棒的分享楼主多写点吧,写完记得通知我,哈哈
作者: 古古古敬文    时间: 2020-7-3 08:30
加油!不要理那些键盘侠!
作者: 日出印象    时间: 2020-7-4 17:42
前排,哇咔咔




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4