智客公社

标题: 科技热词 | 100秒了解语音识别技术 [打印本页]

作者: 只有士奇没有哈    时间: 2018-9-12 18:44
标题: 科技热词 | 100秒了解语音识别技术
[attach]40099[/attach]



提起语音识别,我们最容易想到的可能是不会讲笑话的 Siri;看过电影《Her》的朋友一定会对其中语音识别和控制的情节印象深刻;说句话就能控制所有电器开关、听音乐只需报出歌名……一直以来,人类都怀揣着与其他生物乃至机器进行语音交流的梦想,而现在,人工智能的飞速发展,使这一想象变为现实。
语音识别技术的广泛应用,让智能语音产品渗透到我们日常生活的方方面面。

科技热词解析
[attach]40100[/attach]
#语音识别技术#

简单来说其实就是利用计算机将语音信号自动转换为文本的一项技术,是将人类的声音信号转化为文字的过程。
所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等,甚至还涉及到人的体态语言(如人民在说话时的表情手势等行为动作可帮助对方理解)。
其应用领域也非常广,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统。


核心技术

▼▼▼

①信号处理及特征提取模块:该模块的主要任务是从输入信号中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。
②统计声学模型:典型系统多采用基于一阶隐马尔科夫模型进行建模。
③发音词典:发音词典包含系统所能处理的词汇集及其发音。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。
④语言模型:语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。
⑤解码器:解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。


[attach]40101[/attach]



在语音控制技术蓬勃发展的今天,语音助手的实用性和趣味性在同步提高。
随着大数据、机器学习、云计算、人工智能等技术的发展,语音识别在一步步解放我们的双手,语音输入框也大有取代鼠标、键盘之势。
2018年高交会1号馆信息技术与产品展,就有思必驰智能机器人研究院深鉴科技等知名企业将带来语音识别方面的最新技术。


[attach]40102[/attach]


全链路智能对话定制平台

展位号:1B40



[attach]40103[/attach]



思必驰在多年智能语音技术基础上,以Dialogue为核心,结合GUI和VUI,自主研发了全链路智能对话定制平台——DUI,为开发者提供超高度定制的人机对话解决方案,为传统厂商实现智能升级,为创新企业提供核心交互能力。首创启发式智能交互技术,并结合复杂结构知识管理技术,推出新型对话机器人定制平台——会话精灵。会话精灵旨在通过人机交互领域的前沿技术研究,为企业提供真正的交互式智能助理服务。


笛卡尔高效语音识别引擎

展位号:1A35



[attach]40104[/attach]

该语音识别引擎利用深鉴科技独有的深度压缩能力,可以在保持精度的同时将神经网络压缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上,其核心加速引擎能够显著降低语音识别的延时,同时达到更低的功耗。根据单句语音识别重复测试的结果,DDESE端到端语音识别的计算速度是同等级GPU的2倍,其中LSTM部的加速比超过2.5倍。该款产品主要应用于语音识别场景,可为用户提供端到端语音识别加速服务。


[attach]40105[/attach]


欢迎大家来高交会

亲身感受人机互动会话的魅力



[attach]40106[/attach]
▼▼▼点击阅读原文获取高交会更多信息




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4