找回密码
 立即注册
搜索

广播百科 语音识别技术

∧   更多内容推荐,请关注我们


第 301 期




语音识别技术:也被称为自动语音识别(AutomaTIc Speech RecogniTIon,缩写ASR),简单来说就是利用计算机将语音信号自动转换为文本的一项技术。这项技术同时也是机器理解人类言语的第一个也是很重要的一个过程。

其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别就好比“机器的听觉系统”,它让机器通过识别和理解,把语音信号转变为相应的文本或命令。


语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术。


在人际交往中,言语是最自然并且最直接的方式之一。随着技术的进步,越来越多的人们也期望计算机能够具备与人进行言语沟通的能力,因此,语音识别这一技术也越来越受到关注。尤其,随着深度学习技术应用在语音识别技术中,使得语音识别的性能得到了显著提升,也使得语音识别技术的普及成为了现实。


语音识别的基本原理


所谓语音识别,就是将一段语音信号转换成相对应的文本信息,系统主要包含特征提取、声学模型,语言模型以及字典与解码四大部分,其中为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等预处理工作,把要分析的信号从原始信号中提取出来之后,特征提取工作将声音信号从时域转换到频域,为声学模型提供合适的特征向量;声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分;而语言模型则根据语言学相关的理论,计算该声音信号对应可能词组序列的概率;最后根据已有的字典,对词组序列进行解码,得到最后可能的文本表示。
 
语音识别技术原理框图



语音识别系统的分类


1、        根据识别对象的不同


  • 孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;
  • 连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;
  • 连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。


2、        根据针对的发音人


  • 特定人语音识别只能识别一个或几个人的语音,非特定人语音识别则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。


3、        根据语音设备和通道


  • 不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。


语音识别系统的结构


主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分,下图中给出了语音识别系统的基本结构。

 
语音识别系统的基本结构框图



语音识别的过程是一个模式识别匹配的过程。在这个过程中,首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模式。而在识别过程中要根据语音识别的整体模型,将输入的语音信号的特征与已经存在的语音模式进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音相匹配的模式。然后,根据此模式号的定义,通过查表就可以给出计算机的识别结果。


语音识别技术的工作流程


一般来说,一套完整的语音识别系统其工作过程分为7步:
1、对语音信号进行分析和处理,除去冗余信息。
2、提取影响语音识别的关键信息和表达语言含义的特征信息。
3、紧扣特征信息,用最小单元识别字词。
4、按照不同语言的各自语法,依照先后次序识别字词。
5、把前后意思当作辅助识别条件,有利于分析和识别。
6、按照语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,同时根据语句意思调整句子构成。
7、结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正。









语音识别技术的应用


1、制造业
在质量控制中,语音识别系统可以为制造过程提供一种“不用手”、“不用眼”的检控(部件检查)。


2、电信
相当广泛的一类应用在拨号电话系统上都是可行的,包括话务员协助服务的自动化、国际国内远程电子商务、语音呼叫分配、语音拨号、分类订货。


3、医疗
这方面的主要应用是由声音来生成和编辑专业的医疗报告。


4、其他
包括由语音控制和操作的游戏和玩具、帮助残疾人的语音识别系统、车辆行驶中一些非关键功能的语音控制,如车载交通路况控制系统、音响系统。


结语


随着移动互联网技术的不断发展,尤其是移动终端的小型化、多样化变化趋势,语音识别成为区别于键盘、触屏的人机交互手段之一。随着语音识别算法模型、自适应性的加强,相信在未来很长一段时间内,语音识别系统的应用将更加广泛与深入,更多丰富的移动终端语音识别产品将步入人们的日常生活。




- END -

欢迎投稿及发表观点,小编在留言区等您。
















     

     





关注广播行业科技发展 
推动行业科技创新实践
[img=111,auto]http://bbs.cnaiplus.com/source/plugin/csdn123com_weixin/display_picture.php?url=http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FZW3TnHH1ria5ogdTRcTOSTQcI6S5IGY1KambjM9sgwmoK3tiaUPhCCpMHB16GibuRMOEIbVcM4f7qpumibOXialIvOw%2F640.jpeg%3F[/img]广播|科技|百科|资讯




进入行业交流群、合作事宜请联系微信号banshouge
投稿邮箱:cnradiotech@163.com

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies