【教学基地】语音识别基础(一)

a胡大雄 · 2018-10-15 11:30:35

labview语音识别基础

（预处理部分）

labview软件自带了声音采集功能，本节课利用【声音采集】功能来学习语音识别【预处理】部分，通过讲解我们会进一步熟练对信号的操作，接下来开始布置这节课的任务：

采集语音，提取出有效声音数据片段；
对声音片段进行频率和幅值分析；
实现单一频率纯度分析；

语音识别思维导图

1.将语音模板录入数据库；

2.采集样本，数据库声音比对；

3.根据比对结果，选择执行动作操作；

1.声音信号采集和预处理代码

1：因为启动采集需要时间，所以裁剪去掉信号的前1秒部分；

2：动态信号 [添加] [时间标识]，转变为波形信号，然后 [归一化] 处理；
3：对信号进行 [二极管与电容] 处理，将波形轮廓信号；
4：对信号进行 [三极管] 处理，得到红色方波信号；
2.声音数据边沿分析代码

1:因为声音信号数据量大，进行50倍 [采样压缩] ，为 [寻找] [上升下降沿] 时间标识做准备；
2：产生 [上升沿模板] 和 [下降沿模板] ；
3： [全文搜索] 上升沿，得到引索位置，全文搜索下降沿，得到引索位置，合并为二位数组；
4,： [引索位置] 数据，转换为 [时间位置] 数据；
3.有效声音数据剪切代码

1：通过for循环，自动对数据进行 [行解析] ；
2：脉冲起始和结束时间，计算 [长度] ；
3：对 [原始信号] 进行分段剪切；

录制一段几秒的音频， [去掉首尾] 静音部分，检测出基本频率和平均声音强度；将音频剪切成 [很多音频段] ，逐个分析每一小段的 [基础频率] 和 [强度] ，得到两个一维数组，将频率数组设为纵坐标，将强度数组做为横坐标，得到很直观的频率幅度XY分布图。
叙述和原理很简单，核心是 [剪掉静音] 的方法和 [剪切成n个小段] 的方法，接下来开始学习相关内容：
4.声音片段分析代码

（下一节讲解）

5.数据数组整体分析

(下一节讲解)

6.声音识别整体流程框架

[带*号三角] 随机采集一个人的语音信息；
[绿色菱形] 声音特征匹配验证；
[双红色菱形] 验证通过识别成功；
[双三角形] 需要录入数据库的语言信息；
[红色菱形] 声音特征与权限录入数据库；

（添加微信公众号可查看大图）

学习的最快方法就是做实践，一个项目会涉及多方面知识，一点点学习消化，学无止境。

" 本设计制作为原创公益教学课程，内容版权归所有，仅供学习，不得用于获利性活动。"

——梦魄@行动（2018/10/15）

lu yuan bin

" The quickest way to learn is to practice, a project will involve a wide range of knowledge, a little learning digestion, endless learning. "
" This design is an original public welfare teaching course. The copyright of the content belongs to . It is only for study and not for profit-making activities."

——Dream doing（2018/10/15）

luyuanbin

千里优选教学基地
微信公众号:qlyxgy
03021
[size=13.3333339691162px]
主页入口

		自动登录	找回密码
密码			立即注册

【教学基地】语音识别基础(一)

本帖子中包含更多资源

最近发表

公社版块

关注我们