找回密码
 立即注册
搜索

【教学基地】语音识别基础(一)


labview语音识别基础

(预处理部分)

labview软件自带了声音采集功能,本节课利用【声音采集】功能来学习语音识别【预处理】部分,通过讲解我们会进一步熟练对信号的操作,接下来开始布置这节课的任务:
采集语音,提取出有效声音数据片段;
对声音片段进行频率和幅值分析;
实现单一频率纯度分析;
语音识别思维导图
1.将语音模板录入数据库;

2.采集样本,数据库声音比对;

3.根据比对结果,选择执行动作操作;



1.声音信号采集和预处理代码



1:因为启动采集需要时间,所以裁剪去掉信号的前1秒部分;

2:动态信号  [添加]  [时间标识],转变为波形信号,然后  [归一化]  处理;
3:对信号进行  [二极管与电容]  处理,将波形轮廓信号;
4:对信号进行  [三极管]  处理,得到红色方波信号;
2.声音数据边沿分析代码


1:因为声音信号数据量大,进行50倍  [采样压缩]  ,为  [寻找]  [上升下降沿]  时间标识做准备;
2:产生  [上升沿模板]  和  [下降沿模板] ;
3:  [全文搜索]  上升沿,得到引索位置,全文搜索下降沿,得到引索位置,合并为二位数组;
4,:  [引索位置]  数据,转换为  [时间位置]  数据;
3.有效声音数据剪切代码


1:通过for循环,自动对数据进行  [行解析] ;
2:脉冲起始和结束时间,计算  [长度] ;
3:对  [原始信号]  进行分段剪切;

录制一段几秒的音频,  [去掉首尾]  静音部分,检测出基本频率和平均声音强度;将音频剪切成  [很多音频段]  ,逐个分析每一小段的  [基础频率]  和  [强度]  ,得到两个一维数组,将频率数组设为纵坐标,将强度数组做为横坐标,得到很直观的频率幅度XY分布图。
叙述和原理很简单,核心是  [剪掉静音]  的方法和  [剪切成n个小段]  的方法,接下来开始学习相关内容:
4.声音片段分析代码

(下一节讲解)

5.数据数组整体分析


(下一节讲解)

6.声音识别整体流程框架

 [带*号三角] 随机采集一个人的语音信息;
 [绿色菱形] 声音特征匹配验证;
 [双红色菱形] 验证通过识别成功;
 [双三角形] 需要录入数据库的语言信息;
 [红色菱形] 声音特征与权限录入数据库;
(添加微信公众号可查看大图)



学习的最快方法就是做实践,一个项目会涉及多方面知识,一点点学习消化,学无止境。


" 本设计制作为原创公益教学课程,内容版权归所有,仅供学习,不得用于获利性活动。"
——梦魄@行动(2018/10/15)

lu yuan bin

" The quickest way to learn is to practice, a project will involve a wide range of knowledge,  a little learning digestion,  endless learning. "
" This design is an original public welfare teaching course.  The copyright of the content belongs to   .  It is only for study and not for profit-making activities."
——Dream doing(2018/10/15)

luyuanbin


千 里 优 选 教 学 基 地
微信公众号:qlyxgy
03021
[size=13.3333339691162px]
主 页 入 口

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies