找回密码
 立即注册
搜索

科大讯飞申请语音识别专利,提高复杂噪声场景中的语音识别准确性

金融界2024年4月10日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“,公开号CN117854507A,申请日期为2023年12月。

专利摘要显示,本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:采集目标场景下的视频图像和语音信息,并对所述视频图像进行图像切割和人脸检测,获得每个人脸的唇部区域;根据所述语音信息和所述唇部区域,确定目标对象的语音片段,所述语音片段用于表示语音和唇部运动的关联性;将每个目标对象的语音片段从背景语音中分离出干净语音,并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。

本文源自金融界
回复

使用道具 举报

大神点评3

情有独钟祥 2024-4-29 07:01:34 来自手机 显示全部楼层
来啊,互相伤害啊
回复

使用道具 举报

孔唯允 2024-4-30 13:55:13 显示全部楼层
回复

使用道具 举报

KFC外送员 2024-5-1 21:07:45 显示全部楼层
无论是不是沙发都得回复下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies