金融界2024年4月10日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“,公开号CN117854507A,申请日期为2023年12月。
专利摘要显示,本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:采集目标场景下的视频图像和语音信息,并对所述视频图像进行图像切割和人脸检测,获得每个人脸的唇部区域;根据所述语音信息和所述唇部区域,确定目标对象的语音片段,所述语音片段用于表示语音和唇部运动的关联性;将每个目标对象的语音片段从背景语音中分离出干净语音,并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。
本文源自金融界 |