河之舞 发表于 2024-4-28 22:00:33

科大讯飞申请语音识别专利,提高复杂噪声场景中的语音识别准确性

金融界2024年4月10日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“,公开号CN117854507A,申请日期为2023年12月。

专利摘要显示,本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:采集目标场景下的视频图像和语音信息,并对所述视频图像进行图像切割和人脸检测,获得每个人脸的唇部区域;根据所述语音信息和所述唇部区域,确定目标对象的语音片段,所述语音片段用于表示语音和唇部运动的关联性;将每个目标对象的语音片段从背景语音中分离出干净语音,并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。

本文源自金融界

情有独钟祥 发表于 2024-4-29 07:01:34

来啊,互相伤害啊

孔唯允 发表于 2024-4-30 13:55:13

:lol

KFC外送员 发表于 2024-5-1 21:07:45

无论是不是沙发都得回复下
页: [1]
查看完整版本: 科大讯飞申请语音识别专利,提高复杂噪声场景中的语音识别准确性