科大讯飞申请语音识别专利，提高复杂噪声场景中的语音识别准确性

河之舞 · 2024-4-28 22:00:33

金融界2024年4月10日消息，据国家知识产权局公告，科大讯飞股份有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“，公开号CN117854507A，申请日期为2023年12月。

专利摘要显示，本申请提供一种语音识别方法、装置、电子设备及存储介质，所述方法包括：采集目标场景下的视频图像和语音信息，并对所述视频图像进行图像切割和人脸检测，获得每个人脸的唇部区域；根据所述语音信息和所述唇部区域，确定目标对象的语音片段，所述语音片段用于表示语音和唇部运动的关联性；将每个目标对象的语音片段从背景语音中分离出干净语音，并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。

本文源自金融界

情有独钟祥 · 2024-4-29 07:01:34

来啊，互相伤害啊

孔唯允 · 2024-4-30 13:55:13

KFC外送员 · 2024-5-1 21:07:45

无论是不是沙发都得回复下

		自动登录	找回密码
密码			立即注册

科大讯飞申请语音识别专利，提高复杂噪声场景中的语音识别准确性

大神点评3

最近发表

公社版块

关注我们