智客公社

标题: 科大讯飞申请语音识别专利,提高复杂噪声场景中的语音识别准确性 [打印本页]

作者: 河之舞    时间: 2024-4-28 22:00
标题: 科大讯飞申请语音识别专利,提高复杂噪声场景中的语音识别准确性
金融界2024年4月10日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“,公开号CN117854507A,申请日期为2023年12月。

专利摘要显示,本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:采集目标场景下的视频图像和语音信息,并对所述视频图像进行图像切割和人脸检测,获得每个人脸的唇部区域;根据所述语音信息和所述唇部区域,确定目标对象的语音片段,所述语音片段用于表示语音和唇部运动的关联性;将每个目标对象的语音片段从背景语音中分离出干净语音,并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。

本文源自金融界
作者: 情有独钟祥    时间: 2024-4-29 07:01
来啊,互相伤害啊
作者: 孔唯允    时间: 2024-4-30 13:55

作者: KFC外送员    时间: 2024-5-1 21:07
无论是不是沙发都得回复下




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4