金融界2024年12月10日消息,国家知识产权局信息显示,杭州智元研究院有限公司申请一项名为“一种特定场景下语音识别方法及系统”的专利,公开号 CN 119091866 A,申请日期为2024年9月。
专利摘要显示,本发明公开了一种特定场景下语音识别方法及系统,该方法包括训练阶段基于采集的数据集,通过Bilstm+WFST模型及ED模型分别进行识别,对二者的识别结果进行数据处理,得到高质量伪标签数据集,采用高质量伪标签数据集对Bilstm+WFST模型中的Bilstm模型及ED模型迭代训练,得到最优的Bilstm+WFST模型及ED模型;识别阶段:通过最优的Bilstm+WFST模型及ED模型分别作识别,对二者的识别结果打分,将得分较小者对应的识别结果文本作为连续语音识别的最终识别结果。本发明能利用特定场景无标注数据,提升特定场景下的语音识别效果。
本文源自金融界 |