金融界2024年12月25日消息,国家知识产权局信息显示,重庆位图信息技术有限公司申请一项名为“一种语音识别模型的训练方法、语音识别的方法及装置”的专利,公开号CN 119170004 A,申请日期为2024年9月。
专利摘要显示,本发明提供了一种语音识别模型的训练方法、语音识别的方法及装置,所述方法包括:获取待识别的语音数据,对语音数据进行预处理,得到音频Fbank特征和文本数据编码结果;基于预处理得到的音频Fbank特征和文本数据编码结果,对语音识别模型进行预训练,得到音频编码器和CTC分类器;将音频Fbank特征输入到音频编码器中进行编码处理输出音频特征序列采用预训练得到的CTC分类器对编码后的音频特征序列进行去冗余处理,得到精简后的音频编码特征;通过去除冗余后的音频编码特征对语音识别模型中的Transformer解码器进行微调训练,得到完成训练的语音识别模型。本发明解决了现有技术存在的关于如何有效提高解码速度和精度以及语音识别效果的问题。
本文源自金融界 |