腾讯公司取得语音识别模型训练专利，提升新知识领域的语音识别能力

hanqian 发表于 2024-1-29 17:09:12

金融界2024年1月29日消息，据国家知识产权局公告，腾讯科技（深圳）有限公司取得一项名为“语音识别模型的训练方法、装置、设备及存储介质“，授权公告号CN113393841B，申请日期为2020年10月。

专利摘要显示，本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质，涉及机器学习领域。该方法包括：调用语音识别模型对原始语音进行语音至文本的转换，得到识别文本的文本可信度；若文本可信度小于可信度阈值，将原始语音存储至待处理样本集合中；调用语音识别模型对标注后的语音进行语音至文本的转换得到语音的音素数据，标注后的语音携带参考音素数据；基于音素数据与参考音素数据之间的音素识别损失进行模型训练，得到优化后的语音识别模型。该方法有针对性的筛选出文本可信度较低的语音数据，来训练语音识别模型在新知识领域的语音识别能力，无需采用大量该领域的语音数据来训练，进而无需在语音数据的人工标注上耗费大量人力成本。

本文源自金融界

一品万绿 发表于 2024-1-30 07:00:36

路过的帮顶

墨遥夜 发表于 2024-2-1 12:19:50

结束了嘛？有种还没完成的感觉，嘻嘻

页: [1]

智客公社's Archiver

腾讯公司取得语音识别模型训练专利，提升新知识领域的语音识别能力