金融界2024年11月22日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“一种语音识别方法及相关装置、设备和存储介质”的专利,公开号CN 118982986 A,申请日期为2024年7月。
专利摘要显示,本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
本文源自金融界 |