找回密码
 立即注册
搜索

易思态申请基于大语言模型的语音识别专利,提高语音识别准确度

金融界 2024 年 12 月 21 日消息,国家知识产权局信息显示,深圳市易思态科技有限公司申请一项名为“基于大语言模型的语音识别方法、装置、设备及介质”的专利,公开号 CN 119152858 A,申请日期为 2024 年 11 月。

专利摘要显示,本发明公开了基于大语言模型的语音识别方法、装置、设备及介质,该方法应用于管理服务器,包括将接收到的实时输入的音频流输入预设的流式识别模型,以得到相应的一阶段语音识别文本;根据所确定的断句点将音频流按时间顺序依次分割成若干段子音频流,并将所有的子音频流依次输入至预设的第一语音识别模型以得到对应的二阶段子语音识别文本;将与不同的第一断句点相关的二阶段子语音识别文本分次输入预设的大语言模型,以得到多个相应的修正后二阶段子语音识别文本,以得到与所接收到的全部音频流相应的目标语音识别文本。本方法可提高语音识别的准确度,通过大语言模型对断句位置进行修正和优化,提高了语音内容的还原度。

本文源自金融界
回复

使用道具 举报

大神点评3

四维钢铁 2024-12-22 08:21:36 显示全部楼层
LZ敢整点更有创意的不?兄弟们等着围观捏~
回复

使用道具 举报

LOveQzh倒数 2024-12-23 14:06:27 显示全部楼层
给你我的小心心
回复

使用道具 举报

百盛佳厨具 2024-12-24 19:58:13 来自手机 显示全部楼层
我也来顶一下..
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies