金融界2025年1月18日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“多语种自动语音识别方法、装置、计算机设备及存储介质”的专利,公开号 CN 119314486 A,申请日期为2024年10月。
专利摘要显示,本申请实施例属于人工智能领域,涉及一种多语种自动语音识别方法,包括对输入语音进行处理,得到语音嵌入向量序列;基于预训练的ByT5模型的编码器提取语音嵌入向量序列的特征,得到语音嵌入向量序列的比特编码;将语音嵌入向量序列的比特编码按照预设的输入数据结构输入至ByT5模型的解码器,ByT5模型的解码器解码后按照预设的输出数据结构输出目标语言文字的比特编码;将ByT5模型的解码器输出的目标语言文字的比特编码组成序列作为下次的输入再进行解码生成目标文本序列本申请还提供一种多语种自动语音识别装置、计算机设备及存储介质。本申请成功实现了信息从音频到文本的跨模态转换。
天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币,实缴资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目273次,知识产权方面有商标信息70条,专利信息5000条,此外企业还拥有行政许可19个。
本文源自金融界 |