找回密码
 立即注册
搜索

能听懂30种方言!方言语音识别大模型来了

能听懂粤语、上海话、四川话、温州话等30多种方言,大模型中的方言“小天才”上线。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。这是业内首个开源的、基于离散语音表征的语音识别大模型。

中国地域广阔,汉语的方言众多,并且各种方言语法语音特征各不相同。各地方言常以口语形式流传,缺乏对应文字,导致可用于模型训练的方言语料数据偏少,这些问题都给方言研究带来不便。

想要把大模型训练成方言“天才”,方言数据库是关键。据悉,该人工智能研究院已构建超30种、超30万小时的高质量方言数据库。基于大量的方言数据库,研发团队首创“蒸馏+膨胀”联合训练算法,让大模型在海量多场景的数据库条件下,也能实现稳定的训练。

据悉,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服试点应用。此外,该大模型还落地多地市的12345平台。

来源:北京日报客户端

记者:夏骅
回复

使用道具 举报

大神点评3

zey77433 2024-5-27 13:38:35 显示全部楼层
好帖必须得顶起
回复

使用道具 举报

森sam 2024-5-27 18:44:36 显示全部楼层
围观 围观 沙发在哪里!!!
回复

使用道具 举报

Tomarctus 2024-5-28 07:00:26 显示全部楼层
我只是路过,不发表意见
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies