找回密码
 立即注册
搜索

聚焦全球人工智能技术大会 爱数智慧CEO张晴晴分享多语种对话式AI的技术及运用

来源:环球网汽车



GAITC大会现场

【环球网汽车综合报道】6月5-6日,由中国迷信技术协会、中国迷信院、中国工程院、浙江省人民政府指点,中国人工智能学会、杭州市人民政府主办的2021全球人工智能技术大会在杭州召开。大会汇聚了来自世界各地的人工智能范畴院士专家,共同为人工智能的发展建言献策。本次大会采用线下线上同步直播方式,线上累计观看超过1300万人次,其中多语种智能信息处理专题论坛在线观看人数超过61万人次。

6日下午,在多语种智能信息处理专题论坛上,中国人工智能学会(以下简称:CAAI)多语种智能信息处理专业委员会正式成立。国务院参事、CAAI 理事长、中国工程院院士戴琼海,CAAI 声誉理事长、中国工程院院士李德毅,中国工程院院士、新疆多语种信息技术重点实验室主任吾守尔·斯拉木发表致辞。来自学术界、产业界的多位重磅嘉宾如百度CTO王海峰、科大讯飞研讨院执行院长刘聪、华为诺亚实验室语音语义首席迷信家刘群等带来了精彩演讲。



国务院参事、CAAI 理事长、中国工程院院士 戴琼海

爱数智慧创始人兼CEO张晴晴博士发表题为《多语种对话式AI技术及语料库建设》的主题演讲,引见对话式AI技术的的痛点,爱数智慧在多语种语料库建设的运用。



爱数智慧创始人兼CEO张晴晴博士

多语种对话式AI技术面临的痛点

对话式AI正在片面普及,在智能车载、智能家居、智能客服、智慧医疗、智能社交等场景中相继落地。从技术角度看,对话式AI触及语音辨认、自然言语了解和语音合成等技术,要想经过这些技术完成人和机器更自然的对话,需求克制哪些难题?

日常生活中对话式口语和电脑打字交流最大的区别是,对话式口语会有语序颠倒、犹疑迟疑产生的停顿,多人同时交流甚至出现语句打断、抢话、交叠音等复杂语音场景,这为AI建模带来很大困难。

随着全球文明进一步交流与交融,外语词汇夹杂到母语中现象愈发频繁,对话式口语在车载导航、音乐检索等场景中存在多语种混合表达成绩,比如“播放Taylor Swift的love story”等对话语句夹带个别英文单词或英文缩写。针对这些技术难点,爱数智慧从声学角度停止非母语发音字典建模和混合双语声学建模等,以此提高双语辨认系统功能。

多语种语料库建设 协助开发者重建“巴别塔”

从声学建模角度提高双语混合语音辨认功能上,爱数智慧在ASR,TTS和发音字典方面构建一致的音素集,就是将中英文,以及其他言语里相似的音素集停止一个聚类。由于人类器官发出的音素集是一个有限集,我们找到这些有限集后,可以涵盖一切的言语。这种方式可以在资源受限状况下进一步加大数据复用性,同时也添加了模型构建过程中的波动性。

作为提高双语辨认系统功能的另一重要模型——混合双语声学建模,我们运用什么样数据来停止对应的声学模型的训练,便会触及到训练数据集。

目前爱数智慧拥有超过150000小时数据集,其中超过90000小时对话式AI训练数据集,这些数据集经过多维度的标注,包括语音到文本的转换,以及说话兽性别、年龄、情感等标签,这些标签可以协助开发者在处理多言语对话式AI上提供更多的信息,从而协助优化对应的模型。

此外,爱数智慧拥有超过60种言语的数据集,还有部分针对外语数据构建的双语混合数据集,如泰语英语混合数据集、马来语英语混合数据集等,从而协助开发者处理混合语音辨认的成绩。

最后,多语种对话式AI研讨非常困难也是必然趋向,要完成世界言语无缝沟通交流这一终极目的,爱数智慧CEO张晴晴号召更多AI开发者投身多语种对话式AI的研讨范畴,推进对话式AI进一步发展,重建巴别塔!



多语种智能信息专题论坛现场合影

GAITC大会同期甄选51家优秀企业,参加全球人工智能技术博览会,爱数智慧与科大讯飞、阿里、百度、英伟达、快手、字节跳动和东风汽车等国内外知名企业悉数亮相。



GAITC大会博览会



人工智能技术大会博览会爱数智慧展台

中国工程院院士,新疆多语种信息技术重点实验室主任吾守尔·斯拉木莅临爱数智慧展台,了解爱数智慧核心技术及产品,并对MagicHub.io开源社区非常感兴味,吾守尔院士鼓励公司在多语种智能化研讨和运用上继续努力,完成无缝交流。



爱数智慧市场总监Helen在展台引见爱数智慧核心技术及产品



吾守尔·斯拉木院士参观爱数智慧展位并关注MagicHub.io开源社区



嘉宾参观了解爱数智慧展台和“MagicHub.io星斗大使”招募现场

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册