找回密码
 立即注册
搜索

对话清华“华智冰”研发团队,揭秘国内首个原创虚拟先生幕后故事

“我是怎样诞生的?我能了解我本人吗?”画面中,一个扎马尾辫、背红色双肩包的女生散步在清华校园里。她叫“华智冰”,是我国首个原创虚拟先生。

对话清华“华智冰”研发团队,揭秘国内首个原创虚拟先生幕后故事-1.jpg


“华智冰”成果发布会上公布的“华智冰”相貌。清华大学供图

往年6月,这名特殊的先生退学清华大学计算机系,“师从”清华大学计算机系长聘教授、系副主任唐杰,自此开启它的学习和研讨生涯。

有容貌、有声响,会作诗、会画画、会跳舞……“华智冰”笼一致经公布,惹起大量关注。她由清华大学计算机系、北京智源研讨院、智谱AI和小冰公司结合培育,也因此得名。据悉,华智冰还将具有一定的推理和情感交互的才能;她还拥有持续学习才能,可以逐渐“长大”,变得越来越聪明。这使她大大不同于普通的虚拟人物。

对话清华“华智冰”研发团队,揭秘国内首个原创虚拟先生幕后故事-2.jpg


清华大学发布的“华智冰”宣传片中的镜头。清华大学供图

其实,“华智冰”背后是一个“智能数字脑”,她的脸部、声响都是经过人工智能模型生成。“我们教给华智冰,说话的时分不光要有口型和表情,还要有肢体动作;不光如此,我们还希望她可以跳舞。”清华大学计算机系长聘副教授、系党委副书记贾珈在研发团队中担任“华智冰”的内在笼统及声响、表情、口型、肢体动作的生成。“希望下一次可以让大家看到‘华智冰’跳舞可以达到清华舞蹈队的程度。”

作为一个虚拟人,“华智冰”的言语才能也极为重要。清华大学计算机系长聘副教授黄民烈指出,今后还要处理更复杂的义务,比如让“华智冰”跟同窗聊天,协助处理部分心思辅导的义务。这就需求自创心思学实际,设定特定的心情支持对话框架。

“华智冰如今的次要身份是‘先生’,不断‘学习’是她当前最重要的工作。”唐杰说,“我们等待,将来的‘华智冰’可以在多项认知智能上超过人类。或许到那时,她就可以毕业了。”

但“华智冰”的“人设”是如何定位的?她会无情感吗?她什么时分毕业、毕业之后将会做什么?带着这些疑问,新京报记者和“华智冰”的导师、清华大学教授唐杰及研发团队其他成员一同聊了聊。

制定三年学习计划,首年“遍读天下书”

新京报:“华智冰”是首个中国原创虚拟先生,“人设”为什么定位为一个本科生?

唐杰: 如古人工智能虽然曾经获得很大成就,但间隔认知AI还很远,从这个层面,把“华智冰”定位为小先生都可以。我们把她定位为一个非常聪明、但还没那么聪明、长大速度很快的角色。她的优势之一是可以一天24小时不断学习,所以长大速度非常快。

新京报: “华智冰”到目前拥有哪些技能?

唐杰:“华智冰”可以做自动问答,你给一个成绩,她可以自动生成答案。另外,给定一个文字,她可以围绕其作诗,也可以画图。她还可以写短文、做音乐等。

对话清华“华智冰”研发团队,揭秘国内首个原创虚拟先生幕后故事-3.jpg


“华智冰”创作的诗画作品。清华大学供图

新京报: “华智冰”的才能相当于人类多少岁的程度?

唐杰: 从记忆方面讲,她的数据规模曾经达到几个T,甚至包罗了网上能找到的一切的网页数据、图片数据,所以“华智冰”记忆才能其实曾经超过了人类;假如从推理、逻辑、计算才能上讲,能够她的才能只要几岁。所以假如和人相比,她的才能是参差不齐的。

新京报:“华智冰”还具有一定的情感交互的才能。机器人能够无情感吗?怎样表现?

贾珈: 情感计算是一个非常重要的研讨方向。根据研讨,情感是可计算、可量化的。我们希望“华智冰”是一个情商非常高的数字人,希望她能在言语生成过程中做合适的情感表达。我们教给“华智冰”的原始数据是2250万G,在国内规模比较大,覆盖中性情感和六类人类情感基本语料库。

新京报: “华智冰”接上去在清华大学计算机系有什么样的“学习”计划?

唐杰: 当下我们制定了短期的三年计划:第一年,我们希望她能泛读天下书,说白了就是要读全世界的数据;第二年做“精读”,了解可以更深入。第三年,希望她可以有创造才能,创造出全新类型的东西。

新京报:“华智冰”能否会有一个全体笼统?

唐杰: 我们有计划做2D和3D建模。至于很多人关注的能否要把她做成实体机器人,这是个有争议的成绩。对于实体到底能提供多少智力上的改变或增量,我们还在讨论,要不要去做这件事还没有得出100%的结论。

大批团队成员凭兴味“自带干粮”加入

新京报:“华智冰”的诞生用了多久?过程中最难的是什么?

唐杰: 清华的团队很早就在做相关积累,我们实验室大概做了25年的知识工程相关研讨。“华智冰”项目本身做了大概一年多。

过程中难点还挺多的。去年大家看到美国AI实验室Open AI发布了大规模预训练模型GPT-3,当时我们也想做一个大模型,但我们面临的成绩是:没数据、没算力、没有人。

后来,我们跟很多数据公司合作,经过共享方式获得新数据。为处理人力成绩,我们找了很多教师,问“你有没有兴味来收费做这个事儿”,后来很多教师自愿、自带干粮参与出去,全凭情怀和兴味,这些教师有校内的、也有校外的。没有算力怎样办?我的先生有好几个团队,在一个CPU的基础上重新开发底层,他们那段工夫“轮番熬夜”,渐渐才把程序写出来。“华智冰”也得到了学校、系里各位教师同窗的大力支持。

新京报: 研发过程能否有清华大学先生参与?

唐杰: 有非常多的先生参与,我们整个团队大概有一百多人,其中大概有七八十个先生,当然也有很多年轻教师、博士生参与到这个团队中。这次用到的超大规模的数据、超大规模的算力、超大规模的智力集群,对团队一切人包括我本人都是很好的长大和锻炼。

新京报:“华智冰”将来将运用于哪些场景?

唐杰:“华智冰”曾经末尾探求多种相关运用,比如在招生等方面的运用。将来,在养老、人机陪伴方面,运用能够最广泛。还可以把人工智能技术运用到传统行业中,比如物流、金融等。能够将来某一天,你的理财顾问就是一个数字人,用人机交互的方式做引荐,引荐精度比人还要高。

新京报记者 冯琪 校正 柳宝庆
回复

使用道具 举报

大神点评3

何欢 2021-6-18 07:10:32 显示全部楼层
一直在看
回复

使用道具 举报

不错 支持一个了
回复

使用道具 举报

云雀ing 2021-6-19 22:59:12 来自手机 显示全部楼层
鄙视楼下的顶帖没我快,哈哈
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册