找回密码
 立即注册
搜索

“华智冰”为何是本科生?将来学习如何规划?清华逐一揭秘

澎湃旧事记者 程婷



清华计算机系副教授、系党委副书记贾珈引见“华智冰”的三种表情设计。本文图片 澎湃旧事记者 程婷 图

近日,清华大学计算机系知识工程实验室的一名特殊重生——中国首个原创虚拟先生“华智冰”,引发社会关注。

数字虚拟人“华智冰”拥有持续的学习才能,可以逐渐“长大”,不断“学习”数据中隐含的形式,包括文本、视觉、图像、视频等,就像人类可以不断从身边阅历的事中来学习行为形式一样。随着工夫的推移,“华智冰”可以从新场景中学到新才能,并无机地融入本人的模型中,从而变得越来越聪明。

6月15日,清华计算机系举行“华智冰”成果发布会,正式宣布“华智冰”退学清华计算机系,师从清华计算机系副主任唐杰教授,并开启在清华的学习和研讨生涯。

“华智冰”为何被设定为一名清华本科生?她在清华的“本迷信习”计划是怎样样的?相比普通虚拟人,“华智冰”有哪些过人之处?将来“华智冰”能否投身社会服务工作?她会不会被打形成可以真正行走在清华校园的实体机器人?对于澎湃旧事提出的这些成绩,研发团队的教师们逐一停止了解答。



“华智冰”的教师、清华计算机系副主任唐杰教授引见希望“华智冰”具有的9种才能。

“华智冰”的人设为何是一名本科生?

“华智冰”为何被定义为本科生?

“其实目前也可以说‘华智冰’还是小先生。”唐杰告诉澎湃旧事,“我们把它定义为一名本科生,是由于她非常聪明,而且在疾速长大,但她好像又没那么聪明,还有很多东西要学。她可以作诗,写短文章,做音乐,但是她又并没有一下子就完全超越了我们。”

理想上,如今的“华智冰”曾经会四种舞姿,可以根据音乐的急缓调整动作,可以根据某个字作诗,也可以根据某几个关键词创作一幅画,甚至可以写一些短的文章了。

研发团队告诉澎湃旧事,在下一阶段会向“华智冰”输入大量的琴棋诗画数据,以及一些其它目的数据,让她变得越来越聪明。

谈及“华智冰”为何被设定为清华先生,唐杰解释道,“我们研发团队的大部分人是清华人,大家觉得假如设计一个AI(人工智能)主体进入清华,让她不断长大,这是一件很让人引以为豪的事。”

多才多艺的“华智冰”会不会写旧事报道?唐杰告诉澎湃旧事,“让她写一篇关于某件事的一两百字的音讯稿,她能写得比较准确。我们在教育她的过程当中,展现一些内容给大家猜是‘华智冰’写的还是人写的,很多时分大家曾经很难猜出来了。但让她写一篇高考作文还有点难,或者说她可以写得出来,但得不了高分。这方面还需求不断培育,我们会向她输入大量的语料数据,让她不断停止学习——她可以24小时不断学习,长大速度会非常快。”

关于“华智冰”的学习义务安排,她的导师唐杰表示,一年内希望华智冰能“泛读”天下书,把现有的一切数据都读出来,学习足够多的语料;第二年希望“华智冰”从数据中挖出一些隐含形式,把一些深层的知识学上去;第三年希望她可以像我们人一样创新、产生新的知识。远期目的是,希望“华智冰”具有认知才能,像人一样思索,甚至在很多义务上超越图灵测试,获得通用机器学习的认知才能。

研发团队希望,“华智冰”可以依托一个大模型,在面对不同的学习阶段和运用场景时,不是重新训练模型,而是反过来丰富、加强模型。

虚拟人“华智冰”会否被打形成实体机器人?

近期“华智冰”的宣传短片出来后,一些网友误以为“华智冰”是一个能穿着白球鞋行走在清华校园中的具象仿真机器人。

将来,“华智冰”能否会被打形成实体机器人?她将以什么为载体来与大众见面?

对此,唐杰告诉澎湃旧事,“华智冰”2D和3D的笼统后续会发布,那是一个完全相似真人的虚拟笼统。

至于能否打造实体机器人,唐杰表示,这是一个有争议的成绩。

“实体机器人到底给AI提供了多少智力上的改变?需不需求做这件事?这些我们还在讨论,还没有得出一个100%的结论。”唐杰说,“我们尝试过将‘华智冰’装进一些实体机器人中,但这并不表示她就是一个实体,或者她因此获得了多大增量。”

“华智冰”与其他虚拟人有何区别?

谈及“华智冰”与其他虚拟人的区别,唐杰说,“‘华智冰’相当于把笼统和大脑结合起来了。我个人的想法是将它真正主体化,让她可以像自然人一样与人交流互动。这种交流对话是基于她所具有的条感性与逻辑性,结合上下文本人重生成的,而非针对预设成绩与答案检索出来一些既定的回答或语句。”

虽然将来能否会有实体机器人版的“华智冰”尚无定论,但唐杰以为,将来十年各种实体机器人会越来越常见,或许会迎来一个实体机器人的时代。

相似真人的仿活力器人,唐杰以为将来也会有很多,但做成一个非常接近真人的实体机器人并非科研的终极目的,而把一个人工智能人做成什么形状,更多是要看它的功能定位。比如一个送餐机器人,它在功能设计中是托盘越大越好、安全性越高越好,而非越像真人越好。

“华智冰”的出现会对人工智能范畴的发展产生哪些影响?在唐杰看来,最大的影响就是人工智能将由原来的算法为主,变为将来的AI主体为主。“这算是一项创始性的研讨,将来能够有很多人会以‘AI主体’的思想,来重新思索和定位人工智能的发展。”唐杰说。

“算法为主”与“AI主体为主”之间有何区别?唐杰解释,人脸辨认表现的就是以算法为主体的思想,而AI主体思想,就是将人工智能的大脑看作一个主体,这个主体会有本人的人设,会本人学习、长大,甚至具有智商与情商,可以本人做一些决策。

“华智冰”背后:百人团队24小时轮番熬夜攻关

“华智冰”是由清华计算机系、北京智源研讨院、智谱AI和小冰公司结合培育的。其核心组件是应用数据和知识的双轮驱动,打造了一个“智能数字脑”,这一数字脑不只能搭载在实体机器人上,将来还能装在数字人、全息人、手机和电脑上,可以愈加方便地进入人们的日常生活。

这背后靠的弱小研发团队支撑。唐杰引见,有100多人参加“华智冰”项目的研发攻关。这100多人中,有七八十名清华先生。在算法部分,比如将文字转为图画,或者经过文字生成文字等很多工作,是清华的博士生及青年教师等参与完成的。

在“华智冰”的诞生过程中,研发团队也克制了很多困难和成绩。

唐杰说,研讨之初,团队想做一个大模型,但面临着没数据、没算力、人不够等诸多成绩,后来找了很多数据公司合作,希望经过共享形式推进合作,一步步处理成绩。

“为了处理研讨人员的成绩,我们也找了很多校内校外的教师,后来很多教师全凭兴味自愿‘自带干粮’一同加入到了项目中。”唐杰说。

此外,做大模型后台需求很多CPU,需求弱小算力。为了处理算力成绩,研发团队成员合作,在一个CPU的基础上重新停止了底层开发,设计模型。

“那段工夫我们的先生也跟着轮番熬夜,到了早晨12点,一拨人回去休息,换另一拨人来继续编程,跑程序,基本每天24小时都有人在工作。”唐杰回忆。

“华智冰”的整个研发工作已持续了一年多工夫的。如今的“华智冰”依托于有着超大规模人工智能预训练模型“悟道2.0”,达到1.75万亿参数,创下了全球当今最大预训练模型纪录。

虽然“华智冰”已退学清华,师从唐杰,但唐杰表示,“华智冰”将来长大还将继续实行多方结合培育。

“我们研发‘华智冰’是以情怀为主,并且她不是属于某人的资产,所以我们希望勾结和协调各方一同共同努力,探求人工智能的极限,让‘华智冰’变得越来越聪明。”唐杰说。

清华计算机系主任尹霞表示,推出虚拟先生“华智冰”,是希望把清华计算机系目前在人工智能范畴的各项技术交融在一同,借助“华智冰”,完成数据、知识双轮驱动的运用系统,并力争让她成为计算机实际和运用研讨深度交融的典型示范。

责任编辑:蒋晨锐

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册