找回密码
 立即注册
搜索

未来二十年,“人工智能体”会像人类一样感受这个世界吗?

在今年的全国两会上,“人工智能(AI)”再度成为“热词”。政府工作报告不仅 3 次提到“人工智能”,更首次提出了开展“人工智能+”行动。这一创新性的表述背后蕴含着深远的战略意义。人类即将进入“智力时代”!十年后谁不会用人工智能,就会被社会淘汰;而未来二十年,“人工智能体”会像人类一样感受这个世界,功能上人类能做的它都能做,性能上它比我们快多个数量级。北京智源人工智能研究院院长、智源研究院理事长、北京大学计算机学院教授黄铁军在国家科技传播中心讲坛上发表如上观点。
《国家科技传播中心讲坛》为中国科协打造的新型演讲类新知栏目,以科学精神,科技探索和科技产业为主要讲述内容,汇集相关领域顶尖科技工作者讲述科技创新故事,传播前沿创新成果,弘扬科学家精神。本文摘选部分以飨读者。





北京智源人工智能研究院理事长、北京大学计算机学院教授、多媒体信息处理全国重点实验室主任黄铁军发表《开启智力时代》的演讲


今天我们要讨论的话题是智力时代。开启智力时代的钥匙是人工智能,什么是人工智能?这个词有各种各样的定义。在此我用最简单的方式来定义它:人工智能就是研究开发具有智能系统的一门技术。



为什么要强调它是一门技术?因为现在很多对人工智能的偏见来自对它基本属性的错误认识。人工智能最基本的目的是研究开发或者制造智能系统。


有人说,我们连人的智能都搞不清楚,怎么可能做出一个智能的系统,甚至超过人的智能系统?这种说法有它的道理,但不适用于人工智能技术。人工智能要创造的是不曾存在的事物——越来越强的智能系统。所以人工智能的主要目的是先把具有智能的系统做出来,然后再研究它背后的奥秘和规律。





什么是人工智能






我们今天看到的很多人工智能系统,它有没有智能很显然是可以检测的,比如AlphaGo跟人下棋,它比人强大这件事是可以检验的。




AlphaGo为什么下出那么巧妙的棋?它的神经网络是怎么想的?它的机制是什么?我们不知道。但是未来我们可以去研究它、探索它、去寻找这些奥秘。这叫技术科学,是一门技术发展到一定地步、我们想知道人造复杂事物背后规律的时候,开始进入科学的阶段。


但目前的人工智能,我们首先要明确它还是一门技术。六七十年以来,做人工智能的基本思想其实并不复杂。


第一种叫“符号主义”,就是“好像会思考”,是人试图把思考过程形式化。这种情况下,即便它能做到一定的智能,也只是好像会思考,而不是真的自己在思考。


第二种叫“连接主义”,说得形象一点叫“必须有头脑”,意思是智能不是虚无缥缈的,它一定是某个物理载体上表现出来的一种能力。头脑就是我们的智能的载体,而今天讲的人工智能的载体就是人工神经网络。没有这样的物理载体是不可能产生智能的。


第三种叫“行为主义”。实现人工智能还需要一个条件,这对我们人来说也适用——必须身体好。身体不能动很多智能是没有办法训练的。可以跟人比的还有各种动物,它的身体形态不同,所产生的智能也不同。章鱼有8条腿,它的智能跟我们两条腿的智能肯定是不一样的。大家不要把“行为主义”当成神秘的东西,它只不过是一个物理实体跟环境互动过程中产生的一种功能、一种现象。







我们今天很少再去说符号主义、连接主义、行为主义了。今天最热门的词是深度学习、强化学习,还有类脑智能。这三个概念其实跟历史上的三个思想流派可以说是一脉相承的。比如说深度学习是什么?


深度学习就是借助深度神经网络,从今天海量的数据中学习,也就是用大量的数据去训练一个多层的神经网络。


强化学习跟我们刚才讲的行为主义基本思想完全一致,强化学习也发展了上百年。强化学习和深层神经网络也可以结合,结合之后就叫深度强化学习。


第三个概念,类脑智能,比前面两种思想方法更简单。人工神经网络怎么设计、网络结构怎么设计,很长时间是人摸索的。类脑讲的是以生物的神经网络为蓝本,把生物的神经网络搞清楚,照葫芦画瓢,照着生物神经网络抄作业,做一个人工神经网络。






“大模型”只是一个起点


但无论采用哪种方法都少不了一件事:智能一定是从数据,或者根本一点——从环境来的。今天已经找到这样的路线,训练人工智能系统的方法论就很清楚了。通常大家说大数据、大算力、强算法。



为什么叫大数据?很简单,智能来自于数据,数据越多,学到的智能越丰富,这是第一个要素。第二个要素,为什么要大算力?没有一个数学公式告诉你一个规则产生智能。智能一定是不断去调试,不断去尝试,不断去试错。第三个是算法,或者是训练神经网络的那套方法。现在基本上形成了可行的方法,但是还会有更优化的方法、效率更高的方法。
所以算法的探索仍然要继续下去,但无论如何今天算法已经可行,已经能够从大量的数据中训练出智能来,这是我们人工智能取得的巨大进步。


有了这三个要素后,越来越多的数据、越来越强的算力、越来越好的算法就训练出越来越大的模型,越大的模型它可能的智能程度越强。


大概从2019年开始,我所在的北京智源人工智能研究院就开始在这个方向上进行探索,跟国内国外很多机构合作来训练越来越大的模型。但是引起全世界高度关注的是ChatGPT——2022年11月发布的超大规模智能模型,全世界的人突然感觉到智能终于来了。


什么是大模型?这个词实际上是智源研究院在2021年3月份发布我们第一代模型时用的一个词,是“大模型”概念第一次登上历史舞台。当然国外当时叫预训练模型,也叫基础模型,但这两年全世界逐渐都叫大模型了。



所谓大模型,第一个要素是规模要足够大。现在的模型一般就是几百亿、几千亿、上万亿,将来可能还有更大的参数。这个参数就是刚才说的神经网络连接的数量。
今天的模型这么大,训练要这么多算力,是不是以后别再训练那么大的模型了?有些人甚至说要发展所谓的小模型,其实这个认识是错误的。今天的模型根本不够大,今天的模型只是起点。为什么说几百亿连接、一万亿连接都算不上什么?因为我们的对照物——我们的大脑,有100万亿连接,100万亿神经触突。今天我们最大的模型才一万亿,只有人脑连接的1%。当然1%也已经表现出很不错的能力了。大家不要期望短期内大模型变小,大模型一定会进一步变大。


我想做一个对比:大模型学的也是各种各样的论文、网页、各种各样的数据,人也是学这些东西。有什么区别?学的数据量不同。人一辈子能读的文字数量是有限的。读书破万卷,我们一生中能破万卷的人极其稀少;现在的大模型学的书动不动就是几百万本。人类迄今写了多少书?就算一亿册吧,很快大模型就会读完一亿册,我们穷其一生能读的数据量也到不了大模型的万分之一。
这只是书,还有几亿篇论文,以及各种各样的其他数据、报告、报表。我们任何人的通用能力都不及读遍天下所有文字材料的大模型。比如我,讲人工智能,讲计算机还可以,医学问题我就只知道一点点;但是大模型不一样,所有的学科对它来说都可以很专业。










智力时代即将到来






我们2021年做出第一代模型的时候,就在思考这意味着什么?首先意味着人掌握了一种能力,能训练出智能越来越强的模型,这对我们的经济社会、对全世界意味着什么?我们认为这意味着一个时代,也就是今天我讲的开启智力时代。


这个时代是什么样子的?我们今天看到的是一个模型,将来我们可能看不到模型。模型只是实现智力的手段,将来全世界所有的数据会实时地被一套训练系统获取,然后用来调整大规模神经网络的参数。
这样的模型会24X7地实时为所有的用户、所有的企业提供服务。它是个体系,就像今天我们发电,训练大模型就如同是法拉第最初让线圈在磁场里一转产生电流,今天用一堆数据去训练一个模型让它有某种能力,就像当年发电这样的突破。但是未来电力无处不在的时候,发电用电就是社会的基础设施。大模型背后的智力时代也是这样。






为什么是这样?大家稍微想一想就能得到结论:你会训模型,我也会训模型,最后哪个模型会被使用?一定是最聪明的模型、了解世界最新进展变化的模型。最聪明的模型会有那么多吗?最聪明的只会有一个,它有能力源源不断地把所有可能的数据抓去进行24X7的训练。一旦这个24X7的超大模型训练和服务体系建立之后,人类就真正进入了智力时代。


智力是这个社会运行的最重要的要素。我们今天雇那么多聪明人,花那么多工资,就是在用他的智力。如果这个智力可以靠机器、靠一个庞大的基础设施来提供,社会肯定会发生翻天覆地的变化。智力是流通的,智力不会封锁在某一个公司、某一个模型里面。将来来自于机器的智力是服务全社会的一种能力,它可以像工业革命那么伟大,它可以像电力那样无处不在——整个社会智力无处不在,智能载体无处不在。在这过程中智能程度也会越来越高,高到比人还要强,今天在某些方面已经比人强了。大家关心的是在所有方面都比人强的AGI——人工通用智能。


大约是从2014年,我们开始解析生物的眼睛,试图构造一个像生物眼睛一样的视觉传感器。今天的视觉传感器用的都是摄像头。监控摄像头、手机摄像头这些是很落后的,它早在1839年时就发明了,它拍出的是一幅幅的静止照片或视频——每秒钟几十幅图像,依然还是静止的思维。






生物不是这样的。生物的眼睛送给生物大脑的是神经脉冲,生物视觉表达信息所用的方式是连续的,手段是离散的。神经脉冲表达信息的丰富程度、连续程度要比今天的图像视频巧妙得多。借鉴这样的生物机制,我们做了一个仿生传感器。


一旦我们把生物的神经网络用电子的方式实现,速度会快很多倍,就像人跟计算机没法比计算一样。我们用生物眼睛看到世界是连续的,但眼睛中每个神经元每秒钟发放的神经脉冲数量有限,通常不会超过10个。很慢速的生物装置一旦变成电路、芯片,可以快1000倍。平常我们照相时手一晃,照片就会模糊,但用这种仿生电眼来拍照,每一张图像都不会模糊;坐在高铁上看对侧高铁从窗前飞驰而过时,是看不清楚上面的字的,但拿电眼来看就看得很清楚,拍超音速过程都可以清清楚楚。它并不比我们的眼睛巧妙,但性能会强大得多。


这就是人工智能可怕的地方:它学了天下几乎所有的知识,以比我们快几千倍的速度运行。诸如视觉,就比我们快三个数量级甚至更高。对比之下,我们通常说人跟人之间的快还只是百分之多少,比如说“比李小龙的速度快20%”。


我认为未来三年大家一定会体会到语言大模型能力扩展到视觉、听觉、具身(有身体的机器人)。高级智能机器人出现的时间会稍微远一点,近一点出现的是自动驾驶和行动能力。到那时大家的感受一定会更深,那时的AI可不只是聊天说得头头是道,以及产生一些图像、生成几个报告,远不只是这样,它一定是作为新的智能体进入我们的生活。到那个时代,智力的生成和智力的应用会无处不在,每个人、每个企业、每个组织都会使用。


这种智力时代我认为未来十年左右的时间就会建成,那时就像今天用电一样去用智力,将来的竞争力比的就是用智力用得好还是坏。十年后谁不会用人工智能、不会用智力,就会被社会淘汰。我们会进入一个智力时代,当然还会往前发展。我认为未来二十年,人工智能体会像我们一样感受这个世界,并做出相应的决策和响应。人工智能的神经网络精细程度、精密程度、规模大概能达到人脑的水平,在结构上达到我们的水平后,功能上我们能做的它都能做,性能上它比我们快多个数量级。这就是超人,这就是AGI,这就是超级人工智能。


那个时候我们可能面临一个重大的抉择:我们还是不是这个地球上最聪明的万物之灵长?想象20年后的世界,我们今天一方面要关心人工智能带来的经济社会发展红利,另外一方面还要关注它的风险:这一次我们让渡的不是体力而是我们的智力,我们的智力活动越来越被人工智能所接管、替代——如果它在智力的全部方面都能替代人类,还要我们干什么?[color=var(--weui-FG-HALF)]



以上内容为相关专家个人观点
图片来源丨图虫创意

本文封面图及配图来自版权图库,不授权转载





评论区留言

说说你的看法

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册