人工智能就像机械动力技术、电气技术那样,是革命性的通用技术,在所有的行业都能用,它会带来整个社会的智能化。如何实现这样的技术突破?这需要一个从量变到质变的过程。2018年刚推出来的第一代GPT,只有10亿的参数,到2019年达到了15亿的参数,有所增长;到了2020年6月份,达到了1750亿的参数,这个增长已经不是一般的量变,可以称之为突变了。现在参数又有了数百倍的增长,更是达到了几十万亿。这种量的变化给AI带来了巨大的能量。
这个参数是什么意思?指的是我们模仿人脑创造一个神经网络的模型,模型中连接点的数量。人脑有860万亿个神经元,这些神经元通过触突连接起来,我们模仿它,所谓模型参数就是这种连接的数量。但模型参数是不是越大越好、把参数做到无限大的时候AI就能变得无限聪明?也不尽然。非洲大象的神经元数量比人还大至少三倍,但是它并不比人聪明。这告诉我们,简单地去增加参数数量并不能达到更好的智能效果。所以我们一方面要增加参数,另外一方面还需要技术的黄金组合。
ChatGPT一系列的技术里面,有几项特别值得一提的技术,其中一项叫 Word Embedding ,翻译成中文叫词嵌入。这是比较难懂的一个词,是把一个词嵌入到一个矢量的空间里面。这里面矢量的维数可以非常多,每一维以0或者1代表一个矢量的性质。比方说第一个维度以0和1代表它是个生物还是非生物;如果是生物,下一维度,这是动物还是植物;如果是动物,下一维度判断这是哺乳动物还是非哺乳动物;如果是哺乳动物,是地上跑的还是天上飞的……在一个高维矢量空间里,把一个词意给它确定下来,这就叫做 Word Embedding。
还有一项重要的技术,GPT的T是Transformer的首字母。Transformer我们翻译成变换器。这个变换器是干什么的?是做编码和解码用的。编码和解码会产生另一个概念,我们叫做 attention,翻译成注意力,它可以在很长的上下文中找到关键词。人看文章的时候,不是在每一个词上都平均用力的,而是迅速抓住关键词,这对AI来说也是一个重要的功能。
接下来还有一个重要的功能,叫做基于人类反馈的强化学习。就是AI说错了以后,我们告诉它:“你说得不对吧?你写得太长,要压缩。”在这个人类反馈过程中,可以把人的价值观、社会的风俗、法律的规定、技术的标准、人的审美和情绪,用语言输入给模型,让它产生你所需要的结果。
这一系列重要技术组合,才产生了今天的技术突破,而且按照我的说法,它正在经历着突破,还在往前走着。
大模型带来一个非常重要的工作模式和很多新的岗位。这个新的工作模式叫做MaaS,Model as a Service。原来我们说软件是个服务,网络是个服务,平台是个服务,现在说,模型是个服务。这个预训练的大模型会变成一个社会的基础设施,让我们的各行各业在这个预训练大模型基础上,用我们的数据和专门的知识,结合我们特定的任务,把它变成一个专用的模型。
这时候就降低了我们使用模型的门槛。即便要改进模型,也不用从头做起,我们可以拿过一个大模型来,结合我们需要用的专门的数据做精调。现在有招聘一种岗位,叫做提示工程师。提示工程师的主要工作就是跟AI对话,通过有效对话来对它进行训练。GPT工程师可以在模型基础上去改错、加工,而不是从头一行一行写C语言代码,这使得原来最低级的程序员变成了软件系列里比较高级的系统分析师。如果我们把AI看成是一辆车,我们不仅需要设计车的人和造车的人,更需要会开车的人。这就是一旦普遍使用这个工具,就会产生各行各业新的工作岗位的原因。
但人工智能的应用也是有风险的。它存在风险的一个最根本的原因在于,它在推测答案的时候,用的是概率,叫做联合分布概率。给它输入一个问题,它判断哪些词与输入的词组合形成的概率最高,那就是它选择的输出。既然它是通过概率来判断的,就不可能100%正确,总有出错的时候。人也会出错,只不过我们可以通过长期的实践、根据民主决策的程序、通过专家咨询等,来尽量减少人的错误。而对大模型,现在还存在不可解释性,还不能清晰地说明在什么样的条件下可以影响它的概率分布。
我们认为这种出错基本上会来自两个方面:一是技术内在的不完善,联合分布概率因此不可完全控制;另外一方面来自于它的滥用——再安全的车,也可以开着去撞人,不是车不好,也不是车的技术参数不好,危险来自对它的滥用。
发展人工智能我们可以这样干
以上内容可以归结为三点:第一,人工智能是先进生产力,发展不可阻挡;第二,它正在形成大的突破,而且是以前所未有的深度、广度和速度,在进入我们的生产和生活;第三,它还不成熟,存在着固有的缺陷,存在着被滥用的可能,需要对它进行治理。在这三点基础上,我们可以讨论如何发展AI。
这里我想谈五个关键词:创新、应用、平台、治理、人才。
创新和应用是一个相互迭代的过程,是相互促进的,没有创新就没有有效的应用。在此我借用一下“深度学习”中的“深度”概念,提出深度的创新和深度的应用。深度创新,指的是要在根上创新,要突破模型可解释性问题,我们不能总是把别人做的模型拿过来做fine tuning。我们有没有可能在类脑神经模型上做新的突破?就是把前文说的MaaS这个模型作为一个服务给广泛推出,在应用大模型基础上,把人工智能从chat推向product,变成了product以后,才能真正发挥效益。
这里我给大家举一个例子。现在一些头部的企业已经在推出面向行业的应用,但这些应用需要跟行业更紧密地结合,把它真正落到生产的深部。我们研究院做了一个试验,到全国开展自动驾驶网联车的那些城市去发调查问卷,分成坐过网联车的和没坐过网联车的。我们看到无论是试验组还是对照组对自动驾驶汽车上路进行测试,都持积极的态度,其中坐过的(试验组)态度更为积极。拿武汉举例,自动驾驶出租车推出商业服务不到500天的时间,有一个人就用了900多次,差不多一天用两次自动驾驶车接送他的孩子。这说明这项技术在中国有比较好的接受度,我们可以在大规模应用过程中完善技术。
创新和应用之外,我们发现了一个更重要的现象:创新和应用在中国的发展是由平台支撑的。我们调查了全国的2205家人工智能企业,看这些人工智能企业的资金从哪里来,投资向哪里去;看他们的人才从哪里来、人才跳槽向哪里去;看他们的技术从哪里来,如果输出技术向哪里去。人、才、技术形成了这些企业之间的相互联系。
在这两千多家企业的背后,我们发现了一大批投资者、一大批科研院所、一大批政府的科研园区等。其中有15家企业是科技部命名的,叫人工智能开放创新平台。这15个开放创新品牌,在这两千多家企业中起到了重要的推动作用。这是一个平台推动的发展生态。
我们需要建立一批跨界的创新组织,用这些创新组织来探索这种由平台驱动的新质生产力,形成更好的上层建筑(生产关系),来加快创新应用的循环,推动产业的新生态,实现人工智能和实体经济的深度融合。这是写进我们党的十九大报告的一句话:推进人工智能和实体经济深度融合。
还有一个关键词是治理。在这里,治理的对象是一种生产力,而且是一种先进的生产力,我们要以是否能解放和发展这种生产力作为治理的标准。最忌讳的,就是用现存的生产关系来约束正在迅速发展的先进的新质生产力。切记不能把这一生产力的发展和它的安全给对立起来——不发展就是最大的不安全,我们要治理它,首先就要把它发展好,要发展好就要鼓励从根上创新,没有根上的创新就没有根上的安全,就实现不了发展。
目前我们国家建立了基于风险的、对人工智能的治理机制,划出了一些高风险应用。比如把脑机接口植入到人的大脑里,风险就比较高,这样的应用就属于高风险应用。
智能化社会来了,我们需要全民的人工智能素质,但是不需要社会焦虑。现在有些完全不必要的社会焦虑,它们的存在只会对人工智能的发展、对生产生活的高质量发展带来毫无必要的干扰。
最后一个关键词是人才。有人评估说,光是中国人工智能领域,相关岗位就缺500万,现在我们就要把这500万人给培养出来。但还不止于这500万,我们整个已经进入人工智能时代,这个时代所有合格公民都应该具备人工智能相应的素质,能够学会驾驭人工智能。这就需要对我们的教育系统提出新的要求。
应用人工智能,特别要注意的是我们可以驾驭而不可以依赖这个工具——必须清楚,AI生成的只是半成品,它要经过人类的审视、人类的加工,才能变成一个真正的成品。我们要对它做factual check、logic check、ethical check,也就是做事实的、逻辑的、伦理的审查。这里有个词叫做critical thinking,翻译成批判性思维,其实我觉得翻译成审辩思维更好。
概括起来,我们现在需要为AI立心。联合国有一个口号,The AI we want is the AI with human values for sustainable development,“我们需要具有人类价值观的、可持续发展服务的AI”。
作者丨龚克
图片来源丨图虫创意
本文封面图及配图来自版权图库,不授权转载