智客公社

标题: 周鸿祎委员:面对人工智能大模型技术的跃升,中国理应迎头赶上 [打印本页]

作者: 云淡风轻02    时间: 2023-3-4 08:54
标题: 周鸿祎委员:面对人工智能大模型技术的跃升,中国理应迎头赶上
[attach]802087[/attach]

中国网3月1日讯(记者 谢露莹)近期,由美国人工智能公司OpenAI推出的大语言模型ChatGPT所取得的技术突破引起学术界和产业界的广泛关注。

人工智能大模型技术为何能实现突破?其所依赖的“创新模式”是什么?日前,全国政协委员、360集团创始人周鸿祎在他的提案中对此进行解读。周鸿祎认为,要关注技术创新,同时更要关注技术突破背后所依赖的创新模式。面对ChatGPT为代表的人工智能大模型技术的巨大跃升,中国理应迎头赶上,奋起直追。

ChatGPT的关键成功因素有哪些?

周鸿祎认为,ChatGPT的成功因素有“微软+OpenAI”的产研协同模式发挥了巨大作用,是大型企业+科研机构协同创新的典范,更是开源、合作和众包模式的典范。

周鸿祎介绍,ChatGPT的成功是大型企业+科研机构协同创新的典范。美国等科技创新企业在协同中充分发挥了大型科技企业的优势。如对模型工程化调优的支持;大规模算力支持;训练数据的抓取;帮助改善用户体验;提供用户流量的支持;收集用户反馈提升强化学习效果;商业化模式的探索;基于浏览器、搜索引擎探索用户使用场景;巨大且持续的投资支持等。

“在这样全方位的支持下,OpenAI可以专注于学术研究,在技术路线上坚持长期主义,不断吸引尖端人才,持续打磨算法和模型,不断向前推进技术边界。这样优势互补的方式支撑了ChatGPT的技术创新。”周鸿祎说。

ChatGPT的成功更是开源、合作和众包的典范。周鸿祎提出以下几点理由:

“没有开源就不会有ChatGPT的诞生。”周鸿祎表示,ChatGPT本身就是基于开源算法不断完善的结果,初代GPT建立在谷歌公司开源的Transformer算法之上,吸收了业界大量开源成果,并且GPT1、GPT2都已经开源。同时,ChatGPT所使用的训练数据大部分是开源数据集,包括Common Crawl、WebText2、维基百科、书籍、期刊、开源代码等数据,比重超过90%。

另外,开源也促进产业的共同发展,而不是少数公司垄断技术。通过开放论文、开源代码,微软、谷歌、脸书等,大型公司及众多创新型中小公司齐头并进,不断推进技术进步。

还有,ChatGPT的训练和调优应用了大规模的众包模式,不仅外包了人工标注和人工排序的工程性工作,还通过开放接口,在供全球用户使用的同时,也收集了海量的真实提问以及点赞或者负向反馈,使模型不断调优。

周鸿祎表示,ChatGPT是以通用大模型为中心的生态创新模式,这也是其成功不可或缺的因素。他介绍,ChatGPT是一个通用的大语言模型,只有开发出各种各样的垂类应用才能连接百行千业,服务于传统产业的数字化、智能化转型。OpenAI在应用创新上“不搞一家通吃”,而是把ChatGPT通用大模型作为一个操作系统或应用商店,面向创业者和创新型中小企业开放,扶持上百家中小公司孵化各行各业的垂直应用,使各行各业无需再“大炼大模型”,从而专注于开发行业领域的智能化应用。目前,引用ChatGPT开放接口的应用已多达上千个,各类问答、代码生成、内容创作等新应用如雨后春笋不断涌现,促使产业生态快速发展。

中国应如何突破瓶颈,迎头赶上?

面对人工智能大模型技术的巨大跃升,中国应如何做?对此,周鸿祎建议,中国也要建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+Open AI”组合引领大模型技术攻关。

他认为,中国可以从建设国家战略科技力量高度出发,筛选技术基础好的产研机构,组成优势互补的产业协同组合,发挥科研机构在关键核心技术上的研究优势,同时发挥大型科技企业在产品化、工程化、场景化、商业化和数据化方面的优势,成为大模型技术攻关和应用的龙头。

另外,中国还需支持设立多个国家级人工智能大模型的长期开源项目,打造开源众包的开放创新生态。

周鸿祎认为,人工智能大模型不应成为少数公司垄断的高级技术,而应最大发挥其对于产业和社会的价值。他建议,针对多条技术路线以开源模式设立多个国家级长期项目,以大型科技企业+重点科研机构为龙头,通过开源、合作、众包和生态的创新模式,引导高校、科研机构和创新型企业形成多个技术路线的创新生态群。

(责编:唐佳蕾 张艳玲)





欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4