6 月 14 日,零一万物 CEO 李开复和中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤,在 2024 北京智源大会由智源研究院理事长黄铁军主持的 Fireside Chat 上,分享了对通用人工智能技术的整体趋势判断,包括大模型的“靠谱”发展路线和应用爆发阶段、具身智能中最有机会的产品可能性以及对 AGI 能力与风险的理性判断。
“AI 2.0 时代下,在中国大模型 To C 短期更有机会,国外 To B 和 To C 都有机会。”李开复坦言,零一万物坚决做 To C,不做赔钱的 To B,而是做能赚钱的 To B。并且,他对于近两年备受追捧的人形机器人,提出了一连串深度质疑。
“绝大多数应用场景并不需要人形机器人。炒菜机器人应该长得像锅,吸尘器也长得并不像人,没有必要。波士顿动力那种很酷的、跳来跳去的机器人,真的有很多应用场景吗?几个轮子不是更容易移动吗?”
张亚勤则在指出当前大模型技术存在三大不足的同时,对无人驾驶的实现前景表示了极大的肯定,“在明年,无人驾驶会成为第一个真正实现具身智能或者物理智能的 AGI。”
以下是李开复和张亚勤对话的完整版本,AI 前线在不改变原意的基础进行了删减编辑。
做大模型,科技与工程缺一不可
黄铁军:大家关心 AI 2.0,大模型产业化最大的场景在哪里?移动互联网这么多年,To B、To C 这两个大赛道哪个更有机会?为什么? 李开复:简单来说,在中国 To C 短期更有机会,国外两者都有机会。To C 方面,就像移动互联网、PC 时代里一个新技术、新平台带来新应用,大模型同样如此,这是巨大的机会,但这些应用的出现一定是按部就班的。我认为 AI 2.0 时代会和 PC、移动互联网时代一样。第一个阶段应该是生产力工具,包括信息获取;第二个阶段可能会是娱乐、音乐、游戏,第三个阶段可能会是搜索;再下一个阶段可能会是电商;然后可能会有社交、短视频、O2O 的应用出现。
理由就是刚开始应用要能够赚钱、解决问题,所以第一波潮流会是生产力工具,但越往后,难度越高——高用户量的应用商业模式往往是先堆积用户再找变现模式,所以应用成本一定要很低,试错难度很大、所需要的投资也更多。我认为递进的模式不会有特别大的改变,To C 应用会从生产力工具一步步走向短视频类应用。To C 确实会产生大量用户,但这不是说不能用大模型来做产品,只是在普及顺序上会按照这六个阶段进行。
当然,这个过程中也有挑战,在大模型领域做应用跟 PC、互联网时代不一样,因为推理成本太贵。最近零一万物提出了 TC-PMF 概念(技术成本✖️产品市场契合度),这个概念是指,当你考虑 PMF 时,还要把技术的需求、实现难度和成本考虑进去。
第一,做应用一定要考虑到刚才这六个阶段谁先谁后、什么时候做、提早做。第二,做应用的时候还要综合考虑到当时的技术够不够好,成本是否足够低。所以大模型 To C 应用不像过去移动互联网时代,产品经理一个人就可以做主,它需要做 Infrastructure 和推理引擎的人一起打磨 TC-PMF。这件事难度高,但回报也高,机会也更大。
最后我想讲,在 To C 方面,我不相信技术可以永久领先。事实上技术带来的领先窗口非常短暂,一旦巨头看到你验证了 PMF,他们会有很多方法超越你。一旦验证了 TC-PMF,就要把握时间窗口把品牌打出来,最终胜出的 To C 应用不只需要有技术优势,还需要在时间窗口内打造持续优势,比如品牌优势、社交链、用户数据,让用户不能离开你这个平台。在微信强大的时代里抖音能被做出来,就是因为它抓住了这个时间窗口。
再讲一下 To B 的应用。大模型有可能在 To B 方向上带来更大价值,而且能够比 To C 更快实现,但是 To B 这个领域有几个挑战。第一是大公司、传统公司不是很敢采取颠覆式技术,大公司会习惯每年增长 5%预算,做和去年一样的事情。第二个在中国比较严重,许多大公司没有认识到软件的价值,为软件付费意的意识有待进一步提高。现在有许多大模型公司在竞标时越竞越低,做到最后做一单赔一单,都没有利润。
我们在 AI 1.0 时代曾见过这个现象,现在它在 AI 2.0 时代又重现了。这种心态导致部分大公司只愿支付很低的价格,大模型公司也只能给出折中的方案,达到惊艳效果的寥寥无几。零一万物坚决做 To C,不做赔钱的 To B,而是做能赚钱的 To B。所以零一万物在 To B 方面精挑细选,找那种公司上下都愿意拥抱新概念的公司,也为它们设计了 RAG 知识检索、专有云、微调等方案,在国内外都有尝试。
无论 To C 还是 To B,API 都很重要,最近国内很多模型降价了,零一万物也推出了接入国际 SOTA 成绩 Yi-Large 大模型的 API。这个 API 背后的模型能力大概接近 GPT-4o,但价格是 GPT-4 的四分之一,我相信这可以帮助更多公司或者创业者达到所谓的 TC-PMF。 黄铁军:亚勤,刚才关于 To B 的观点,大家还有一个非常关心的问题,大模型产业的最大场景会在哪里?To B、To C 在什么地方能够落地发挥作用? 张亚勤:在应用和服务层面,先面向消费者(To C)再面向企业(To B)。To B 的周期相对较长,而 To C 的应用产品则可以迅速推出,这与过去的 PC 互联网和移动互联网的发展路径基本一致。在基础设施层,目前真正盈利的主要集中在 To B 领域,特别是在芯片、硬件、服务器等,像英伟达、AMD 等芯片制造商,以及服务器、HBM 存储、InfiniBand 和 NVLink 等相关技术的提供商,目前是盈利最多的。
关于 AI 路径,我在过去十年中一直强调三个关键领域:首先是信息智能,其次是物理智能(现在流行的术语是具身智能),最后是生物智能。在具身智能阶段,To B 的应用可能会比 To C 更快落地。然而,在生物智能阶段,情况可能相反,To C 的应用可能会先于 To B 出现。尽管每个领域的具体情况可能有所不同,但总体来看,无论 To C 还是 To B,都将存在开源模型、商业闭源模型、基础大模型以及垂直行业模型和边缘模型。
无人驾驶明年首实现具身智能