智客公社

标题: 全球 AI 行业:从Chat-GPT看生成式人工智能AIGC产业机遇与落地场景 [打印本页]

作者: 危险旳嗜好_°    时间: 2023-2-11 14:37
标题: 全球 AI 行业:从Chat-GPT看生成式人工智能AIGC产业机遇与落地场景
(报告作者:中信证券分析师 陈俊云、许英博、刘锐、贾凯方)

Chat-GPT 的出现以及中短期内的产业化落地将会为从用户创作(UGC)到 AI 创作(AIGC)的转型提供关键的辅助支持。Chat-GPT 的成功证明了 Transformer 模型并非陷入困境,不断的 AI 技术方法上的新突破正驱动全球 AI 产业进入加速发展阶段,叠加 AI 产业 集群效应的不断凸显,AI 产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI 产业有望继续保持“芯片+算力基础设施+AI 框架&算法库+应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为受益者。

[attach]800910[/attach]

报告缘起

Chat-GPT 自推出以来表现优异,展现出了相比于前代更好的对话能力与上下文的逻辑一致性。OpenAI 团队最新公布的语言模型 Chat-GPT 于 2022 年 11 月 30 日向社区发布测试,并立即收到了良好的反馈。从测试反馈的结果看,相比于前一代的 GPT-3, Chat-GPT 以对话为载体,可以回答多种多样的日常问题,对于多轮对话历史的记忆能力和篇幅增强。与 GPT-3 等大模型相比,Chat-GPT 回答更全面,可以多角度全方位进行回答和阐述,相较以往的大模型,知识被挖掘得更充分。此外,ChatGPT 增加了过滤处理机制以解决 AI 伦理问题,针对不适当的提问和请求,它可以做出拒绝和“圆滑”的回复。

[attach]800911[/attach]

Chat-GPT 的强势”出圈”成为了对人工智能中短期内的产业化方向一系列探索的催化剂。从对 Chat-GPT 的测试结果来看,Chat-GPT 开始能在大范围、细粒度问题上给出普遍稳妥的答案,并根据上下文形成有一定的逻辑性的创造性回答。它降低了人类学习成本和节省时间成本,可以满足人类大部分日常需求,比如快速为人类改写确定目标的文字、大篇幅续写和生成小说、快速定位代码的 bug 等。这些小功能在中短期内有望快速被初创公司产业化,以极低的成本表现出比此前更优越的性能。本篇报告就将从 Chat-GPT 背后的技术逻辑出发,分析本轮人工智能浪潮可能的产业化方向。

[attach]800912[/attach]


[attach]800913[/attach]

技术逻辑:基于人类反馈学习进行额外训练,给出 Transformer 未来的发展方向

Chat-GPT 继承了 Instruct-GPT 基于 GPT-3 之上的创新,即人类反馈强化学习与奖励模型取得了良好的效果。OpenAI 团队从 GPT-3.5 系列中的一个模型进行微调,使用与 InstructGPT 相同的方法,人类反馈强化学习 (RLHF) 训练该模型,并对数据收集设置相对做了优化。从此前公布的兄弟模型 Instruct-GPT 的论文来看,Chat-GPT 的模型构建主要分为三部分:
1)使用有监督学习方式,基于 GPT3.5 微调训练一个初始模型,训练数据约为 2w~3w 量级(根据兄弟模型 InstructGPT 的训练数据量级估算)。OpenAI 请来了约 40 人的标注 师团队,由标注师分别扮演用户和聊天机器人,产生人工精标的多轮对话数据。这种标注 的训练数据虽然数据量不大,但质量和多样性非常高,且都是来自真实世界数据。
2)随后模型随机抽取一大批 Prompt,使用第一阶段微调模型,产生多个不同回答。 标注人员对这些个结果排序,并按照个人的对回答完成度的偏好形成训练数据对。之后使用 pairwise loss 来训练奖励模型,可以预测出标注者更喜欢哪个输出,在不断比较中给出相对精确的奖励值。这一步使得 Chat-GPT 从命令驱动转向了意图驱动。在这个过程中训练数据不需过多,维持在万量级即可。因为它不需要穷尽所有的问题,只要告诉模型人类的喜好,强化模型意图驱动的能力就行。
3)使用 PPO 强化学习策略来微调第一阶段的模型。随机抽取新的 Prompt,用第二阶段的 Reward Model 给产生的回答打分。这个分数即回答的整体 reward,进而将此reward 回传,由此产生的策略梯度可以更新 PPO 模型参数。整个过程迭代数次直到模型 收敛。PPO 模型可以在多个训练步骤实现小批量的更新,其实现简单、易于理解、性能稳 定、能同时处理离散/连续动作空间问题、利于大规模训练。

[attach]800914[/attach]

Chat-GPT 成功使用小训练样本完成了与 GPT-3 相当甚至更好的效果,突显数据质量的重要性。Chat-GPT 的兄弟模型 InstructGPT 仅仅使用了精选的 13 亿参数(对比 GPT-3 的千亿级别参数)就完成了与 GPT-3 结果相当甚至更好的回复质量。从论文给出的四个数据集测试可以看出,在其中两个数据集 InstructGPT 就完成了明显超越 GPT-3 回复质量的结果。因此,我们推测 InstructGPT 的兄弟模型 Chat-GPT 也使用了小量级的数据样本取得了如此出色的结果(Chat-GPT 不同于 InstructGPT 建立于 GPT-3.5 系列的一个模型上, 数据量应大于 InstructGPT 但仍小于 GPT-3,处于百亿级别)。Chat-GPT 的成功向我们展现了目前我们所看到的 Transformer 模型们的潜力尚未被完全开发,如何更好的精选优质数据将成为下一步的课题之一。

[attach]800915[/attach]

Chat-GPT 的成功,是在前期大量坚实的工作基础上实现的,不是横空出世的技术跨越。这些进步主要来自于数学层面上的优化带来的结果匹配精准度提高,而并非算法真正为 AI 带来了创造性与完整的逻辑性,也不是能够从训练的数据中学习到新的知识。它在“解锁”(unlock)和挖掘 GPT3 学到的海量数据中的知识和能力,但这些仅通过快速的 In-context 的方式较难获得。InstuctGPT 找到了一种面向主观任务来挖掘 GPT3 强大语言能力的方式。因此从这样的底层技术逻辑出发,我们能迅速找到中短期内适合 Chat-GPT 的产业化方向:一个真正全方位的智能内容生成助手。

[attach]800916[/attach]


[attach]800917[/attach]

产业影响:成本下降+高质量数据加速底层应用落地

回顾过去近十年间 AI 产业链的发展史,我们可以简单分为以下几个阶段:
1. 小模型(2015 年前)
AI 擅长特定领域的分析任务(如语义理解等),但通用型任务的完成情况很差。硬件 算力不够导致重新训练成本过高;数据来源过于稀少难以提升到更高精确度,整体表达能 力与人类相差较远。
2. 大模型(2015-2022 年)
Transformer 模型的出现,使得文字、语音、图像识别、语言理解等领域达到了超越 人类的水平,但同时也极大得增加了模型的体积,只有拥有强大算力支撑的科技巨头才有 能力训练 Transformer 模型。

[attach]800918[/attach]

3. 兼顾经济性与可使用性(2022-2024 年)
Chat-GPT 的成功证明了两点:1)单纯扩大模型参数并非唯一出路;2)让模型在早 期开放给大众测试并收集人类反馈数据更有利于模型迭代。之前两个阶段,人工智能的进 展更多体现在基于规模的技术突破,如 2015-2020 年,用于模型训练的计算量增长了 6 个 数量级,同时随着规模的增大,输出结果的质量亦迎来质变,在语言文字、书写、图像识 别等领域皆表现出超越人类的水平。
但在实用层面,由于所需要的算力巨大,往往需要特 殊的 GPU 配置,同时训练过程相对封闭,大多数人并无法使用,因此技术无法被多数人 触达。而人工智能的第三个阶段,随着更新的技术、更优的算法、更大的模型出现,算力 的成本越来越低,使得模型训练与运行所需成本持续下降,而算法从封闭测试到开放测试、 开源的逐渐普及,亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了 支持普及的水平。

[attach]800919[/attach]

4. 模型开放、快速迭代(2024 以后)
得益于 AIGC 基础设施可获得性的逐步提高,平台层变得更加稳固,算力成本持续下 探,模型逐渐趋于开源与免费,应用层爆发式发展的节点正在靠近。正如 GPS 技术的普 及打开了导航市场,我们认为 AIGC 整体产业链从底层硬件到中层技术再到产品思维的成 熟正在催生新的杀手级应用。

[attach]800920[/attach]

应用场景:实现 UGC 到 AIGC 的助推器

Chat-GPT 的出现所带来的内容生成能力将会为当今从用户创作(UGC)到 AI 创作 (AIGC)的转型提供关键的辅助支持。目前我们正经历从 Web2.0 开始向 Web3.0 转型的 启航阶段,在过去五年我们已经看到内容创造从专业创作(PFC)转型为了用户创作(UGC)。
在 UGC 阶段,随着消费者定制化需求越来越高,消费者本身亦参与内容的生产,并伴随 着互联网的兴起,智能手机的普及,YouTube、Facebook 等平台涌现,UGC 成为了内容 生产的主流模式。而在不远的将来,AI 协助内容生成(AIUGC)与 AI 创作(AIGC)将为 我们提供更低的创作门槛以及更丰富的创作思路。在这两个阶段中。内容生产主体从人类 本身开始向人工智能迁移,主要区别体现在内容的生产效率、知识图谱的多样性以及提供 更加动态且可交互的内容上。人脑只能基于自己的知识图谱进行少数方向的信息处理,而 AI 能从更庞大的知识体系中进行多个方向的处理,进而提供更多的创作思路。Gartner 预 计,到 2025 年,生成式人工智能将占所有生成数据的 10%。

[attach]800921[/attach]

结合 Chat-GPT 的底层技术逻辑,我们认为 Chat-GPT 中短期内产业化的方向主要分 为四大板块:
1)Chat-GPT 对于文字模态的 AIGC 应用具有重要意义,在归纳性的文字类工作中 展现出了极其优异的表现。其中在 Chat-GPT 的帮助下,传统的文字类工作中的一些方向 会涉及到交互的全面改革,比如机器翻译不再是传统的文本输入->实时翻译,而是随时以 助手问答的形式出现。甚至给出一个大概笼统的中文意思,让机器给出对应英文。中短期 内 Chat-GPT 能在办公辅助类工具中迅速落地,例如会议总结、文件翻译、例行报告等, 提升办公效率并节省人力成本。目前已有的初创公司如 Jasper,主打文字生成相关服务, 于 2022 年 10 月 19 日宣布完成 1.25 亿美元的 A 轮融资,估值达到 15 亿美元。该公司针对不同应用场景提供不同类型的服务,如社交媒体、广告、文章、邮件等不同类型的文字 生成。

[attach]800922[/attach]

2)代码开发相关的工作更加规整也非常适合 AI 辅助生成。2021 年中与 Github、微 软合作上线的 Copilot 是目前最成熟的 AI 代码补全工具,根据 Github 数据,测试一年来 已有 120 万用户,这些用户编写的代码中 40%是由 Copilot 自动生成,而截至 2022 年 10 月,Copilot 已经融资 2200 万美元。Chat-GPT 在目前测试中表现出的代码生成能力相比 于 Copilot 更加灵活,可以独立完成一些小功能的编写,但综合看目前版本的 Chat-GPT 自代码生成中欠缺一些底层的稳定性。在进行针对性的优化后,基于新 GPT 模型的 AI 代 码辅助工具也有望在中短期内落地。

[attach]800923[/attach]

3)图像生成领域成为了 2022 年下半年一级市场公司布局的热点,随着 Dalle2 的热 度,在商稿方面用 AI 取代人类画手的思路基本明确。2021 年 OpenAI 推出的初代图像生 成 Dalle 模型就是基于 GPT 之上,而 Dalle2 则转向投入了扩散模型的怀抱并取得了更好 的效果。GPT 模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用 Chat-GPT 生成较佳的 Prompt,对于 AIGC 内容和日趋火热的艺术创作,提供强大的文字 形态的动力。

[attach]800924[/attach]

4)Chat-GPT 将在智能客服类工作中找到适合自己的位置。根据模型现有的完成度, 在垂直行业针对性的做人工反馈训练,Chat-GPT 就可以落地为智能客服产品,在 toC 场 景中率先应用。对比现有的智能客服,Chat-GPT 支撑的客服将在灵活性与人性化服务方 面有显著的进步。根据 GrandView Research 的报告,全球 AI 市场在 2022 年达到了 13.8 亿美元,该机构预计到 2030 年将达到 70.8 亿美元,对应 2022 年-2030 年 CAGR 为 22%。 而根据 CanamResearch 2021 年的调查数据显示,美国 78%的客户联络中心在未来三年 内部署人工智能,46%的客户服务互动已经实现自动化,该机构预计到 2023 年将增长至 59%。

[attach]800925[/attach]

近两年国内一级市场中也涌现了大量智能客服公司,基于模型之上做针对性的产业优 化将节省大量成本。据市场研究机构沙利文发布的《2021 年中国智能客服市场报告》显 示,2020 年中国智能客服行业投融资事件有 23 件,投资总金额为 34.4 亿元,同比增长 123%。另外,2021 年上半年,中国智能客服投融资事件有 13 件,投资金额达 23.4 亿元, C 轮至 D 轮融资事件占比高达 50%。从投融资轮次来看,2021 年上半年 C 轮至 D 轮投融 资事件最为活跃,可见各细分赛道企业渐趋成熟。其中,智齿科技、来也科技、乐言科技、 Udesk、晓多科技、小能科技等智能客服厂商,颇受资本市场青睐。

[attach]800926[/attach]

Chat-GPT 模型的亮眼表现的背后是研究者在 Transformer 模型前进的道路上发现了类反馈强化学习这一方法带来的潜力,对产业界而言,数据质量的优化、AI 研究人员的储备与计算能力将是未来能否走在 AI 应用前沿的核心能力。Chat-GPT 的成功证明了 Transformer 模型并非陷入困境,不断的 AI 技术方法上的新突破正驱动全球 AI 产业进入加速发展阶段,叠加 AI 产业集群效应的不断凸显,AI 产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI 产业有望继续保持“芯片+算力基础设施+AI 框架&算法库 +应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为产业受益者。建议持续关注:特斯拉、英伟达、AMD、高通、微软、谷歌、 Mobileye 等。
以上内容仅供学习交流,不构成投资建议。详情参阅原报告。
精选报告来源【远瞻智库】,获取报告点击:报告中心-远瞻智库|为三亿人打造的有用知识平台
作者: 官峰轩985    时间: 2023-2-11 14:37
转发了
作者: 建鸿法援    时间: 2023-2-11 14:37
转发了
作者: lkamxmk    时间: 2023-2-11 14:37
转发了
作者: 天下无贼    时间: 2023-2-11 14:38
转发了
作者: 颖_sunshine    时间: 2023-2-11 14:38
[赞][赞][赞]
作者: 造作的时光    时间: 2023-2-11 14:39
转发了
作者: CCAI2019    时间: 2023-2-11 14:39
转发了
作者: 1181998215    时间: 2023-2-11 14:40
这东西也就是个4000块文员的水平,帮你查资料和整理资料,没什么让人震惊的功能。热度很快就会过去。
作者: mk23_usp45    时间: 2023-2-11 14:41
转发了




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4