智客公社

标题: 全球 AI 行业：从Chat-GPT看生成式人工智能AIGC产业机遇与落地场景 [打印本页]

作者: 危险旳嗜好_° 时间: 2023-2-11 14:37
标题: 全球 AI 行业：从Chat-GPT看生成式人工智能AIGC产业机遇与落地场景
（报告作者：中信证券分析师陈俊云、许英博、刘锐、贾凯方）

Chat-GPT 的出现以及中短期内的产业化落地将会为从用户创作（UGC）到 AI 创作（AIGC）的转型提供关键的辅助支持。Chat-GPT 的成功证明了 Transformer 模型并非陷入困境，不断的 AI 技术方法上的新突破正驱动全球 AI 产业进入加速发展阶段，叠加 AI 产业集群效应的不断凸显，AI 产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI 产业有望继续保持“芯片+算力基础设施+AI 框架&算法库+应用场景”的稳定产业价值链结构，拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为受益者。

[attach]800910[/attach]

报告缘起

Chat-GPT 自推出以来表现优异，展现出了相比于前代更好的对话能力与上下文的逻辑一致性。OpenAI 团队最新公布的语言模型 Chat-GPT 于 2022 年 11 月 30 日向社区发布测试，并立即收到了良好的反馈。从测试反馈的结果看，相比于前一代的 GPT-3， Chat-GPT 以对话为载体，可以回答多种多样的日常问题，对于多轮对话历史的记忆能力和篇幅增强。与 GPT-3 等大模型相比，Chat-GPT 回答更全面，可以多角度全方位进行回答和阐述，相较以往的大模型，知识被挖掘得更充分。此外，ChatGPT 增加了过滤处理机制以解决 AI 伦理问题，针对不适当的提问和请求，它可以做出拒绝和“圆滑”的回复。

[attach]800911[/attach]

Chat-GPT 的强势”出圈”成为了对人工智能中短期内的产业化方向一系列探索的催化剂。从对 Chat-GPT 的测试结果来看，Chat-GPT 开始能在大范围、细粒度问题上给出普遍稳妥的答案，并根据上下文形成有一定的逻辑性的创造性回答。它降低了人类学习成本和节省时间成本，可以满足人类大部分日常需求，比如快速为人类改写确定目标的文字、大篇幅续写和生成小说、快速定位代码的 bug 等。这些小功能在中短期内有望快速被初创公司产业化，以极低的成本表现出比此前更优越的性能。本篇报告就将从 Chat-GPT 背后的技术逻辑出发，分析本轮人工智能浪潮可能的产业化方向。

[attach]800912[/attach]

[attach]800913[/attach]

技术逻辑：基于人类反馈学习进行额外训练，给出 Transformer 未来的发展方向

Chat-GPT 继承了 Instruct-GPT 基于 GPT-3 之上的创新，即人类反馈强化学习与奖励模型取得了良好的效果。OpenAI 团队从 GPT-3.5 系列中的一个模型进行微调，使用与 InstructGPT 相同的方法，人类反馈强化学习（RLHF）训练该模型，并对数据收集设置相对做了优化。从此前公布的兄弟模型 Instruct-GPT 的论文来看，Chat-GPT 的模型构建主要分为三部分：
1）使用有监督学习方式，基于 GPT3.5 微调训练一个初始模型，训练数据约为 2w~3w 量级（根据兄弟模型 InstructGPT 的训练数据量级估算）。OpenAI 请来了约 40 人的标注师团队，由标注师分别扮演用户和聊天机器人，产生人工精标的多轮对话数据。这种标注的训练数据虽然数据量不大，但质量和多样性非常高，且都是来自真实世界数据。
2）随后模型随机抽取一大批 Prompt，使用第一阶段微调模型，产生多个不同回答。标注人员对这些个结果排序，并按照个人的对回答完成度的偏好形成训练数据对。之后使用 pairwise loss 来训练奖励模型，可以预测出标注者更喜欢哪个输出，在不断比较中给出相对精确的奖励值。这一步使得 Chat-GPT 从命令驱动转向了意图驱动。在这个过程中训练数据不需过多，维持在万量级即可。因为它不需要穷尽所有的问题，只要告诉模型人类的喜好，强化模型意图驱动的能力就行。
3）使用 PPO 强化学习策略来微调第一阶段的模型。随机抽取新的 Prompt，用第二阶段的 Reward Model 给产生的回答打分。这个分数即回答的整体 reward，进而将此reward 回传，由此产生的策略梯度可以更新 PPO 模型参数。整个过程迭代数次直到模型收敛。PPO 模型可以在多个训练步骤实现小批量的更新，其实现简单、易于理解、性能稳定、能同时处理离散/连续动作空间问题、利于大规模训练。

[attach]800914[/attach]

Chat-GPT 成功使用小训练样本完成了与 GPT-3 相当甚至更好的效果，突显数据质量的重要性。Chat-GPT 的兄弟模型 InstructGPT 仅仅使用了精选的 13 亿参数（对比 GPT-3 的千亿级别参数）就完成了与 GPT-3 结果相当甚至更好的回复质量。从论文给出的四个数据集测试可以看出，在其中两个数据集 InstructGPT 就完成了明显超越 GPT-3 回复质量的结果。因此，我们推测 InstructGPT 的兄弟模型 Chat-GPT 也使用了小量级的数据样本取得了如此出色的结果（Chat-GPT 不同于 InstructGPT 建立于 GPT-3.5 系列的一个模型上，数据量应大于 InstructGPT 但仍小于 GPT-3，处于百亿级别）。Chat-GPT 的成功向我们展现了目前我们所看到的 Transformer 模型们的潜力尚未被完全开发，如何更好的精选优质数据将成为下一步的课题之一。

[attach]800915[/attach]

Chat-GPT 的成功，是在前期大量坚实的工作基础上实现的，不是横空出世的技术跨越。这些进步主要来自于数学层面上的优化带来的结果匹配精准度提高，而并非算法真正为 AI 带来了创造性与完整的逻辑性，也不是能够从训练的数据中学习到新的知识。它在“解锁”（unlock）和挖掘 GPT3 学到的海量数据中的知识和能力，但这些仅通过快速的 In-context 的方式较难获得。InstuctGPT 找到了一种面向主观任务来挖掘 GPT3 强大语言能力的方式。因此从这样的底层技术逻辑出发，我们能迅速找到中短期内适合 Chat-GPT 的产业化方向：一个真正全方位的智能内容生成助手。

[attach]800916[/attach]

[attach]800917[/attach]

产业影响：成本下降+高质量数据加速底层应用落地

回顾过去近十年间 AI 产业链的发展史，我们可以简单分为以下几个阶段：
1. 小模型（2015 年前）
AI 擅长特定领域的分析任务（如语义理解等），但通用型任务的完成情况很差。硬件算力不够导致重新训练成本过高；数据来源过于稀少难以提升到更高精确度，整体表达能力与人类相差较远。
2. 大模型（2015-2022 年）
Transformer 模型的出现，使得文字、语音、图像识别、语言理解等领域达到了超越人类的水平，但同时也极大得增加了模型的体积，只有拥有强大算力支撑的科技巨头才有能力训练 Transformer 模型。

[attach]800918[/attach]

3. 兼顾经济性与可使用性（2022-2024 年）
Chat-GPT 的成功证明了两点：1）单纯扩大模型参数并非唯一出路；2）让模型在早期开放给大众测试并收集人类反馈数据更有利于模型迭代。之前两个阶段，人工智能的进展更多体现在基于规模的技术突破，如 2015-2020 年，用于模型训练的计算量增长了 6 个数量级，同时随着规模的增大，输出结果的质量亦迎来质变，在语言文字、书写、图像识别等领域皆表现出超越人类的水平。
但在实用层面，由于所需要的算力巨大，往往需要特殊的 GPU 配置，同时训练过程相对封闭，大多数人并无法使用，因此技术无法被多数人触达。而人工智能的第三个阶段，随着更新的技术、更优的算法、更大的模型出现，算力的成本越来越低，使得模型训练与运行所需成本持续下降，而算法从封闭测试到开放测试、开源的逐渐普及，亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了支持普及的水平。

[attach]800919[/attach]

4. 模型开放、快速迭代（2024 以后）
得益于 AIGC 基础设施可获得性的逐步提高，平台层变得更加稳固，算力成本持续下探，模型逐渐趋于开源与免费，应用层爆发式发展的节点正在靠近。正如 GPS 技术的普及打开了导航市场，我们认为 AIGC 整体产业链从底层硬件到中层技术再到产品思维的成熟正在催生新的杀手级应用。

[attach]800920[/attach]

应用场景：实现 UGC 到 AIGC 的助推器

Chat-GPT 的出现所带来的内容生成能力将会为当今从用户创作（UGC）到 AI 创作（AIGC）的转型提供关键的辅助支持。目前我们正经历从 Web2.0 开始向 Web3.0 转型的启航阶段，在过去五年我们已经看到内容创造从专业创作（PFC）转型为了用户创作（UGC）。
在 UGC 阶段，随着消费者定制化需求越来越高，消费者本身亦参与内容的生产，并伴随着互联网的兴起，智能手机的普及，YouTube、Facebook 等平台涌现，UGC 成为了内容生产的主流模式。而在不远的将来，AI 协助内容生成（AIUGC）与 AI 创作（AIGC）将为我们提供更低的创作门槛以及更丰富的创作思路。在这两个阶段中。内容生产主体从人类本身开始向人工智能迁移，主要区别体现在内容的生产效率、知识图谱的多样性以及提供更加动态且可交互的内容上。人脑只能基于自己的知识图谱进行少数方向的信息处理，而 AI 能从更庞大的知识体系中进行多个方向的处理，进而提供更多的创作思路。Gartner 预计，到 2025 年，生成式人工智能将占所有生成数据的 10%。

[attach]800921[/attach]

结合 Chat-GPT 的底层技术逻辑，我们认为 Chat-GPT 中短期内产业化的方向主要分为四大板块：
1）Chat-GPT 对于文字模态的 AIGC 应用具有重要意义，在归纳性的文字类工作中展现出了极其优异的表现。其中在 Chat-GPT 的帮助下，传统的文字类工作中的一些方向会涉及到交互的全面改革，比如机器翻译不再是传统的文本输入->实时翻译，而是随时以助手问答的形式出现。甚至给出一个大概笼统的中文意思，让机器给出对应英文。中短期内 Chat-GPT 能在办公辅助类工具中迅速落地，例如会议总结、文件翻译、例行报告等，提升办公效率并节省人力成本。目前已有的初创公司如 Jasper，主打文字生成相关服务，于 2022 年 10 月 19 日宣布完成 1.25 亿美元的 A 轮融资，估值达到 15 亿美元。该公司针对不同应用场景提供不同类型的服务，如社交媒体、广告、文章、邮件等不同类型的文字生成。

[attach]800922[/attach]

2）代码开发相关的工作更加规整也非常适合 AI 辅助生成。2021 年中与 Github、微软合作上线的 Copilot 是目前最成熟的 AI 代码补全工具，根据 Github 数据，测试一年来已有 120 万用户，这些用户编写的代码中 40%是由 Copilot 自动生成，而截至 2022 年 10 月，Copilot 已经融资 2200 万美元。Chat-GPT 在目前测试中表现出的代码生成能力相比于 Copilot 更加灵活，可以独立完成一些小功能的编写，但综合看目前版本的 Chat-GPT 自代码生成中欠缺一些底层的稳定性。在进行针对性的优化后，基于新 GPT 模型的 AI 代码辅助工具也有望在中短期内落地。

[attach]800923[/attach]

3）图像生成领域成为了 2022 年下半年一级市场公司布局的热点，随着 Dalle2 的热度，在商稿方面用 AI 取代人类画手的思路基本明确。2021 年 OpenAI 推出的初代图像生成 Dalle 模型就是基于 GPT 之上，而 Dalle2 则转向投入了扩散模型的怀抱并取得了更好的效果。GPT 模型在图像生成领域目前效果略逊于扩散模型，但扩散模型可以利用 Chat-GPT 生成较佳的 Prompt，对于 AIGC 内容和日趋火热的艺术创作，提供强大的文字形态的动力。

[attach]800924[/attach]

4）Chat-GPT 将在智能客服类工作中找到适合自己的位置。根据模型现有的完成度，在垂直行业针对性的做人工反馈训练，Chat-GPT 就可以落地为智能客服产品，在 toC 场景中率先应用。对比现有的智能客服，Chat-GPT 支撑的客服将在灵活性与人性化服务方面有显著的进步。根据 GrandView Research 的报告，全球 AI 市场在 2022 年达到了 13.8 亿美元，该机构预计到 2030 年将达到 70.8 亿美元，对应 2022 年-2030 年 CAGR 为 22%。而根据 CanamResearch 2021 年的调查数据显示，美国 78%的客户联络中心在未来三年内部署人工智能，46%的客户服务互动已经实现自动化，该机构预计到 2023 年将增长至 59%。

[attach]800925[/attach]

近两年国内一级市场中也涌现了大量智能客服公司，基于模型之上做针对性的产业优化将节省大量成本。据市场研究机构沙利文发布的《2021 年中国智能客服市场报告》显示，2020 年中国智能客服行业投融资事件有 23 件，投资总金额为 34.4 亿元，同比增长 123%。另外，2021 年上半年，中国智能客服投融资事件有 13 件，投资金额达 23.4 亿元， C 轮至 D 轮融资事件占比高达 50%。从投融资轮次来看，2021 年上半年 C 轮至 D 轮投融资事件最为活跃，可见各细分赛道企业渐趋成熟。其中，智齿科技、来也科技、乐言科技、 Udesk、晓多科技、小能科技等智能客服厂商，颇受资本市场青睐。

[attach]800926[/attach]

Chat-GPT 模型的亮眼表现的背后是研究者在 Transformer 模型前进的道路上发现了类反馈强化学习这一方法带来的潜力，对产业界而言，数据质量的优化、AI 研究人员的储备与计算能力将是未来能否走在 AI 应用前沿的核心能力。Chat-GPT 的成功证明了 Transformer 模型并非陷入困境，不断的 AI 技术方法上的新突破正驱动全球 AI 产业进入加速发展阶段，叠加 AI 产业集群效应的不断凸显，AI 产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI 产业有望继续保持“芯片+算力基础设施+AI 框架&算法库 +应用场景”的稳定产业价值链结构，拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为产业受益者。建议持续关注：特斯拉、英伟达、AMD、高通、微软、谷歌、 Mobileye 等。
以上内容仅供学习交流，不构成投资建议。详情参阅原报告。
精选报告来源【远瞻智库】，获取报告点击：报告中心-远瞻智库|为三亿人打造的有用知识平台

作者: 官峰轩985 时间: 2023-2-11 14:37
转发了

作者: 建鸿法援 时间: 2023-2-11 14:37
转发了

作者: lkamxmk 时间: 2023-2-11 14:37
转发了

作者: 天下无贼 时间: 2023-2-11 14:38
转发了

作者: 颖_sunshine 时间: 2023-2-11 14:38
[赞][赞][赞]

作者: 造作的时光 时间: 2023-2-11 14:39
转发了

作者: CCAI2019 时间: 2023-2-11 14:39
转发了

作者: 1181998215 时间: 2023-2-11 14:40
这东西也就是个4000块文员的水平，帮你查资料和整理资料，没什么让人震惊的功能。热度很快就会过去。

作者: mk23_usp45 时间: 2023-2-11 14:41
转发了

欢迎光临智客公社 (http://bbs.cnaiplus.com/)