生成式人工智能行业研究：生成式AI加速创新，国内厂商聚力突破

上衫大飞 · 2024-6-1 19:21:12

（报告出品方/作者：国元证券，耿军军、王朗）
第一部分：紧跟全球产业浪潮，国内市场快速发展

国内大模型发展回顾
2022年11月，ChatGPT的问世引发了生成式人工智能大模型在全球的发展浪潮；2023年伊始，国内各大高科技厂商、高校及创业团队相继推出自研大模型；2023年下半年以来，国内大模型持续更新迭代，逐步形成了“百模大战”的火热场面。
国内大模型市场规模
中国大模型市场呈现快速发展态势，根据亿欧智库发布的《2024年中国“百模大战”竞争格局分析报告》，2023年中国语言大模型市场规模达132.3亿元，未来将持续高速增长，预计2027年市场规模将突破600亿元，2023-2027年的复合年均增长率达50.6%。
国内大模型产品最新访问量概况
根据AI产品榜公众号的数据，2024年3-4月，百度旗下文心一言和百度文库AI功能访问量居前；Kimi (Moonshot) 增长势头迅猛，连续两个月访问量快速增长，排名第二；秘塔AI搜索、360AI搜索等搜索类产品也表现出色。整体来看，访问量数据反映了中国AI 大模型市场的活跃度和用户对这些技术的高度兴趣。
第二部分：国产模型百舸争流，技术创新百花齐放

百度文心大模型
文心大模型发展历程：2023年3月，百度发布了文心一言基础技术架构，推出文心大模型3.0版本；5月，百度文心大模型3.5发布，在基础模型升级、技术创新知识点增强、逻辑推理增强以及插件机制等方面取得效果和效率提升。10月17日，百度文心大模型4.0 发布，通过万卡算力、飞桨平台、多维数据、多阶段对齐及可再生训练实现了进一步迭代。李彦宏称，这是迄今为止最强大的文心大模型，综合能力“与GPT-4相比毫不逊色”。
文心大模型进展：在2024年4月的百度Create AI开发者大会上，推出了三款开箱即用的AI开发者神器：智能体开发工具 AgentBuilder、AI原生应用开发工具AppBuilder、以及更专业，支持各种尺寸模型定制的开发工具ModelBuilder。李彦宏在发布会上表示，文心大模型已成为中国最领先、应用最广泛的AI基础模型。与一年前相比，文心大模型的算法训练效率提升了5.1倍，周均训练有效时间达到了98.8%，推理成本更是降至原来的1%。
特色：背靠海量知识积淀和丰富应用场景，百度文心大模型具备知识增强和产业级两大特色，构建了文心“大模型层、工具平台层、产品与社区”三层体系，打通支撑大模型产业落地的关键路径。
文心大模型应用与生态：文心一言2023年3月首发以来用户数突破了2亿，API日均调用量也突破了2亿，服务的客户数达到了8.5万，利用千帆平台开发的AI原生应用数超过了19万。目前，已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。除了百度搜索，百度生态的其他产品，如小度、地图、贴吧、车机等，都能接入智能体的相关能力。
讯飞星火大模型
讯飞星火大模型发展历程回顾：2023年5月6日，讯飞星火V1.0发布，七大核心能力发布；2023年6月9日，讯飞星火V1.5发布，突破开放式问答，再升级多轮对话能力和数学能力；2023年8月15日，讯飞星火V2.0发布，突破代码能力，多模态交互再升级； 2023年10月24日，讯飞星火V3.0发布，通用模型对标ChatGPT（中文超越，英文相当）。
2024年以来，讯飞星火大模型进一步升级。1月30日，科大讯飞发布星火认知大模型V3.5。讯飞星火V3.5的各项能力越来越逼近 GPT-4 Turbo水平，在语言理解、数学能力上已超过了GPT-4 Turbo，代码能力达到了GPT-4 Turbo的96%，多模态理解达到了GPT4V的91%，其中语音的多模态能力已经超过GPT-4。4月26日，支持长文本、长图文、长语音的大模型正式上新，首发星火图文识别大模型，快速识别和学习多类型海量知识，行业场景下的回答更专业、更精准。
讯飞星火大模型行业应用广泛，赋能C端智能硬件产品。星火大模型采用”1+N”架构，”1”是指通用认知大模型，而”N”是指在教育、医疗等领域的落地。星火大模型“云、边、端”解决方案正赋能汽车、家电、运营商等行业。在2024年4月消博会上，科大讯飞将大模型从晦涩的科技概念落地到消费者应用，为旗下多款C端硬件产品打造了全新的大模型功能，软硬结合的解决方案凸显了科大讯飞在大模型时代的独特竞争优势。
阿里通义大模型
通义大模型历程回顾：2023年4月，阿里云正式宣布推出大语言模型“通义千问”，未来阿里所有产品都将接入“通义千问”大模型。2023年10月的云栖大会上，通义千问升级2.0版本，并同时发布八大行业模型。2024年3月，阿里推出两个升级版视觉语言大模型Qwen-VL-Plus、Qwen-VL-Max，大幅提升了图像相关的推理能力以及对图中细节和文字的识别、提取和分析能力，支持百万像素以上的高清分辨率图和各种长宽比的图像。2024年5月，通义千问2.5发布，模型性能全面赶超GPT-4 Turbo。
通义坚定推动大模型开源，推出十多款开源模型。 2023年8月，通义宣布加入开源行列，随之启动马不停蹄的开源狂飙，沿着“全模态、全尺寸”开源的路线，陆续推出十多款开源模型。为顺应不同场景用户的需求，通义推出参数规模横跨5亿到1100 亿的八款大语言模型，小尺寸模型如0.5B、1.8B、 4B、7B、14B，可便捷地在手机、PC等端侧设备部署；大尺寸模型如72B、110B能支持企业级和科研级的应用；中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外，通义还开源了视觉理解模型Qwen-VL、音频理解模型 Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。
2024年4月，阿里云AI智领者峰会在杭州举办，大模型生态进一步繁荣。新东方、同程旅行、青团社、亲宝宝、企迈科技等企业宣布接入阿里通义大模型。新东方基于通义大模型，对在线课堂进行了智能化升级，聚焦学生体验、教师教学质量、教研内容研发等场景，将学员满意度提高3%。通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万，现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
华为盘古大模型
盘古大模型是华为智能化战略的重要基础：华为2021年发布盘古大模型，推出了全球第一个最大的千亿参数的中文语言预训练模型以及30亿参数的视觉预训练模型。2023年，推出盘古大模型3.0，打造AI原生基础设施。未来，华为将深耕行业，解难题，助客户训练大模型；构建昇腾云服务，提供AI算力；打造AI Native云基础设施，突破算力、网络、存储边界，匹配AI算力模型。
华为盘古大模型框架：华为将大模型分为基础大模型L0、行业大模型L1、细分场景模型L2三个层级：基础大模型基于一站式AI开发平台ModelArts进行加速优化训练，其中包括NLP大模型、CV大模型、以及科学计算大模型；L1包括矿山、气象、电力等行业大模型；行业大模型经过相关数据微调和部署，得到场景模型L2。
华为多线产品接入大模型：随着生成式AI技术的演进，Pura70接入盘古大模型，带来了这一代旗舰手机上会出现的AI智能消除、云增强、AI摘要、智能助理等智能化应用。MateBook X Pro 2024年首发接入盘古大模型，大模型的加入将进一步提升该笔记本的 AI体验。另外，智界S7方面，基于盘古大模型的小艺助手也在5月OTA推送，赋能车端智慧应用。
商汤日日新大模型
商汤日日新大模型：2024年2月，商汤“日日新SenseNova 4.0”大模型体系发布，在长文本理解、综合推理（包括数字推理）、代码生成、多模态交互等方面升级，不仅全面超越了GPT-3.5，并且大部分接近甚至超越了GPT-4系列模型。推理能力达到GPT-4 Turbo的99%；代码能力在HumanEval代码生成基准测试上准确率达到75.6，超越GPT-4(74.4)；多模态能力在MMBench多模态大语言模型综合评估基准上的整体性能超越了GPT-4V(84.4 vs 74.4)。
2024年4月23日，商汤科技发布“日日新SenseNova 5.0”大模型系列，采用混合专家(MoE)架构，支持10T Tokens中英文训练数据，推理合成数据达数千亿Token，推理上下文窗口可达约200K，综合能力对标GPT-4 Turbo。根据公司公告，2023年商汤实现营收34亿元，其中“日日新”大模型+大装置驱动生成式AI业务爆发式增长200%，收入达12亿元，为集团贡献35%的营收。
腾讯混元大模型
腾讯混元大模型发展历程：2023年9月，腾讯混元大语言模型正式亮相，并宣布通过腾讯云对外开放，这是腾讯首次披露的通用大语言模型，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。混元已接入腾讯50多个业务并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。
Kimi智能助手
Kimi发展历程：2023年10月，月之暗面发布了Kimi智能助手，初始版本支持约20万汉字无损上下文输入，创造了消费级AI产品所支持的上下文输入长度纪录。2024年3月，月之暗面宣布Kimi智能助手现已支持200万字的无损上下文输入。月之暗面成立于2023年4月，成立不到3个月就获真格基金与红杉中国的天使轮融资，创始人杨植麟与三位联合创始人张宇韬、周昕宇、吴育昕均毕业于清华，核心成员曾参与谷歌Bard、盘古、悟道等多个大模型的研发。
阶跃星辰
阶跃星辰发展历程：2023年4月，阶跃星辰成立，创始人姜大昕是前微软全球副总裁、微软亚洲互联网工程院首席科学家；8月，发布Step-1千亿参数语言大模型；11月，千亿参数多模态大模型Step-1V训练完成。2024年3月，公司发布Step-2万亿参数MoE语言大模型预览版，是国内大模型初创公司首次发布的万亿参数模型，背后是阶跃星辰团队对大模型技术发展路径的深入理解。
智谱AI
智谱AI发展历程：智谱AI成立于2019年6 月，源自清华大学计算机系知识工程实验室(KEG)；2022年，智谱和清华合作研发了双语千亿大模型GLM-130B，作为大模型平台及产品矩阵的基座。2023年8 月，智谱基于中英双语对话模型 ChatGLM2的生成式AI助手“智谱清言” 通过备案。2024年1月，智谱发布了新一代基座大模型GLM-4，整体性能逼近 GPT-4，具备128K上下文窗口长度，在总结信息、内容抽取、复杂推理、代码等多个应用场景实现了复杂长文本能力；多模态能力方面， MMLU(81.5) 达到 GPT-4 94%水平，HumanEval(72)达到 GPT-4 100%水平。
字节跳动豆包大模型
2024年，5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台，据火山引擎总裁谭待介绍，经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理 1200亿Tokens文本，生成3000万张图片。字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具，并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务，用以提升效率和优化产品体验。
报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）
精选报告来源：【未来智库】。未来智库 - 官方网站

		自动登录	找回密码
密码			立即注册

生成式人工智能行业研究：生成式AI加速创新，国内厂商聚力突破

本帖子中包含更多资源

最近发表

公社版块

关注我们