找回密码
 立即注册
搜索

生成式人工智能行业研究:生成式AI加速创新,国内厂商聚力突破

(报告出品方/作者:国元证券,耿军军、王朗)
第一部分:紧跟全球产业浪潮,国内市场快速发展

国内大模型发展回顾
2022年11月,ChatGPT的问世引发了生成式人工智能大模型在全球的发展浪潮;2023年伊始,国内各大高科技厂商、高校及创业 团队相继推出自研大模型;2023年下半年以来,国内大模型持续更新迭代,逐步形成了“百模大战”的火热场面。
国内大模型市场规模
中国大模型市场呈现快速发展态势,根据亿欧智库发布的《2024年中国“百模大战”竞争格局分析报告》,2023年中国语言大模 型市场规模达132.3亿元,未来将持续高速增长,预计2027年市场规模将突破600亿元,2023-2027年的复合年均增长率达50.6%。
国内大模型产品最新访问量概况
根据AI产品榜公众号的数据,2024年3-4月,百度旗下文心一言和百度文库AI功能访问量居前;Kimi (Moonshot) 增长势头迅猛, 连续两个月访问量快速增长,排名第二;秘塔AI搜索、360AI搜索等搜索类产品也表现出色。整体来看,访问量数据反映了中国AI 大模型市场的活跃度和用户对这些技术的高度兴趣。
第二部分:国产模型百舸争流,技术创新百花齐放

百度文心大模型
文心大模型发展历程:2023年3月,百度发布了文心一言基础技术架构,推出文心大模型3.0版本;5月,百度文心大模型3.5发布, 在基础模型升级、技术创新知识点增强、逻辑推理增强以及插件机制等方面取得效果和效率提升。10月17日,百度文心大模型4.0 发布,通过万卡算力、飞桨平台、多维数据、多阶段对齐及可再生训练实现了进一步迭代。李彦宏称,这是迄今为止最强大的文心 大模型,综合能力“与GPT-4相比毫不逊色”。
文心大模型进展:在2024年4月的百度Create AI开发者大会上,推出了三款开箱即用的AI开发者神器:智能体开发工具 AgentBuilder、AI原生应用开发工具AppBuilder、以及更专业,支持各种尺寸模型定制的开发工具ModelBuilder。李彦宏在发布会 上表示,文心大模型已成为中国最领先、应用最广泛的AI基础模型。与一年前相比,文心大模型的算法训练效率提升了5.1倍,周 均训练有效时间达到了98.8%,推理成本更是降至原来的1%。
特色:背靠海量知识积淀和丰富应用场景,百度文心大模型具备知识增强和产业级两大特色,构建了文心“大模型层、工具平台层、 产品与社区”三层体系,打通支撑大模型产业落地的关键路径。
文心大模型应用与生态:文心一言2023年3月首发以来用户数突破了2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万, 利用千帆平台开发的AI原生应用数超过了19万。目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。除了百 度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力。
讯飞星火大模型
讯飞星火大模型发展历程回顾:2023年5月6日,讯飞星火V1.0发布,七大核心能力发布;2023年6月9日,讯飞星火V1.5发布,突 破开放式问答,再升级多轮对话能力和数学能力;2023年8月15日,讯飞星火V2.0发布,突破代码能力,多模态交互再升级; 2023年10月24日,讯飞星火V3.0发布,通用模型对标ChatGPT(中文超越,英文相当)。
2024年以来,讯飞星火大模型进一步升级。1月30日,科大讯飞发布星火认知大模型V3.5。讯飞星火V3.5的各项能力越来越逼近 GPT-4 Turbo水平,在语言理解、数学能力上已超过了GPT-4 Turbo,代码能力达到了GPT-4 Turbo的96%,多模态理解达到了GPT4V的91%,其中语音的多模态能力已经超过GPT-4。4月26日,支持长文本、长图文、长语音的大模型正式上新,首发星火图文识别 大模型,快速识别和学习多类型海量知识,行业场景下的回答更专业、更精准。
讯飞星火大模型行业应用广泛,赋能C端智能硬件产品。星火大模型采用”1+N”架构,”1”是指通用认知大模型,而”N”是指在教育、医 疗等领域的落地。星火大模型“云、边、端”解决方案正赋能汽车、家电、运营商等行业。在2024年4月消博会上,科大讯飞将大模 型从晦涩的科技概念落地到消费者应用,为旗下多款C端硬件产品打造了全新的大模型功能,软硬结合的解决方案凸显了科大讯飞在 大模型时代的独特竞争优势。
阿里通义大模型
通义大模型历程回顾:2023年4月,阿里云正式宣布推出大语言模型“通义千问”,未来阿里所有产品都将接入“通义千问”大模 型。2023年10月的云栖大会上,通义千问升级2.0版本,并同时发布八大行业模型。2024年3月,阿里推出两个升级版视觉语言大 模型Qwen-VL-Plus、Qwen-VL-Max,大幅提升了图像相关的推理能力以及对图中细节和文字的识别、提取和分析能力,支持百万 像素以上的高清分辨率图和各种长宽比的图像。2024年5月,通义千问2.5发布,模型性能全面赶超GPT-4 Turbo。
通义坚定推动大模型开源,推出十多款开源模型。 2023年8月,通义宣布加入开源行列,随之启动马 不停蹄的开源狂飙,沿着“全模态、全尺寸”开源 的路线,陆续推出十多款开源模型。为顺应不同场 景用户的需求,通义推出参数规模横跨5亿到1100 亿的八款大语言模型,小尺寸模型如0.5B、1.8B、 4B、7B、14B,可便捷地在手机、PC等端侧设备 部署;大尺寸模型如72B、110B能支持企业级和科 研级的应用;中等尺寸如32B试图在性能、效率和 内存占用之间找到最具性价比的平衡点。此外,通 义还开源了视觉理解模型Qwen-VL、音频理解模型 Qwen-Audio、代码模型CodeQwen1.5-7B、混合 专家模型Qwen1.5-MoE。
2024年4月,阿里云AI智领者峰会在杭州举办,大模型生态进一步繁荣。新东方、同程旅行、青团社、亲宝宝、企迈科技等企业宣 布接入阿里通义大模型。新东方基于通义大模型,对在线课堂进行了智能化升级,聚焦学生体验、教师教学质量、教研内容研发等 场景,将学员满意度提高3%。通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航 空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
华为盘古大模型
盘古大模型是华为智能化战略的重要基础:华为2021年发布盘古大模型,推出了全球第一个最大的千亿参数的中文语言预训练模 型以及30亿参数的视觉预训练模型。2023年,推出盘古大模型3.0,打造AI原生基础设施。未来,华为将深耕行业,解难题,助客 户训练大模型;构建昇腾云服务,提供AI算力;打造AI Native云基础设施,突破算力、网络、存储边界,匹配AI算力模型。
华为盘古大模型框架:华为将大模型分为基础大模型L0、行业大模型L1、细分场景模型L2三个层级:基础大模型基于一站式AI开 发平台ModelArts进行加速优化训练,其中包括NLP大模型、CV大模型、以及科学计算大模型;L1包括矿山、气象、电力等行业大 模型;行业大模型经过相关数据微调和部署,得到场景模型L2。
华为多线产品接入大模型:随着生成式AI技术的演进,Pura70接入盘古大模型,带来了这一代旗舰手机上会出现的AI智能消除、 云增强、AI摘要、智能助理等智能化应用。MateBook X Pro 2024年首发接入盘古大模型,大模型的加入将进一步提升该笔记本的 AI体验。另外,智界S7方面,基于盘古大模型的小艺助手也在5月OTA推送,赋能车端智慧应用。
商汤日日新大模型
商汤日日新大模型:2024年2月,商汤“日日新SenseNova 4.0”大模型体系发布,在长文本理解、综合推理(包括数字推理)、 代码生成、多模态交互等方面升级,不仅全面超越了GPT-3.5,并且大部分接近甚至超越了GPT-4系列模型。推理能力达到GPT-4 Turbo的99%;代码能力在HumanEval代码生成基准测试上准确率达到75.6,超越GPT-4(74.4);多模态能力在MMBench多模态大 语言模型综合评估基准上的整体性能超越了GPT-4V(84.4 vs 74.4)。
2024年4月23日,商汤科技发布“日日新SenseNova 5.0”大模型系列,采用混合专家(MoE)架构,支持10T Tokens中英文训练数 据,推理合成数据达数千亿Token,推理上下文窗口可达约200K,综合能力对标GPT-4 Turbo。根据公司公告,2023年商汤实现营 收34亿元,其中“日日新”大模型+大装置驱动生成式AI业务爆发式增长200%,收入达12亿元,为集团贡献35%的营收。
腾讯混元大模型
腾讯混元大模型发展历程:2023年9月,腾讯混元大语言模型正式亮相,并宣布通过腾讯云对外开放,这是腾讯首次披露的通用大 语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。混元已接入腾讯50多个业务并取 得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。
Kimi智能助手
Kimi发展历程:2023年10月,月之暗面发布了Kimi智能助手,初始版本支持约20万汉字无损上下文输入,创造了消费级AI产品所 支持的上下文输入长度纪录。2024年3月,月之暗面宣布Kimi智能助手现已支持200万字的无损上下文输入。 月之暗面成立于2023年4月,成立不到3个月就获真格基金与红杉中国的天使轮融资,创始人杨植麟与三位联合创始人张宇韬、周 昕宇、吴育昕均毕业于清华,核心成员曾参与谷歌Bard、盘古、悟道等多个大模型的研发。
阶跃星辰
阶跃星辰发展历程:2023年4月,阶跃星辰成立,创始人姜大昕是前微软全球副总裁、微软亚洲互联网工程院首席科学家;8月, 发布Step-1千亿参数语言大模型;11月,千亿参数多模态大模型Step-1V训练完成。2024年3月,公司发布Step-2万亿参数MoE语 言大模型预览版,是国内大模型初创公司首次发布的万亿参数模型,背后是阶跃星辰团队对大模型技术发展路径的深入理解。
智谱AI
智谱AI发展历程:智谱AI成立于2019年6 月,源自清华大学计算机系知识工程实 验室(KEG);2022年,智谱和清华合作 研发了双语千亿大模型GLM-130B,作为 大模型平台及产品矩阵的基座。2023年8 月 , 智 谱 基 于 中 英 双 语 对 话 模 型 ChatGLM2的生成式AI助手“智谱清言” 通过备案。2024年1月,智谱发布了新一 代基座大模型GLM-4,整体性能逼近 GPT-4,具备128K上下文窗口长度,在 总结信息、内容抽取、复杂推理、代码 等多个应用场景实现了复杂长文本能力; 多 模 态 能 力 方 面 , MMLU(81.5) 达 到 GPT-4 94%水平,HumanEval(72)达到 GPT-4 100%水平。
字节跳动豆包大模型
2024年,5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总 裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200亿Tokens文本,生成3000万张图片。 字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创 作工具,并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务,用以提升效率和优化产品体验。
报告节选:













































































































(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。未来智库 - 官方网站

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册