Transformer 架构横空出世,Open AI 发布的 GPT 模型,AI 进入“大模型”时代。 GPT(Generative Pre-Training,GPT)模型利用更大规模的文本数据以及更深层的神经网络模型学习更丰富的文本语义表示,打破了自然语言处理各个任务之间的壁垒,使得搭建一 个面向特定任务的自然语言模型不再需要非常多的任务北京,只需要根据任务的输入和输 出形式应用预训练模型便可达到满意效果。NLP 模型的搭建只需要“无监督预训练+有监 督的精调”两阶段: (1)生成式预训练:在大规模文本数据上训练一个高容量的语言模型,以学习更丰富 的上下文信息; (2)判别式任务精调:将预训练好的模型适配到下游任务中,并使用有标注数据学习 判别式任务; 从 GPT 到 GPT-2 和 GPT-3,参数提升和训练数据积累提升模型工作性能。到了 GPT2 阶段,Open AI 将自然语言模型定义为要完成零样本无监督多任务学习的目标,即预训 练好的模型可以直接用于下游任务。GPT-2 模型在学习更广泛的数据信息,增加了模型的 维度参数后,不需要针对特定的任务修改模型,将任务也作为提示词,和文本一起输入预 训练好的模型。 承接 GPT-2 的核心思想,到了 GPT-3,模型参数量达到了 1750 亿,在不进行微调的情 况下可以在多个 NLP 基准上达到最先进的性能。GPT 模型的演进为国内外 AI 大厂提供了 重要的借鉴意义,即通过优质训练数据输入和模型复杂度的增加来提升模型性能,而未来 AI 以少样本乃至无样本学习为核心目标。
AI 大模型在任务准确度和场景泛化性方面提升显著,在此基础上针对不同实际场景提 炼出针对性的 AI 小模型以完成特定任务,可大大降低 AI 商业化部署的成本,提高训练速 度。其中,Transformer 架构和 GAN 模型为现在的语言文本生成和图像生成奠定了基础。 GAN 模型参考博弈学习理论,通过内部两个模型的互相博弈,实现图像视频的 AI 自 动生成。生成式对抗网络(GAN,Generative Adversarial Networks)是近年来复杂分布上无 监督学习最具前景的方法之一。模型通过框架中两个模块:生成模型(Generative Model) 和判别模型(Discriminative Model)的互相博弈学习产生输出。判别模型负责判断一个实 例是真实的还是模型生成;而生成模型负责生成实例来骗过判别模型。两个模型对抗中最 达到平衡,即生成模型生成的实例与真实的没有区别,判别模型无法区分输入数据是生成 的还是原始真实的数据。
GAN 模型应用广泛,成为 AIGC 重要底层框架但早期存在问题。GAN 模型应用包含 逼真图片生成、图片翻译、3D 建模等,但由于基础的 GAN 模型存在收敛不稳定、容易受 到部分图片样本欺骗等问题,初期生成的图像可能存在失真问题,适用范围相对局限。
[attach]802927[/attach]
2.1.4 第四次 AI 浪潮,AIGC 从文本拓展至图像及音视频领域,商业化空间打开
AIGC 在图片、音视频领域的模型在大模型基础上持续优化,性能趋向商用化需求, 空间有望打开。我们认为以 ChatGPT 为代表,AI 将进入创造(创作)时代,引领第四次 人工智能浪潮。AIGC 以自动化生产和高效为两大特点,目前已经可以自动生成文字、图 片、音频、视频,甚至 3D 模型和代码。未来大量数字原生内容有望由 AI 协助完成创作。 底层技术的突破使 AIGC 商业落地成为可能,模型迭代推动 AI 生成文字和图片质量 实现质的提升。在图像生成领域。
Diffusion 模型参考热力学原理,大幅提高生成图像的稳定性、准确性以及计算效率。 扩散模型(Diffusion Model)的灵感来自非平衡热力学,模型训练过程中缓慢地将随机噪 声添加到数据中,然后通过反转这个噪声过程,来学习恢复数据。不同于 GAN 模型,扩 散模型不依赖于生成与对抗两个模型的博弈,因此学习结果更加稳定,并且模型的并行性 和扩展性更好,之后推出的 Stable Diffusion 模型在计算效率上显著提升,满足企业级和消 费级的使用需求。 CLIP 模型打破了传统分类器界限,可以在不需要额外训练集的情况下,以良好的性 能完成各种计算机视觉任务。CLIP 模型对问题进行了重新定义并不再预测文本标签,取而 代之的是预测图像与文本相匹配的可能性大小,在大规模数据集上完成的训练后能够学习 到了图像的各方面信息。
Make-A-Video 模型实现 AI 基于文本、图像智能生成视频。在视频生成领域,Meta 公 司继承了图像生成模型的核心技术,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成。由于模型训练量要求过 大,目前该模型只能实现几秒钟的短视频生成,未来有望随着模型的迭代实现中视频和长 视频的生成。
[attach]802928[/attach]
2.2 未来 AI 发展的两大路线,工程方法+科学方法将交替占据行业主流
人工智能的发展进程中形成符号主义和连接主义两大阵营,从工程维度和科学维度优 化迭代 AI 模型。在 AI 发展早期,由于数据量较少,AI 模型容易用符号模型表征,因此符 号主义发展较快,而后来数据量提升,问题和任务的复杂度增加,导致基于复杂模型结构 的连接主义兴起,并形成了目前一系列 AI 范式。 我们认为在 AIGC 主导的人工智能商业化进程中,符号主义和连接主义仍将作为 AI 迭 代的两个重要方向。其中,AI 在细分场景中的应用将推动大量时序性的复杂信息输入到模 型当中,因此对场景数据(尤其是非标准化的数据)的处理有望迎来重大发展;其次,目 前 AI 在长视频、虚拟人、高清图像等领域的智能生成仍存在局限性,我们看好通过模型的 迭代和对人类神经网络的研究和模拟,提升 AI 的准确度、计算效率等指标。
计算机算力以及 AI 在细分场景下的渗透率提升推动 AI 模型训练数据量爆炸式成长, 通过增加模型参数及数据量提高 AI 的计算速度和准确度。大模型通过超大规模的参数设 置和数据输入,具有基础、通用和综合的特点,而小模型基于实际任务场景的需求,通过 高质量场景数据的输入和训练,使 AI 能够出色完成特定任务。在 NLP 领域,以 Google 发 布的 BERT 模型和 Open AI 提出的 GPT 模型为典型代表。AI 通过大模型的预训练,能够 在处理语言、推理、人机交互等领域任务上的表现实现极大提升,打开了 AI 渗透到各行业 进行商业应用路径。
[attach]802929[/attach]
以 Transformer 为代表性成就,AI 模型在模拟人脑思维模式中不断进步。Transformer 架构的核心在于注意力机制的使用,这使得 AI 模型在计算过程中可大幅节约消耗在无关信 息上的算力,除此之外,残差网络、多巴胺机制的强化学习等模型均参考了脑科学领域的 研究成果,通过嵌入响应的信号处理模块,节约算力消耗的同时提升计算效率。 2.3 未来发展方向预计,数据+模型+算力供应仍为三大发展方向 2.3.1 趋势一:AI 发展带动基础数据市场成长,高质量标注数据决定模型训练效果
AI 模型发展带动训练数据需求升高,标注和结构化处理真正实现将数据转为为 AI 商 业价值。随着 AI 与各个产业结合得愈加紧密,AI 商业化程度进入新阶段,企业对 AI 在商 业化落地中的表现要求越来越高。为了保证 AI 算法的识别精度,数据标注的质量也就变得 至关重要。 AIGC 向图像、语音、文字多维数据延伸,AI 基础数据服务与治理赛道有望受益加速 成长。数据服务是利用数据采集与标注工具处理图片、语音、文本等非结构化数据,数据治理则使用数据治理的各模块管理多源异构数据,提高数据质量并形成数据资产。高质量 的数据可供各行业 AI 厂商训练模型,并支撑各场景商业化产品的落地。 数据标注目前仍以人工为主,行业向智能化和去人工化趋势演进,标注数据生产效率 与 AI 模型进步协同共振。不同于计算机视觉领域 AI 模型训练所用的图像数据,NLP 模型 训练的数据往往来自于半结构化或非结构化的信息,目前无法实现 AI 算法模型的自动化标 注,目前主流的实现路径是人工标注与智能标注协同方案,即人工完成一小部分的数据标 注,再借助算法模型对剩余数据进行标注,通过人工对部分难例数据样本的二次标注后, 最终形成高质量的标注数据。 2.3.2 趋势二:场景模型持续简化以提升训练速度,控制成本满足商业化应用需求
大模型微调成本和维护成本过高。目前大模型厂商在用户需求较大时,微调成本和模 型维护成本会相当高,若仅提供推理服务,成本可以大幅降低但是模型精度会受到较大牺 牲,从而降低大模型的竞争力。并且 AI 项目实施通常会把模型部署到终端,对算力的要求 非常高,因此国内外大厂及研究院所均致力于对预训练模型进行“瘦身”。 模型蒸馏与迁移学习成为 AI 领域研究新方向,可大幅优化终端模型计算的时效性并 节约算力成本。“知识蒸馏”概念可类比于学校中的教学行为,可有效地压缩预训练模型的 大小。知识蒸馏包含已训练的 Teacher Model 和待训练的 Student Model,通过知识蒸馏和 迁移学习,学生网络可以拥有与教师网络相似和相近的计算性能。 知识蒸馏可以在基于高度复杂的大模型训练基础上,提升细分任务小模型的计算精 度,同时也可以有效降低模型延迟,并且压缩网络参数。基于知识蒸馏思想改进 BERT 预 训练模型,实现模型的简化和速度的提升。Distilled BERT 模型直接将 BERT 的部分参数作 为初始化,模型参数只有 BERT 的约 40%,但速度快提升 60%,同时保留了 97%的语言理 解能力。我们认为在人工智能通往商业化应用的道路上,早期专注于增加数据量、计算能 力或者训练过程的优化方式可能不再适用,未来各大厂商需要计算与预测性能之间做出权 衡,探索如何利用更少的数据与计算资源,帮助模型实现性能提升。 2.3.3 趋势三:AI 应用落地拉动算力需求,AI 基础设施市场规模有望加速成长
高算力支持是训练 AI 大规模商业化的基础,AI 基础设施市场有望迎来爆发。微软入 资 OpenAI 后双方达成多年的合作协议,OpenAI 接入微软的 Azure 云平台开发 AI 技术。 高算力的底层基础设施是完成对海量数据处理、训练的基础。我们认为 AI 技术发展逐渐成 熟,数字化基础设施不断建设完善,将拉升 AI 芯片、AI 服务器的市场需求。AI 商业化应 用的加速落地,将推动我国 AI 基础设施市场规模的加速成长 市场规模加速成长,国内细分赛道龙头厂商有望受益。《2022-2023 中国人工智能计算 力发展评估报告》指出,预计到 2026 年全球 AI 服务器市场规模将达到 347.1 亿美元,五 年复合增长率为 17.3%。中商产业研究院数据预计,2023 年我国 AI 芯片以及云计算市场 规模将分别达到 1206 亿元和 6975 亿元,同比分别增长 41.9%和 47.0%,AI 基础设施市场 规模快速成长。
[attach]802930[/attach]
3 对标海外生态,AIGC 有望推动 AI 商业化下沉各细分场景
3.1 海外科技大厂主导,各细分场景玩家涌现,商业模式雏形已现 3.1.1 微软、谷歌等大厂科研实力雄厚,推动 AIGC 核心技术不断进步
海外科技巨头发力布局,自有业务生态及强大科研实力成为核心竞争力。在经历了移 动互联网浪潮下科技巨头竞争后,谷歌、Meta、微软等国外科技大厂近年来在 AIGC 领域 均有所布局,并在聊天交互、图像生成特定领域取得了一系列突破性进展,同时部分成果 已投入商业化应用。
DALL-E2 模型可实现文本到图像的智能生成。2022 年 4 月 OpenAI 发布 DALL-E2 模 型,只需输入简短的文字 prompt 就可以生成全新的图像,甚至可以修改现有图像,创建保 有其显著特征的图像变体。DALL-E2 的训练数据来自互联网上大规模匹配的自然语言-图 像数据,因此消除了手动标注数据集的成本瓶颈。 DALL-E2 工作过程中,首先将文本 prompt 输入到经过训练的文本编码器中,接着将 文本编码映射到相应的图像编码,该图像编码捕获文本编码中包含的语义信息,最后,图 像解码模型生成图像,该图像是该语义信息的视觉表现。 Meta 在已有 AI 图像生成技术上更进一步,实现基于文本、图片生成短视频的 AIGC 模型。Meta AI 将 Make-A-Video 分割成三个组成部分并分开训练,分别是基础的文字生成 图像 AI 模型、学习视频中图像在时间维度上的动态变化的 AI 模块,以及超分辨率模型和 插帧模型以提高视频画质(分辨率和帧率)。
[attach]802931[/attach]
科技大厂主导 AIGC 在前沿领域的科学研究,为人工智能的商业化持续拓展想象空 间。谷歌母公司 Alphabet 旗下子公司 Deepmind 开发了 Alphafold 2 模型,通过预测蛋白质 中每对氨基酸之间的距离分布以及化学键之间的角度,实现对蛋白质结构三维模型的准确 预测。Alphafold2 模仿人类注意力的网络架构采用 Attention 机制,可以同时聚焦多个细节 部分,使得框架预测的结果更加全面和准确。 Meta Cicero 可在人机交互中表现出谈判技巧、同理心等,未来有望应用到各类社交 场景。2022 年 11 月,Meta 发布了具有谈判、说服和合作能力的人工智能 Cicero,在策略 游戏《外交》的测试中,Cicero 可以与其它人类玩家以自然语言沟通,甚至使用各类谈判 技巧以实现游戏目标,创建伙伴关系和联盟,最终进入游戏参与者排名的前 10%。Meta 认 为 Cicero 的核心技术未来有望创造更加智能的 NPC,以及在多会话对话中缓解人类与 AI 之间的沟通障碍,将 AI 应用到更加广泛的社交场景。 3.1.2 细分赛道涌现大量初创公司,不断探索 AI 商业化应用的产品形态及服务模式
大模型 API 公布和模型开源催生 AIGC 创业浪潮,细分赛道内大量玩家在产品及商业 模式等方面持续探索,AI 商业化生态有望加速形成。AIGC 有望赋能内容生成领域的成本 下降和效率提升,目前海外公司在文案写作、图像生成、音视频创作等领域持续布局。细 分赛道内玩家在相对统一的底层模型基础上,探索与实际应用场景深度融合的落地产品。
文本创作领域,基于 GPT 语言模型,AI 在邮件、营销文案写作领域已有深度应用。 Jasper AI 成立于 2020 年,公司定位是营销领域类的素材撰写,基于 AI 模型可为用户提供 50 多种模板并生成对应的文案,可覆盖大部分的营销场景。公司产品优势包含了更符合 Google SEO 规则、草稿创作效率更好、支持 26 种语言等六大优势。 Jasper AI 面向个人及企业用户,采用 SaaS 订阅制收费模式。Jasper AI 提供 Boss Mode 和 Business 两种计费模式,其中 Boss 模式针对个人及小组织(不超过 5 人)用户, 基础收费为 49 美元/月,可使用不超过 5 万字,最高收费为 500 美元/月,可使用 70 万字。 Notion AI 实现文本写作、语法纠错、机器翻译等功能,提高笔记类产品功能价值。 Notion 笔记工具融合了文档、任务、知识库以及数据库功能,作为生产力工具服务于互联 网群体。Notion AI 模块出色地解决了用户在使用笔记场景下遇到的大部分问题,如翻译、 写作、内容发布等。Notion 产品通过免费+低价策略积累了超 3000 万用户,未来随着 Notion AI 模块的投入商用,有望提高客单价,提升产品营收能力。
[attach]802932[/attach]
图像生成领域,扩散模型的快速迭代大幅提升 AI 生成图像的性能,Stability AI 公司 基于开源框架构建庞大内容生态。Stability AI 自成立以来,一直致力于开发面向全球消费 者和企业用例的图像、语言、音频、视频、3D 等开放 AI 模型,公司开源的底层代码使得 开发者可以绕开数据方面的限制,可为用户自己的商业产品提供动力。 2022 年 8 月,公司发布了面向消费者的 Dream Studio 应用程序,用户可在平台上通过 自然语言描述创建逼真的图像、艺术和动画,目前平台注册用户已超过 100 万,用户来自 全球 50 多个国家,创建了超过 1.7 亿张图像。用户可免费使用开源的 Diffusion 模型,但需 要为 Dream Studio 平台生成的图像付费,平台采用点数充值的模式,用户可按照每 100 点 数 1 英镑(合)的比例兑换积分,并根据生成图像的分辨率和渲染次数兑付不同数量的点 数。以渲染 150 次、分辨率为 1024*1024 的图像为例,单张图片的价格约为 0.282 英镑。
Midjourney 利用 AI 智能生成图像,使用门槛低且图片可用性高。用户通过 Discord 平台,输入希望实现画面的文字,平台即可在一分钟的时间内完成四张缩略图的生成并就 行逐步渲染,用户选择相对满意的一张图片可继续细化,如变形、放大尺寸和细节优化等 操作。 Discord 平台根据 GPU 使用时长、图片是否公开、图片生成数量的不同提供多种付费 模式,免费版本可生成 25 张图片,而企业级版本(600 美元/年)每年可使用至少 120h 的 GPU 时间用于生成图片。
Play.ht 基于 AI 驱动实现文本到语音的智能生成。Play.ht 依靠 AI 从 IBM、微软、亚 马逊和谷歌生成音频和语音,该工具对于将文本转换为自然声音尤为有用并且允许下载 MP3 和 WAV 文件格式的语音。Play.ht 拥有将播客文章转换为音频、实时语音合成、拥有 超 570 种口音和声音、可提供逼真的配音的特点及优势。 Play.ht 根据转换成音频的文本大小提供多种收费方案,专业版提供每年 60 万字(词) 的语音生成权限,且生成的音频文件可用于商业用途,该方案定价为 29.25 美元/月, Premium 版本则可以根据用户的个性化需求,调整 AI 声音的发音特点。
[attach]802933[/attach]
3.2 国内科技大厂相继入局,基于内容生态市场空间广阔 3.2.1 科技大厂持续开拓中文 AIGC,借助业务生态有望推出爆款应用产品
国内科技大厂布局生成式 AI,未来有望借助业务生态推出爆款应用产品。百度、阿里 巴巴、腾讯、字节跳动等国内科技大厂相继布局 AIGC 领域,在图片生成、视频生成、3D 建模等细分场景下推出相关应用,未来有望在业务生态中打造爆款产品。
百度深度布局 AIGC 多年,围绕自有业务生态形成核心竞争力,在中文 AI 领域优势 显著。2022 年 12 月,百度智能云发布国内首个全栈自研的 AI 基础设施“AI 大底座”,具 备标准化输出 AI 的底层能力。百度围绕各场景,在 NLP、CV、跨模态、生物计算等领域形成大模型。百度过去十年累积投入研发资金超 1000 亿元,并且连续四年在 AI 专利申请 量和授权量上保持国内第一,技术优势明显。
对标 ChatGPT,百度计划近期完成产品内测,有望加速 AI 产品商用化进程。近日, 百度官方宣布,将在 3 月份完成其 ChatGPT 产品的内测并面向公众开放,该项目名字确定 为文心一言,英文名 ERNIE Bot。公司产业级知识增强文心大模型 ERNIE 具备跨模态、跨 语言的深度语义理解与生成能力,对标微软对 OpenAI 核心技术的布局,我们认为百度有 望将对标产品应用到业务矩阵下的消费级和企业级应用中,加速 AI 商业化进程。
[attach]802934[/attach]
中文 AI 大模型持续迭代,国内人工智能底层技术能力已相对成熟。除百度之外,国 内浪潮、华为等公司均持续布局,在中文 AI 巨量模型领域的创新和应用上持续突破,为 AI 在各场景的深度应用奠定坚实基础。 浪潮“源 1.0”AI 大模型超越 GPT-3,在语言智能领域表现优异。2021 年 9 月,浪潮 信息发布 AI 大模型“源 1.0”,参数量超越 GPT-3 达 2457 亿,成为全球最大规模的 AI 巨 量模型。“源 1.0”模型训练采用超 5000GB 的中文数据集,在语言智能方面表现优异,在 文献分类、新闻分类,商品分类、原生中文推理、成语阅读理解填空、名词代词关系等任 务上位居行业内领先地位,并且在成语阅读理解填空项目中的表现已超越人类得分。 华为基于“盘古”AI 大模型发展行业应用模型,赋能行业效率提升。2022 年 11 月, 华为发布气象大模型,提供秒级天气预报,如重力势、湿度、风速、温度,气压等变量的 1 小时-7 天预测。盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当 前最先进的预报方法,同时速度相比传统方法提升 1000 倍以上。盘古气象大模型支持广泛 的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模 型可以降低 20%以上的位置误差。 3.2.2 国内细分赛道涌现大量垂类公司,关注实际业务场景下的 AI 应用渗透
依托国内丰富内容生态,垂类公司探索 AI 应用产品,AIGC 将有望成为内容生态发 展的新引擎。我们认为 AIGC 发展根据内容分类,主要可以分为 3 个阶段:一是 AIGC 内 容生产技术完善阶段,实现文本、视频、图片生成以及三者的跨模态转换;二是多模态生 成技术的聚合应用,以虚拟人为代表;三是虚拟内容生态,即元宇宙。目前国内外仍然处 于第一阶段,AIGC 内容以文本、图片和视频为主。 目前国内各细分赛道垂类公司布局有望推动 AI 商业化在实际场景中的深度应用。近几 年来,在法律、营销、医疗、人机交互等领域不断涌现垂类公司,基于 AI 在文本、图像和 音视频等方面赋能业务的效率及产品竞争力的提升。
对标海外公司发展,内容型公司有多种商业模式可选择,业务结合场景深度将决定玩 家核心竞争力。目前海外 AIGC 公司的商业模式大体可分为底层平台对外开放按照实际数 据量收费、按产出内容收费、类 SaaS 的软件服务收费、有偿模型使用等,其核心是在于赋 能下游 B 端及 C 端用户的实际业务效率和质量提升,因此企业需要对一体化解决方案、行 业深度绑定、业务闭环等领域不断耕耘。 3.3 国内内容生态市场空间广阔,政策支持下看好 AI 应用加速渗透
国内成熟内容生态为 AI 应用提供沃土,虚拟人有望催生新内容需求。以短视频生态 为例,根据前瞻产业研究院预计,到 2027 年我国短视频市场规模将达到 9624 亿元,市场 空间广阔,视频、游戏、网络文学等内容生态也将不断丰富,市场规模持续增长有望带动 内容创作需求不断升高,以 AIGC 为核心的内容创作工具及相关服务有望加速市场渗透。 同时,随着 AR/VR、云计算、区块链等核心技术持续迭代,我国元宇宙内容生态有望加速 形成,根据速途元宇宙研究院预测,到 2030 年我国虚拟人整体市场规模有望达 3095.3 亿 元,市场前景广阔。
[attach]802935[/attach]
国家将人工智能上升至国家战略层面,政策支持有望推进行业发展。政府随着人工智 能行业的不断发展,对政策内容也持续进行细化,从顶层设计至创新成果转化路径,再到 芯片、开源平台等技术层面都有相应政策指导,为行业提供了清晰的路径指引。
4 围绕 AI 商业化三大主线挖掘核心公司分析
4.1 关注具备底层算法模型核心技术优势的厂商 4.1.1 拓尔思,国内 NLP 龙头厂商
深耕 NLP 领域 30 年,公司发展成为国内政务领域 NLP 龙头厂商。公司以“语义智能 +”为发展战略深耕多年,主要业务覆盖内容安全和互联网空间治理、数字政府和数据智能 三大板块,向以党政机关及企事业单位为主的下游客户提供大数据检索、智能风控营销、 舆情监控等服务。公司以深耕多年的大数据积累与行业领先的 NLP 技术成为国内政府政 务领域 NLP 龙头,多年以来一直保持行业领先的市场地位。 公司以 NLP 技术为核心,金融、政府、公安领域竞争优势显著。目前公司以公共安 全市场为最主要业务,产品和场景包括公安情报研判指挥、公安知识图谱、公安舆情监 控、开源情报智能分析、开源情报数据采集监测以及各类领域知识库构建;在信息安全领 域,全资子公司天行网安提供各类网安产品服务。
公司积极开辟新赛道,机器人+虚拟人有望为公司业务提供新增量。公司将以“虚拟人 +”场景为突破口,开发支撑虚拟人的 AI 技术平台,推动虚拟人在各行业场景中的率先落 地。公司基于中文 NLP 核心技术、海量数据积累及具备行业专业能力的知识图谱等元宇宙 技术基因的优势,致力构建数字虚拟人的智能引擎,提供虚拟人智能对话、知识积累、语 义理解和智能决策等技术支撑。 在机器人领域,公司与头部 AI 厂商共同合作研究人形机器人软件技术。合作双方将 在人形机器人的智能化方面,研发云端协同的 AI 算法框架以及面向特定领域的知识图谱 技术,公司在 NLP、知识图谱领域的积淀将赋能机器人软件大脑及开放软件生态的构建。 我们认为在信创浪潮下,公司有望受益政府客户在相关领域的投入增加,同时机器 人、元宇宙等行业的加速发展可为公司提供多重增长空间,看好公司以 NLP 和知识图谱为 核心技术构建业务生态,实现业务规模加速成长。 4.1.2 科大讯飞,AI+行业应用领域领跑者
公司深耕智能语音领域,战略转型人工智能赛道,发展成为行业领军企业。公司在智 能语音行业布局多年,核心技术优势明显,2010 年以来向人工智能产业发展,推动 AI 与 各行业的应用结合,在智慧教育、智能办公、智慧公安、医学影像、智能汽车、智慧服 务、智慧城市等领域不断取得成果。 坚持“平台+赛道”发展战略,公司构建自有业务闭环生态体系。公司坚持“平台+赛 道”的人工智能战略,依托国内首家上线的 AI 开放平台——讯飞开放平台,为开发者提供 一站式人工智能解决方案,构建 AI 产业生态,并在教育、医疗、办公、智慧城市等领域实 现 AI 的深度应用,在多语种语音合成和识别、自然语言处理、图文识别、人机交互等领域 提供丰富的 AI 能力,赋能下游客户的效率提升。
推动 AI 走向强人工智能,“讯飞超脑 2030 计划”为公司明确未来成长空间规划。 2022 年,公司发布“讯飞超脑 2030 计划”,旨在构建基于认知智能的复杂智能系统,深度 融合垂直行业的细分场景任务,实现各业务场景赋能。公司计划分为三个阶段,第一阶段 着眼于机器人和数字虚拟人领域;第二阶段着眼于自适应行走的外骨骼机器人和陪伴数字 虚拟人家族,以及面向青少年的抑郁症筛查平台;第三阶段计划全面进入家庭场景。 4.2 关注各细分赛道下兼具场景理解与 AI 布局优势的垂类厂商 4.2.1 海康威视:起步安防行业的智能物联龙头
公司致力于安防视频监控领域,融合 AI 技术发展成为智能物联龙头。公司起步于安 防前端领域,随后转型行业一体化解决方案提供商,满足客户定制化需求。2012 年起,公 司深度布局 AI 技术,并于 2015 年正式发布深度智能产品,进入智能化时代,并陆续推出 AI 智能产品,成为安防领域数字化领军企业。公司着力定位于“智能物联 AIoT”,将物 联感知、人工智能、大数据服务于各业务场景。 公司实现业务生态闭环,产品矩阵覆盖软硬件。公司自成立以来,始终致力于安防行 业的发展,目前已形成软硬融合、云边融合的产品体系。公司利用 HEOP 嵌入式开放平 台,实现所有类型的智能物联网设备具有相同软件基础,大幅提升开发效率。硬件方面, 公司形成“节点全面感知+域端场景智能+中心智能存算”的产品架构,边缘节点产品涵盖 前端摄像机产品、智能交通与移动产品、门禁与对讲产品等多个领域;边缘域产品深入行 业,包括智能应用一体化设备、会议平板产品、智能视频传输产品等三大产品。
公司深耕各大业务场景,具备 AI 商业化应用的良好条件。公司以安防为核心,业务 覆盖公安、交通、金融、文教卫等各场景,同时积极布局包含智能家居、机器人等创新业 务,对 AI 赋能安防领域具备业务优势,我们认为公司有望受益于 AI 商业化进程加速,持 续探索 AI 在安防领域的产品服务,为公司贡献驱动力。 4.3 围绕 AI 数据、算力等基础设施选择优质投资标的 4.3.1 海天瑞声:AI 训练数据标注优质提供商
公司是国内领先的训练数据专业提供商,致力于为 AI 产业链各类机构提供专业数据 集。公司致力于为各类 AI 厂商和机构提供算法模型开发训练需要的专业数据集,覆盖智能 语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,应用场景多元, 包含人机交互、智能驾驶、智能家居、智慧城市等。 公司智能语音业务发展成熟,竞争壁垒高且小语种领域优势显著。公司在语音语言学 基础研究方面积累深厚,基于发音词典构建技术和流程技术的持续迭代,构建高质量的自 然语言处理模型训练所需的标注数据,截至 2022H1 公司已具备 190 个语种/方言的覆盖能 力,并且公司致力于开拓海外市场,未来业务规模有望加速扩张。
公司成立智能驾驶事业部,积极布局自动驾驶业务。公司于 2022 年 6 月上线了第三 代智能驾驶标注平台,目前自动驾驶数据标注方面业务已覆盖全景语义分割、2D 图像标 注、2D/3D 融合标注、3D 点云标注等。公司基于多年以来在数据标注领域的算法积淀,在 标注效率、准确度等指标上具备显著竞争优势,未来有望构建行业领先的综合性、规模化 和自动化的数据处理能力体系。 公司客户资源粘性高优势显著,未来有望受益行业加速发展和人工智能商业化进程加 速。公司在智能语音业务方面与字节跳动、阿里巴巴、腾讯、百度、科大讯飞及海外大型 客户保持良好合作关系,考虑人工智能未来有望加速商业化应用,叠加国家信创浪潮政策 支持,公司有望迎来加速成长期。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。) 精选报告来源:【未来智库】。「链接」作者: mk23_usp45 时间: 2023-3-29 08:02
好公司已经高攀不起了