怎么理解人工智能算力？1000P的算力到底有多强？

当年那月如伤痕 · 2022-10-28 10:25:29

人工智能的本质是多源大数据模型训练，使计算机具备部分或超出人类的已有能力的技术集成。

在计算机世界，一切信息可以通过数据来表示，包括语音数据、文本数据、图像数据、压力数据、温度数据等等，人工智能就是通过海量数据对计算机进行驯化，来实现计算机模仿，具备或超出人的能力。
因此，海量数据的采集、清洗、存储、标注、处理、传播成为关键，人工智能的发展需要高水平算法和算力作为支撑，反映在对高端人才、芯片和数据传输网络的强依赖性。
算法、算力、数据是人工智能的三要求：

基础层提供算力支持，即硬件部分；
技术层提供通用技术平台做算法开发，驯化海量数据，即软件部分；
应用层体现不同场景下大数据驯化所体现的价值。

在数据、算力和算法的共同推动下，全球人工智能产业相关技术实现快速发展，下游应用不断丰富。
其中，算力代表了对数据的处理能力，是数字化技术持续发展的衡量标准，也是数字经济时代的核心生产力。
接下来以人工智能计算中心建设 1000P 的算力为例，深度了解人工智能的算力。
怎么理解 1000P ？

P 是一个数量级，10 的 15 次方，1000P 就是 100亿亿，1000PFlops 算力就意味着每秒有 100 亿亿次的浮点运算能力。
AI 算力单位：量级单位+每秒运算次数+数据类型

用来描述参与运算的数据类型，同时也表达了数据精度：

INT8 8位整数型数据常适用于深度学习模型的推理运算
FP16 16位浮点型数据常适用于深度学习模型的训练运算
FP32 32位浮点型数据主要应用于高性能计算（比如科学计算）

一个 Atlas 800 组成的 AI 算力集群，以 1000P 算力为例，一个时钟周期可以进行“100亿亿”次计算。
那 1000P 的算力到底有多强？

相当于 50 万台 PC 电脑
以对 20 万颗星体的数据探索为例，传统方式需要一个有经验的科学家用 169 天才能完成，现在只需要 10.02 秒
在 26.9 秒时间内，学习 1200 万张照片，形成一个模型，用于图像识别

通用计算和 AI 计算，“分工”不同，共建多样性计算
| 通用计算
以 CPU 提供算力。适合复杂逻辑运算，比如大多数通用软件。70% 以上晶体管用于构建 Cache 和控制单元，计算核心从几个到几十个。
通用应用：办公、数据库、数值计算（气象预测、流体仿真、电磁仿真）等
| AI 计算
以 GPU 或 NPU 提供算力。适合逻辑简单，计算密集型高的并发任务。70% 以上晶体管用于构建计算单元，计算核心几千或上万个。
特定应用：图像识别（人脸识别、车牌识别、动作识别、物品检测、周界检测等）、自然语言处理（机器翻译、语音识别、文本生成、情感分析等）、搜索推荐、辅助驾驶、趋势预测等。
GPU：Graphics Processing Unit，图像处理单元，主要用于图像加速和渲染
NPU：Neural Network Processing Unit，神经网络处理单元
人工智能 1000P 并非超算意义上的 “1000P”

以高性能计算为例，TOP500 榜单，入围的超级计算机都要进行一项名为 LINPACK 的测试，以考察平台的双精度浮点计算能力。
以人工智能为例，人工智能运行的测试程序叫做 Resnet-50，而其成绩则是基于半精度浮点环境获得的，只考察平台的半精度能力。
总结：人工智能计算，只是高性能计算的一个分支，是针对神经网络，深度学习等，针对特定领域、特定场景产生的应用需求。高性能计算都是科研应用的基础，它能“算天算地算人”，几乎所有的应用都可以通过高性能计算来实现。双精度和半精度的区别，双精度是 64 位，单精度是 32 位，半精度是 16 位。
本文参考文献：《2022年中国人工智能产业报告》《东数西算下新型算力基础设施发展白皮书》《趣说人工智能算力》

		自动登录	找回密码
密码			立即注册

怎么理解人工智能算力？1000P的算力到底有多强？

本帖子中包含更多资源

最近发表

公社版块

关注我们