请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

数据训练基建:驱动我国人工智能产业升级

(本文作者王鹏,北京市社会科学院研究员,数据资产化研究院执行院长)

2024年3月30日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,会上,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,发布100个人工智能大模型高质量数据集,数据总量逾150PB,覆盖多模态语料,涉及20个领域应用场景。同时,《北京经济技术开发区关于加快打造AI原生产业创新高地的若干政策》提出14条具体措施,包括推动算力赋能产业发展、构建高效协同创新体系等,发布了多个创新平台和重点项目。

作为国内首家投入运营的人工智能数据训练基地,北京亦庄人工智能公共算力平台是北京最大规模的高性能人工智能计算集群,旨在帮助企业推动开展大模型训练,推广行业应用。北京亦庄人工智能公共算力平台提供的3000P算力,超过了百万台电脑的算力,能为大模型训练提供稳定的算力支持,大幅提高训练效率,并面向算法企业等提供公共运算平台,推动企业开展大模型训练,推进我国大模型技术进步。到2026年,亦庄人工智能数据训练基地将培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000P。

在人工智能和大模型的发展中,数据、算法和算力被视为三大核心要素。这三者相互依赖,共同推动着人工智能技术的进步。在这个框架下,如何构建要素使用组合和框架成为我国人工智能行业发展的一个重要课题。我国在数据开发领域拥有丰富的资源,包括优秀的科研机构、人才和企业,这为算法的开发提供了坚实的基础。

然而,要充分挖掘这些数据的潜力,需要强大的算力来支持复杂算法的运行和实验测试。因此,建立一个能够提供巨大算力的平台变得尤为关键。本次人工智能训练场的设立有助于加速这一过程,提供一个集中的、稳定的、高效的平台,使得科研机构和企业能够更高效地访问和利用所需的算力资源。训练场不仅提供了必要的硬件支持,还可能提供软件和工具的支持,进一步简化了模型训练和测试的过程。

北京通过本次数据训练场的试点,带头解决了数据的运输安全问题,跨行业、跨领域、跨区域、跨层级形成了更多高质量的数据集,帮助人工智能大模型进行训练。这一举措不仅促进了数据资源的共享和利用,还为人工智能的研究和应用提供了丰富的实践基础。数据训练场的建立促进了数据资源的跨行业共享。在传统情况下,各行业的数据往往孤立存在,难以实现资源的有效整合。而数据训练场提供了一个统一的平台,使得医疗、交通、金融等不同行业的数据能够相互流通和共享,从而提高了数据的利用效率和价值,能够最大化程度释放现有数据的价值。通过构建安全可靠的数据共享平台,北京在人工智能领域的发展迈出了坚实的一步,为其他地区和行业树立了良好的示范作用。

此外,这一试点项目还有助于推动相关技术和标准的制定,加快人工智能产业的规范化和健康发展。数据训练场的进一步完善和推广,预计将为人工智能技术的创新和应用提供更加强大的支撑,促进社会各领域的智能化转型。公共运算平台的建立无疑是推动人工智能产业发展的一大助力。它不仅提供了强大的算力支持,使得大规模模型的训练成为可能,而且促进了行业间的合作与交流,加速了产业大模型的成型和应用。通过这样的平台,企业可以更有效地利用资源,减少重复建设,提高整个行业的效率,为人工智能产业注入新的活力。

特别地,初创企业无需投入大量资金建设数据训练的基础设施,降低了创业门槛,也更容易地接触到最新的技术和算法,促进了技术创新和应用创新。这对于初创企业的成长和发展具有极其重要的意义,能够激发更多的创业活力和创新潜能。随着这些企业的不断壮大和成熟,它们将成为我国人工智能产业的重要支柱,为我国在全球人工智能竞争中占据有利地位提供坚实的基础。

同时,公共运算平台还能够促进技术创新,帮助企业探索新的商业模式和服务模式,推动人工智能技术在更多领域的应用。这些企业在公共运算平台的支持下,能够更加专注于核心技术的研发和创新,加快产品和服务的市场化进程。这对于加快人工智能产业的发展,提升我国在全球人工智能竞争中的地位具有重要意义。北京亦庄的人工智能训练场是一个具有划时代意义的项目,它不仅解决了人工智能发展中的关键问题,也为中国乃至全球的人工智能产业发展树立了一个新的标杆。数据训练基建的建设将带动相关产业链的发展,包括硬件制造、软件开发、数据服务等,形成一个完整的人工智能产业生态系统。

随着人工智能技术的快速发展和应用需求的增长,预计未来我国将建立更多的数据训练场,覆盖更广泛的领域和地区,形成全国性的数据训练基建网络。为了适应日益复杂的人工智能模型和算法,数据训练基建将不断引入新的技术和设备,提高算力效率和数据处理能力,支持更高级别的人工智能研究和开发。面对全球人工智能技术的竞争,未来我国的数据训练基建有望与其他国家和地区的相应机构进行合作,共享数据和算力资源,促进国际间的技术交流和合作。

本文仅代表作者观点。



(本文来自第一财经)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册