界面新闻记者 | 于浩 李京亚
界面新闻编辑 | 宋佳楠
在过去的一年里,基于人工智能的大语言模型在多个行业掀起了新一轮的技术变革。特别是在金融、医疗、交通等重要领域里,降本增效有了新的路径。
作为改革开放排头兵,上海在人工智能与大模型方面的探索已经先行一步。
自上海布局人工智能产业以来,目前规模以上人工智能企业数量约是五年前的两倍,产值规模则达到了三倍。2023年前两批通过备案的人工智能大模型企业,上海就有8家,其中6家在徐汇区。
上海两会期间,有关大模型的发展也成为人大代表和政协委员们重点关注的话题。
东方财富信息股份有限公司党委书记、副董事长陈凯在提案中建议,为进一步提升上海大模型产业竞争力,可加快探索数据权属的立法实践、推动垂类大模型的商业化落地,同时要加快打造大小模型互促共生的应用生态。
加快大模型应用发展已成为一种共识,尤其是针对相关企业应采取一定激励措施。方建安、陈启军、贺樑均在提案中建议,要加大对大模型创新企业的支持力度,提供税收减免、资金扶持等政策。
大模型的发展自然离不开人才基础。华东师范大学地理科学学院院长周立旻在提案中建议,应发挥沪上计算机学科优势,以政策引导构筑计算机等信息学科高端人才培养的平台,加快构建上海人工智能“101”人培养计划,丰富面向人工智能产业发展的人才储备。
深入生态供给核心要素
伴随2023年的大模型创业热潮,上海企业已经覆盖了大模型生态的各个层级。
基础大模型层面,商汤科技已完成了多版大模型的迭代,搭建起了算力等大模型基础设施。新闻出版、电商营销、城市治理等行业中也出现了诸多基于大模型能力打造应用的创业公司。
这与上海本身的良好政策环境不无关系。
早在2022年9月,上海市人民政府便颁布《上海市促进人工智能产业发展条例》(下文简称“《条例》”)。一年后,上海市多部门又进一步联合制定并发布了《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》(下简称“《措施》”),以让《条例》真正落地。
大模型对很多不甚了解的人而言仍是一种新事物,但在星图比特创始人张炯看来,上海市政府对这一技术的认知已处于相当高的水平。该公司的奇点大模型近期正在进行算法备案,张炯认为有关部门在审核流程中所提的问题都十分精准地命中了技术要点。
从具体政策条文中也能看出上海市政府对大模型生态的了解程度。过去一年里,上海推动建设了全国首个大模型生态社区,政策中也提及统筹算力调度、构建芯片协同生态、推动公共数据分类分级有序开放、组建语料联盟等举措,涵盖了算力、数据等大模型产业发展的核心要素。
在发挥数据要素价值方面,上海在数据开放和数据交易两个方向都有相关探索。2021年11月,上海数据交易所便已揭牌成立并达成了部分交易。而在《条例》中则提及,将会在经济发展、民生服务、城市治理等领域建立公共数据动态开放清单,支持相关主体单独或者联合申请公共数据开放。
来也科技CEO汪冠春用“中国式创新”来形容政府数据公开。“相较于互联网公开数据,政府掌握的数据质量更高,用这些数据训练大模型所得到的收益也更高。”他认为和办事流程、文书相关的非结构化数据对其业务帮助很大。该公司主要面向企业和政府部门提供大模型数字员工。
但光有政策鼓励显然不够,还需要不断落实。据张炯所说,徐汇区政府已面向大模型生态内的企业开展了需求对接会,并针对企业推出购买算力方面的贷款贴息政策。与此同时,徐汇区政府还发起了创投基金,促进人工智能生态创业企业融资。
去年上半年,国内大模型产业内的投融资相对火热,主要集中在基础大模型层面,但到了下半年明显遇冷,界面新闻所接触到的应用层中小企业或多或少都存在着融资困难。
据张炯透露,目前星图比特正在筹备新一轮融资,徐汇区政府基金徐汇资本对企业给予了很多帮助,除直接下场投资外,还会为企业对接其他社会化投资机构。
在人才培养上,上海浦江实验室的存在成为上海的一张名片。张炯和汪冠春均表示,该实验室曾多次主办面向行业的技术交流活动。在周立旻的提案中也提及,建议支持上海四所计算机学科“101”计划基地高校与浦江实验室围绕各个高校的特色,开展人才培养的深度合作。
推动大模型技术产业化
目前国内各家基础大模型产品都打出了能力对标GPT3.5的口号,并朝着今年全面对标GPT4努力。在新的阶段,如何推动大模型技术应用和产业化是人大代表、政协委员以及诸多业内人士共同关注的焦点。
除数据、算力、人才等核心要素的供给外,大模型产业本身在生产和应用层面仍存在着一些共性难题。
陈凯在提案中指出,现有大模型训练数据合规使用边界尚不清晰,通用大模型在专业解释力、专项任务执行力等方面的能力相对薄弱。此外,应用场景的收益增厚与模型的高投入尚不匹配,导致产业主体对大模型的商业应用动力不足。
对此,他认为一方面应加快研究大模型预训练阶段合规的数据获取及使用边界,另一方面也要加快推动垂类大模型的商业化落地,建立大小模型互促共生的应用生态。
商汤科技首席运营官骆静也认为,尝试推动公共数据分类分级有序开放、让基础模型高效融合不同垂直领域的专业数据,构建更懂行业、更具专长的专业大模型,可以从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中得到体现。
具体到推动大模型产业应用和成果转化,方建安、陈启军、贺樑的提案都强调了对大模型创新企业的支持和鼓励。他们建议为大模型创新企业提供税收减免、资金扶持等政策,鼓励相关企业加大研发投入,推动大模型技术应用和产业化。
有关建立应用生态、资金扶持的建议也切中了张炯和汪冠春的需求。
在张炯看来,不同于传统互联网创业,大模型创业必然要面对算力这一重资产投入。因此,即便目前已经存在创业基金,他仍期待政府能进一步降低融资难度。
汪冠春也表示,希望上海市的引导基金可以更加活跃一些,除基础大模型厂商外能更多关注应用层创业公司。
在大模型应用生态不断丰富的当下,上海市政府也在逐步接受在公共事务上落地数字化劳动力。汪冠春便提及,除了单点项目的落地,希望政府可以更多地开放场景,自上而下地做统一规划。 |