找回密码
 立即注册
搜索

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值

某种意义上讲,目前,人工智能还是在一些相对浅层次的范畴发挥着作用。例如人工智能中的深度学习在人脸辨认、语音辨认、自然言语处理这些人机交互界面上运用非常广泛;强化学习在虚拟的或者封闭的成绩上表现良好,比如游戏、机器臂控制等相对环境简单、规则明晰的成绩。虽然人工智能在工业界核心的决策成绩上运用前景广泛,但其明天的作用照旧非常有限。在很多重要的环节中,人工智能与人的才能相比还是有所差异,传统运筹学仍是很多行业的标准处理方案。
人工智能在迷信范畴有何价值?目后人工智能次要在一些辅助成绩上发挥作用,例如对噪声数据停止预处理,对光谱数据、地理图片停止形式辨认,或者是对一些已有的数值仿真算法停止加速和拓展。虽然近期出现了一些应用人工智能和大规模算力改变迷信发展现状的工作,如 AlphaFold2 破解蛋白质折叠、Deep Potential 停止分子动力学模拟等,但是一切这些工作目前还只是星星之火,尚未构成燎原之势。
在这样的大背景下,作为人工智能学者,我们以为,要让人工智能对滚滚的历史车轮产生更大的推进作用,除了在“自我的世界”里关注算法和实际的研讨以外,还需求可以“顶天”、“立地”,跨界共创,真正让人工智能创造更多的产业价值和迷信价值
人工智能的产业价值生成途径

如何才能让人工智能完成更多的产业价值呢?为了寻求这个成绩的答案,微软亚洲研讨院于2017年成立了“创新汇”,与近50家各范畴企业展开合作,停止了数百次的交流,完成了十余个结合研讨项目。这些项目横跨金融、物流、医药、电信、教育、政务等多个行业。在展开这些结合研讨的过程中,我们秉承着初心,不只要协助各个企业处理理想中的技术应战,完成数字化、智能化转型;更重要的是从这些项目中笼统出行业的核心痛点,设计处理这些痛点的人工智能共性技术,为人工智能真正创造产业价值奠定基础。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-1.jpg

以金融投资为例,微软亚洲研讨院曾经和资管行业的领头企业华夏基金合作超过四年的工夫了,我们共同耕耘、共同分享、共同讨论,构成了一系列对于金融资管和智能投资范畴核心痛点的认知。首先,我们发现虽然金融数据很丰富,但信噪比非常低,所以很难发掘出有效的信号。其次,金融市场动态变化,异常迭起,这对基于统计学习的方法提出了宏大的应战,由于面对复杂的金融市场,我们很难假设数据是独立同分布的。第三,金融范畴中,风险和收益是一对双生子,“投资有风险,入市需慎重”,一个高手之所以成为高手,不只在于他可以发现普通人所不知的投资信号,更在于他擅长管理风险,可以避免收益的“稍纵即逝”,成为一个常胜将军。最后,从辨认出有效的信号,到构建投资组合,再到真正执行订单,投资链条非常长,而且只要有效完成预期订单的买卖,才真正完善整个投资链条,也才能得到想要的投资报答。
针对这些痛点,在过去一段工夫里,微软亚洲研讨院和合作伙伴一同研发了大量的人工智能技术。在数据端,高频买卖数据包含丰富的信息,但又含有大量的噪声,所以很多做中低频投资的机构或个人很少应用高频买卖数据,而对高频数据非常感兴味的人则在研讨日内的算法买卖。于是,我们想问:高频的买卖数据能否可以对中低频的投资,例如日频、周频、月频的投资产生本质的影响?
人工智能的优势在于可以以人所不能及的细粒度和高通量分析数据。当我们面临的数据是高频数据时,需求处理的就是抑制噪声,并从海量数据里抽取有用信息。以此为目的,我们研发了一套自监督对比学习技术,它将时空的依赖关系作为约束,去其糟粕,取其精髓,希望可以从高频数据中抽取有效信号。当我们运用这种自监督对比学习的方法后,与只运用日频数据或者运用高频和日频结合的数据相比,新方法都有更好的表现,可以获得波动的信号。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-2.jpg

针对市场动态性方面的应战,微软亚洲研讨院开发了一套基于留意力机制的神经网络,它可以自动判别当前市场能否处于异常形状。假如异常,我们就会建议投资机构采取一些被动的投资手腕。假如这个市场在历史上素昧平生,我们就会应用留意力机制,从历史数据里寻觅到最适用于当前市场的信息,经过数据或规律,让投资机构可以在金融市场的风云变幻之下,总是立于风口浪尖上,获得波动的投资报答。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-3.jpg

异样,关于风险控制,这是一个非常持久且重要的话题,只要我们对风险有了非常好的控制,才能完成波动的投资。虽然这个话题很重要,但是在历史上人们对风险因子的研讨道路坎坷、发展缓慢。历史的做法通常是,由专家定义出大批用来解释当前市场的因子,然后调查特定投资组合在这些因子上的暴露状况。从经典的 CAPM 模型发展到 Fama TFM 模型历时31年,仅添加了 Value、Size 几个大批的因子。而从 Fama 模型退化到当前大多数投资机构都在运用的 BARRA 模型,又阅历了20年,也不过只添加了长大、动量等多数因子。而人工智能则可以经过优化的手腕,自动找到对市场有最佳解释才能并且彼此互相独立的非线性风险因子,同时还可以对预测模型本身带来的风险停止描写和消减。这样一来,我们用人工智能的手腕去做风控,就可以比人类专家更周全、更系统、更及时。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-4.jpg

最后,订单的执行异样非常重要,但非常困难,由于在日内的整个市场波动愈加猛烈,基于简单的规则去做订单买卖,通常很难完成非常理想的平均买卖价格。我们和合作伙伴一同探求了用强化学习的方法来做自动订单买卖,这种方法可以在非常细的粒度下明察秋毫,找到执行订单的最佳机遇和最佳执行速率,从而大幅度降低买卖成本,获得良好的预期平均买卖价格。一旦投资机构可以非常好地控制买卖成本,那么久可以为寻觅最佳投资组合创造更大空间,从而有愈加亮眼的表现。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-5.jpg

上述研讨不是纸上谈兵,我们和合作伙伴一同在实盘上停止了大规模的测试。测试结果与中证500指数相比,获得了非常分明的超额收益。尤其在往年年终,市场有些动荡,很多基金“崩盘”的状况下,我们的技术更是表现非常稳健。
基于这些研讨和探求,我们希望把我们的所思所得和技术积累与更多企业、客户停止分享,所以我们构建了一个智能量化投资的共性技术平台,希望经过这个平台可以打通智能投资的研讨和实战,降低技术投资的门槛,规避潜在的技术圈套,为从业者和研讨者提供一个非常接近实盘的回测环境。2020年下半年,我们将这样一个平台停止了开源——AI 量化投资开源平台 Qlib。目前 Qlib 获得了业界广泛的关注,在 GitHub 上播种了超过5000颗星,并且也正是由于开源项目 Qlib,有很多国际知名的投资机构正在和我们停止交流与合作。
除了金融投资以外,微软亚洲研讨院也与其他行业的合作伙伴停止了非常深化的互动,获得了很多有价值的洞见。举个例子,资源优化、时空预测是非常多的范畴所共同面临的成绩,绝大部分资源优化的场景都会有如下痛点:优化链路长,无法及时获得反馈信号;优化链路上的多个目的能够彼此之间互相矛盾;全局优化成绩太复杂,几乎是一个不能够完成的义务。
异样,时空预测也有一些共性的特点,例如数据噪声大,信息缺失严重;时序的形式非常多样,有趋向、周期、突发信号;空间结构很复杂,常常会出现一些层次化的结构,使得我们不可以单一地在单点上停止预测。
看法了这些应战之后,我们和合作伙伴共同开发了一套多智能体资源优化的共性技术框架。该框架只需求经过非常轻量级的定制就可以协助客户搭建起属于本人的模拟器,并且还可以用强化学习的手腕训练一个高效的智能体,帮客户完成资源优化。而且我们可以很随便地协助客户把这个模型部署在一个分布式集群上,完成他们的日常运营。目前,这个框架已协助包括东方海外航运在内的多个客户完成了愈加高效的日常运营,提高了效率,降低了成本,获得了更好的资源应用率。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-6.jpg

没有止步于此,我们希望这些合作的结果可以被更多的用户所运用、体验,协助他们完成数字化转型,所以我们开源了多智能体资源优化平台“群策 MARO”,目前曾经有很多客户都在试用 MARO。
为了处理时空预测的核心应战成绩,我们开发了一套时空预测的共性技术,包括多路深度时序编码集成的模块、可解释的正则通路、可以自动学习网络结构的图神经网络、可根据外部突发事情调整预测结果的门电路模块等。正是由于这些复杂的设计,我们的模块和整个框架可以在一些非常困难的成绩上获得亮眼的效果。目前,我们曾经与合作伙伴在医疗、物流、电信范畴做了非常多实践数据的测试,例如我们应用该技术协助一些企业完成了物流订单的精准预测,协助糖尿病病人完成了血糖波动的精准预测,也协助电信企业完成了将来一段工夫内在某些域名下流量波动的预测。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-7.jpg

除了与这些企业共同推进技术的运用以外,我们也把这个技术框架运用到了新冠疫情的管控和抗击方面。在新冠疫情暴虐全球的大背景下,美国疾控中心公布了大量关于疫情的数据,同时向全世界最顶级的迷信机构发出求救,希望各大科研机构可以经过技术手腕协助疾控中心预测将来一周到周围内疫情的走势,并且协助疾控中心以及政府基于数据结果停止相关政策的制定。由于我们有非常成熟的时空预测技术,所以我们基于新冠疫情的数据训练了一个可以停止将来一周到周围的疫情走势预测模型,并且在2020年下半年,代表微软公司向美国疾控中心提交了这个模型。在超过半年的工夫里,该模型表现非常亮眼,在绝大部分工夫里,它的表现和功能都力压其他四十几个全球顶级科研机构的模型,排名第一,为全球抗击新冠疫情、制定合适的防疫政策做出了重要的贡献。
人工智能的迷信价值生成途径

经过“创新汇”,微软亚洲研讨院和各行各业的合作伙伴停止了非常深化的交流与合作,也对各行各业有了更深化的看法。这个跨界的体验让我们这些人工智能学者播种良多。展望将来,我们置信有更多行业可以被我们的人工智能技术激活。做有用的人工智能,我们不断在路上。
但是另一方面,作为人工智能学者,我们从来没有遗忘,“低头俯视星空”的使命。所以我们也在不断思索如何用人工智能技术、机器学习技术去推进基础迷信的停顿。
《迷信》杂志在其成立125年周年的时分,发表了当前世界上最重要的125个古代迷信成绩,这些成绩里绝大部分是关于生物学、物理学和环境迷信的,这些成绩关乎宇宙的奥妙、生命的来源以及人类的生活和可持续发展。我们置信,假如可以用机器学习、人工智能的手腕推进这些成绩,我们将有望打守旧向将来的大门。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-8.jpg

所以在过去的两三年间,微软亚洲研讨院在智能迷信范畴有了非常周全的规划和有益的尝试,我们关注的次要是智能生物学、智能物理学和智能环境迷信。这个过程是一个非常美妙的跨界体验,微软亚洲研讨院与清华大学、复旦大学、麻省理工学院、东京大学在内的高等院校,Baker Lab、Broad Institute 和中科院在内的科研院所,以及像 Adaptive Biotechnology 这样全世界生物科技范畴抢先的创业企业,都停止了非常亲密的合作,产生了大量的研讨成果,并且最近在《Nature Communications》、《Bioinformatics》、《Environmental Science and Technology》等迷信范畴的顶级期刊上发表了大量论文。
那么我们是如何与合作伙伴一同共同发现核心痛点成绩,并且提供人工智能处理方案的呢?以生物学为例,我们和合作伙伴们共同发现,在生物学范畴结构数据的缺失是一个非常大的痛点。近年来随着高通量测序技术的成熟,每日每夜都在生成海量的无标注组学数据,可是经过像冷冻电镜这样的手腕去获得高质量的结构数据,成本照旧非常高,所以导致此类结构数据相对稀少。在生物范畴,结构决议功能,假如我们没有高质量的结构数据,就很难真正推进生物成绩的求解。
而在生命迷信范畴,个性化的需求异样非常激烈,由于每一个生物个体都有所不同,就像人类一样,千人千面,只要真正去了解每个人的不同,才能避免基于共有特征的数据模型迁移性差的理想。正是由于结构数据的缺失,结构预测和分子动力学模拟变得非常重要。结构预测可以帮我们从序列化的组学数据出发,生成一个静态的结构,而分子动力学模拟则可以在此基础上提供一些动态的细节,包括不同构向之间的转化。由此可见,人工智能的确可以协助我们了解生物的功能以及功能的演化。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-9.jpg

过去一年,微软亚洲研讨院运用人工智能技术,建立了一个大规模的分子动力学模拟系统,并且运用这个系统对新冠病毒 S 蛋白的动态变化停止了深化分析,我们发现了一些非常有价值的迷信结论。例如,我们发现新冠病毒 S 蛋白不断在具有高传染性的开构象和低传染性的闭构象之间做着构象的转化,而在这个转化过程中,S 蛋白的 NTD 部分起到了非常关键的作用,它就像一个楔子,可以促进或者阻止这种构象的变化。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-10.jpg

假如我们能找到可以和 NTD 停止结合的某种药物,那么就无机会降低新冠病毒感染人体细胞的才能,从而有能够会缓解它所形成的症状,或者是降低它的传染率。抱着这样一个愿望,我们运用了高通量的药物挑选技术,从2亿3千多万种化合物中,找到了超过1千种与 NTD 有很强绑定关系的化合物。另外,我们还分析了在中国抗击新冠病毒中常用的一个中药:清肺排毒汤。在它已知的成分里,我们发现了至少有18种化合物与新冠病毒的 NTD 蛋白有非常强的绑定关系,这也从某种意义上解释了为什么清肺排毒汤在处理和缓解新冠症状上有非常好的表现。
此外,个体差异方面异样非常重要。我们每个人都有不同、大量的公有免疫细胞,体内的微生物菌群也大相径庭。一切这些公有的生物属性很大程度上影响了人类的健康,以及个体对于不同疾病抗原的反应和药物的耐受程度。只要对它们停止精准的描写,才能完成真正意义上的个性化医疗。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-11.jpg

因此,我们和美国的 Adaptive Biotechnology 公司一同,应用人工智能的手腕,建立起了世界上第一个人类公有免疫细胞和各种疾病抗原之间的对应关系图—Antigen Map。基于这张对应图,我们就可以在很多疾病上做出精准的预测和治疗。也正是由于这项技术,我们和 Adaptive 共同创造了世界上首款 FDA(美国食品药品监督管理局)同意的基于人体免疫细胞的新冠检测手腕 T-Detect COVID。该检测手腕比我们常常听到的核酸检测和抗体检测更精准、更及时。由于包括 T-Detect 在内的创新技术,微软最近被 Fast Company 快公司评选为 “World Changing Company of the Year(年度改变世界的公司)”。
除了生物学以外,微软亚洲研讨院在其他行业、其他迷信门类里也做了很多探求。例如,我们发现高效的数值仿真是物理学、环境学等多个迷信门类的痛点之一,这是由于真实世界的实验代价高昂,而实验前的仿真是推进这些迷信发展的重要手腕。但是多尺度、高维度、高精度的仿真需求宏大的运算量,这在很多状况下都是不能够完成的义务。而人工智能在处理这一应战方面有着宏大的潜力,比如,深度学习仰仗它杰出的逼近才能,有能够可以替代耗时的数值计算模块,而强化学习则可以高效地探求形状空间和构象空间,加速数值仿真的进程。
我们提出了一个基于神经网络来学习求解多尺度偏微分方程的算子,它不需求大量的训练数据,可以直接从物理规律中学习,同时还可以经过 GPU 加速,使解题速度比传统的数值解法提高几个数量级。应用这样的新技术,在精度与传统数值解法相当的状况下,我们以10倍的速度成功求解了描画大气湍流的大规模纳维-斯托克斯方程,这对于环境建模、气候预测都能够产生革命性的影响。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-12.jpg

除此之外,我们还对大气里的物理化学反应有了愈加深化的洞察。我们发现,大气物理化学反应中存在一些深入规律,经过拆解化学平衡常数和反映关系函数,在常数复杂度下就可以完成高效的大气反映曲面估计,这与传统方法相比是成千上万倍的加速。基于这个技术,我们可以对大气污染物的分散停止非常精准的预测和仿真,而该技术目前曾经在多个国家的大气污染管理中扮演着重要的角色。并且一切这些努力也都在践行着微软公司在负碳计划方面的承诺。我们置信以智能迷信之矛,攻环境污染之盾,是我们每个人的使命,虽然任重道远,但是我们责无旁贷。

讲堂 | 刘铁岩:跨界共创AI的产业价值和迷信价值-13.jpg

展望将来,除了生物学、物理学、环境迷信以外,其实还有太多的空间值得我们用人工智能去探求,无论是用人工智能助力电池材料的设计,助力碳捕捉和碳存储,还是去探求行星的前世今生,甚至发现全新的基于数据驱动的物理定律,我们都有着有限的想象空间。
我们置信,将来这种产业和迷信的智能化进程还会有非常广阔的空间,人工智能在其中也会扮演越来越重要的角色。微软也将继续秉承本身优势和平台公司的定位,推出更多的开源项目、共性技术,助力产业界和学术界的长足发展。我们坚信,只要借助整个社会的力气,借助整个学术界的力气和产业界的共同努力,我们才能真正推进整个世界智能化的进程。
回复

使用道具 举报

大神点评3

429152018 2021-7-3 12:17:44 来自手机 显示全部楼层
lz也多多分享一下感受,想换工作了
回复

使用道具 举报

边撸边过
回复

使用道具 举报

翔fei 2021-7-5 08:06:04 显示全部楼层
加油!不要理那些键盘侠!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册