异样,关于风险控制,这是一个非常持久且重要的话题,只要我们对风险有了非常好的控制,才能完成波动的投资。虽然这个话题很重要,但是在历史上人们对风险因子的研讨道路坎坷、发展缓慢。历史的做法通常是,由专家定义出大批用来解释当前市场的因子,然后调查特定投资组合在这些因子上的暴露状况。从经典的 CAPM 模型发展到 Fama TFM 模型历时31年,仅添加了 Value、Size 几个大批的因子。而从 Fama 模型退化到当前大多数投资机构都在运用的 BARRA 模型,又阅历了20年,也不过只添加了长大、动量等多数因子。而人工智能则可以经过优化的手腕,自动找到对市场有最佳解释才能并且彼此互相独立的非线性风险因子,同时还可以对预测模型本身带来的风险停止描写和消减。这样一来,我们用人工智能的手腕去做风控,就可以比人类专家更周全、更系统、更及时。
所以在过去的两三年间,微软亚洲研讨院在智能迷信范畴有了非常周全的规划和有益的尝试,我们关注的次要是智能生物学、智能物理学和智能环境迷信。这个过程是一个非常美妙的跨界体验,微软亚洲研讨院与清华大学、复旦大学、麻省理工学院、东京大学在内的高等院校,Baker Lab、Broad Institute 和中科院在内的科研院所,以及像 Adaptive Biotechnology 这样全世界生物科技范畴抢先的创业企业,都停止了非常亲密的合作,产生了大量的研讨成果,并且最近在《Nature Communications》、《Bioinformatics》、《Environmental Science and Technology》等迷信范畴的顶级期刊上发表了大量论文。
那么我们是如何与合作伙伴一同共同发现核心痛点成绩,并且提供人工智能处理方案的呢?以生物学为例,我们和合作伙伴们共同发现,在生物学范畴结构数据的缺失是一个非常大的痛点。近年来随着高通量测序技术的成熟,每日每夜都在生成海量的无标注组学数据,可是经过像冷冻电镜这样的手腕去获得高质量的结构数据,成本照旧非常高,所以导致此类结构数据相对稀少。在生物范畴,结构决议功能,假如我们没有高质量的结构数据,就很难真正推进生物成绩的求解。
而在生命迷信范畴,个性化的需求异样非常激烈,由于每一个生物个体都有所不同,就像人类一样,千人千面,只要真正去了解每个人的不同,才能避免基于共有特征的数据模型迁移性差的理想。正是由于结构数据的缺失,结构预测和分子动力学模拟变得非常重要。结构预测可以帮我们从序列化的组学数据出发,生成一个静态的结构,而分子动力学模拟则可以在此基础上提供一些动态的细节,包括不同构向之间的转化。由此可见,人工智能的确可以协助我们了解生物的功能以及功能的演化。
(, 下载次数: 716)
上传
点击文件名下载附件
过去一年,微软亚洲研讨院运用人工智能技术,建立了一个大规模的分子动力学模拟系统,并且运用这个系统对新冠病毒 S 蛋白的动态变化停止了深化分析,我们发现了一些非常有价值的迷信结论。例如,我们发现新冠病毒 S 蛋白不断在具有高传染性的开构象和低传染性的闭构象之间做着构象的转化,而在这个转化过程中,S 蛋白的 NTD 部分起到了非常关键的作用,它就像一个楔子,可以促进或者阻止这种构象的变化。
因此,我们和美国的 Adaptive Biotechnology 公司一同,应用人工智能的手腕,建立起了世界上第一个人类公有免疫细胞和各种疾病抗原之间的对应关系图—Antigen Map。基于这张对应图,我们就可以在很多疾病上做出精准的预测和治疗。也正是由于这项技术,我们和 Adaptive 共同创造了世界上首款 FDA(美国食品药品监督管理局)同意的基于人体免疫细胞的新冠检测手腕 T-Detect COVID。该检测手腕比我们常常听到的核酸检测和抗体检测更精准、更及时。由于包括 T-Detect 在内的创新技术,微软最近被 Fast Company 快公司评选为 “World Changing Company of the Year(年度改变世界的公司)”。
除了生物学以外,微软亚洲研讨院在其他行业、其他迷信门类里也做了很多探求。例如,我们发现高效的数值仿真是物理学、环境学等多个迷信门类的痛点之一,这是由于真实世界的实验代价高昂,而实验前的仿真是推进这些迷信发展的重要手腕。但是多尺度、高维度、高精度的仿真需求宏大的运算量,这在很多状况下都是不能够完成的义务。而人工智能在处理这一应战方面有着宏大的潜力,比如,深度学习仰仗它杰出的逼近才能,有能够可以替代耗时的数值计算模块,而强化学习则可以高效地探求形状空间和构象空间,加速数值仿真的进程。
我们提出了一个基于神经网络来学习求解多尺度偏微分方程的算子,它不需求大量的训练数据,可以直接从物理规律中学习,同时还可以经过 GPU 加速,使解题速度比传统的数值解法提高几个数量级。应用这样的新技术,在精度与传统数值解法相当的状况下,我们以10倍的速度成功求解了描画大气湍流的大规模纳维-斯托克斯方程,这对于环境建模、气候预测都能够产生革命性的影响。