由于计算机硬件设计、ML 算法和元学习(meta-learning)研究的进步,效率的提高正在推动 ML 模型向更强的能力发展。ML 管道的许多方面,从训练和执行模型的硬件到 ML 体系结构的各个组件,都可以在保持或提高整体性能的同时进行效率优化。这些不同的线程中的每一个都可以通过显着的乘法因子来提高效率,并且与几年前相比,可以将计算成本降低几个数量级。这种更高的效率使许多关键的进展得以实现,这些进展将继续显著地提高 ML 的效率,使更大、更高质量的 ML 模型能够以更有效的成本开发,并进一步普及访问。我对这些研究方向感到非常兴奋!
随着 ML 和硅硬件(如 Pixel 6 上的 Google Tensor 处理器)的创新,许多新体验成为可能,移动设备能够更持续有效地感知上下文和环境。这些进步提高了设备的可访问性和易用性,同时计算能力也有提升,这对于移动摄影、实时翻译等流行功能至关重要。值得注意的是,最近的技术进步还为用户提供了更加个性化的体验,同时加强了隐私保护。
拥有准确的建筑足迹记录对于从人口估计和城市规划到人道主义响应和环境科学的一系列应用都是至关重要的。在世界上的许多地方,包括非洲的大部分地区,这一信息以前是无法获得的,但新的研究表明,将计算机视觉技术应用于卫星图像可以帮助识别大陆范围内的建筑边界。这一方法的结果已在开放建筑数据集中发布,这是一种新的开放获取的数据资源,其中包含 5.16 亿座覆盖非洲大陆大部分地区的建筑的位置和占地面积。我们还能够在与世界粮食计划署的合作中使用这一独特的数据集,通过 ML 的应用提供自然灾害后的快速损失评估。
我们希望看到更多机器学习辅助系统的部署,以应用到改善乳腺癌筛查、检测肺癌、加速癌症放射治疗、标记异常x光和对前列腺癌活检分级上。机器学习为每个领域都提供了新的帮助。比如机器学习辅助的结肠镜检查,就是一个超越了原有基础的例子。结肠镜检查不仅仅只是诊断结肠癌,还可以在手术过程中切除息肉,是阻止疾病发展和预防严重疾病的前沿阵地。在该领域中,我们已经证明机器学习可以帮助确保医生不遗漏息肉,帮助检测难以发现的息肉,还可以增加维度来提高准确度,例如应用同步定位和绘图技术。在与耶路撒冷 Shaare Zedek Medical Center 医疗中心的合作中,实验证明这些系统可以实时工作,平均每次手术可以检测到一个可能会漏检的息肉,而且每次手术的错误警报少于 4 次。
[attach]700111[/attach]
图丨对(A)一般异常、(B)结核病和(C)COVID-19 的真阳性、假阳性以及真阴性、假阴性的胸部 X 光片(CXR)进行采样。在每张 CXR 中,红色的轮廓表示模型识别时关注的区域(即类激活图),黄色的轮廓表示由放射科医生认定的感兴趣区域。
Care Studio 是另一个有潜力的医疗保健计划,它使用最先进的机器学习和 NLP 技术来分析结构化数据和医疗记录,并在正确的时间为临床医生提供相关信息,帮助他们提供更积极和准确的治疗。
尽管机器学习可能对扩大访问量和提高临床准确性很重要,但我们发现有新的趋势正在出现:使用机器学习帮助人们的日常健康和幸福。我们日常使用的设备都部署有强大的传感器,可以帮助人们普及健康指标和信息,使人们可以对自己的健康做出更明智的决定。目前已经有了可以评估心率和呼吸频率的智能手机摄像头,并且无需额外的硬件设备。Nest Hub 设备可以支持非接触式睡眠感知,让用户更好地了解自己的夜间健康状况。我们可以在自己的 ASR 系统中显著提高无序语音识别的质量,也可以使用机器学习帮助有语音障碍的人重塑声音,使他们能够用自己的声音交流。也许,使用机器学习让智能手机帮助人们更好地研究皮肤病状况,或者帮助视力有限的人慢跑,并不是遥不可及的:这些机遇证明未来是光明的。
随着机器学习在技术产品和社会中的应用越来越广泛,为了确保它被公平和公正地应用,我们必须继续开发新技术,以确保它惠及更多人。这是我们“负责任人工智能和以人为本技术”(Responsible AI and Human-Centered Technology)研究小组的主要研究重点,也是我们对各种责任相关主题进行研究的领域。
部署机器学习模型的另一个常见问题是分布转移:如果训练模型的数据统计分布与输入模型的数据统计分布不一致,那么有时模型的行为是不可预测的。最近的研究中,我们使用 Deep Bootstrap 框架来比较现实世界和“理想世界”(ideal world)的区别,前者的训练数据是有限的,而后者拥有无限的数据。更好地理解模型在这两种情况下(真实与理想)的行为,可以帮助我们开发出更适用于新环境的模型,并减少在固定训练数据集上的偏差。
更好地理解数据是机器学习研究的一个重要部分。我们对一些方法进行研究,来更好地理解特定的训练实例对机器学习模型的影响,这可以帮助我们发现和调查异常数据,因为错误标记的数据或其他类似的问题可能会对整个模型行为产生巨大的影响。同时,我们还建立了“了解你的数据”(Know Your Data)工具,以帮助机器学习研究人员和从业人员更好地了解数据集的属性。去年,我们还进行了案例研究,教你如何使用“了解你的数据”工具来探索数据集中的性别偏见和年龄偏见等问题。
谷歌非常重视应对网络暴力问题,包括使用极端语言,发表仇恨言论和散播虚假信息等。能够可靠、高效和大规模地检测到这些行为,对于确保平台安全至关重要,同时也能避免机器学习通过无监督学习的方式从网络上大量复制这些负面信息。在这方面,谷歌开创了领先的 Perspective API 工具。但是如何在大规模场景中精准地检测出有害信息仍然是一个复杂的问题。在最近,我们与不同的学术伙伴合作,引入了一个全面的分类法来应对不断变化的网络仇恨和网络骚扰情况。谷歌还对如何发现隐蔽性网络暴力,如微歧视进行了研究。通常,微歧视在网络暴力的问题中容易被忽视。我们发现,对微歧视这种主观概念进行数据注释的传统方法很可能将少数族裔边缘化。因此谷歌提出用多任务框架来解决问题的新的分类建模方法。此外,谷歌的 Jigsaw 团队与乔治华盛顿大学(George Washington University)的研究人员合作,通过定性研究和网络层面的内容分析,研究了极端的仇恨群体如何在社交媒体平台上散播虚假信息。
模型的交互式分析和调试仍然是负责任地使用机器学习语言的关键。谷歌对 Language Interpretability Tool 的技术和功能进行了更新。更新包括对图像和表格数据的支持,从 What-If Tool 中继承下来的各种功能,以及 Testing with Concept Activation Vectors 技术对公平性分析的内置支持。机器学习系统的可解释性也是谷歌提出的“负责任的 AI 愿景”(Responsible AI vision)的关键部分。在与 DeepMind 的合作下,谷歌开始了解自我训练的AlphaZero国际象棋系统是如何获取人类的象棋概念的。
谷歌还在努力拓宽“负责任的人工智能”的视角和格局,使其超越西方的局限。一项最近的研究提出在非西方背景下,基于西方机构和基建的算法公平概念并不适用。研究为印度的算法公平研究提供了新方向和新途径。谷歌正在几大洲积极开展调查,以更好地了解人们对人工智能的看法和偏好。西方视角下的算法公平研究倾向于只关注少数几个问题,因此导致很多非西方背景下的算法偏见问题被忽略。为了解决这一差距,我们与密歇根大学(University Of Michigan)合作,开发了一种弱监督薄的自然语言处理(NLP)模型,以便在更广泛的地理文化语境中检测出语言偏见,反映人类在不同的地理环境中对攻击性和非攻击性语言的判断。
让整个社会的利益相关方参与到机器学习研发部署的各阶段是谷歌正在努力的方向,这让谷歌牢记什么才是最需要解决的问题。本着这一原则,我们和非营利组织负责人、政府和非政府组织代表以及其他专家之间举行了健康公平研究峰会(Health Equity Research Summit),讨论如何将更多的公平带入整个机器学习的生态系统,使公平原则从最初的解决问题贯穿到结果评估的最后一步。
从社会出发的研究方法让谷歌在机器学习的系统中就思考数字福利和种族平等问题。谷歌希望更多了解非洲裔美国人对 ASR 系统的体验。谷歌也在更广泛地听取公众的意见,以了解机器学习如何在重大生活事件中提供帮助,例如提供家庭照顾。