找回密码
 立即注册
搜索

自然言语了解新打破:微软谷歌AI模型在这张榜单上超过人类

近日,科技公司谷歌和微软相继在一份威望自然言语了解榜单中表现超越人类,微软宣称这“标志着迈向通用人工智能的重要里程碑。”

自然言语了解(Natural Language Understanding,简称NLU)义务在人工智能范畴历史悠久,被誉为“人工智能皇冠上的明珠”。由于自然言语本身存在的歧义性或多义性,完成高质量的自然言语了解有相当的难度。

为了衡量人工智能模型的自然言语了解才能,纽约大学、华盛顿大学、Facebook和DeepMind在2019年合作提出一个名为SuperGLUE的人工智能基准测试。SuperGLUE由2018年GLUE演化而来,其言语了解义务难度更大,包括问答、自然言语推理、指代消解和词义消歧等等。



SuperGLUE榜单

在最近更新的SuperGLUE上,微软的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人类基准线(human baseline)。这是人工智能初次在SuperGLUE中表现超越人类。

虽然在SuperGLUE测试上获得令人称心的结果,但微软坦言,DeBERTa模型还没有达到人类智能的自然言语了解程度。人类非常擅长应用从不同义务中学到的知识来处理新的义务,这是AI模型需求学习的地方。

排名第一的微软模型DeBERTa共有15亿个参数。在SuperGLUE测试中,单个DeBERTa模型的宏观平均分(89.9分)超过了人类的表现(89.8分);模型全体得分(90.3分)也超过人类基准线(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,异样超过人类基准线(89.8分)。

在SuperGLUE测试中,人工智能模型被要求回答相似这样的成绩:

已知“这个孩子对疾病产生了免疫力”,问“这是由什么导致的?”请选择:A.“他避免接触这种疾病”;或B.“他接种了这一疾病的疫苗”。

这是一个简单的因果推理义务,人类很容易选出正确答案。但对人工智能模型而言,却是不小的应战。为了得出正确答案,模型需求了解已知条件和选项之间的因果关系。

2021年1月6日,微软在博客发文详细引见此次获得榜首的DeBERTa模型。

DeBERTa全称Decoding-enhanced-BERT-with-disentangled attention,是一个基于Transformer架构的神经言语模型,采用自监督学习方法对大量原始文本语料库停止预训练。DeBERTa的目的是学习通用的言语表达方式,适用于各种自然言语了解义务。DeBERTa次要用到三种新技术,分别是分离留意力机制、加强的掩码解码器和用于微调的虚拟对抗训练方法。

排名第二的T5+Meena技术来自谷歌。谷歌团队尚未详细解释其模型在SuperGLUE创纪录的缘由。但微软在博客文章中评价称,谷歌的T5模型由110亿个参数组成,相比之下,15亿参数的DeBERTa在训练和维护上愈加节能,更容易紧缩并部署到各种程序中。

微软正在将DeBERTa模型集成到下一代“图灵自然言语生成模型”(Turing NLRv4)中。下一步,他们预备向公众公开15亿参数的DeBERTa模型及其源代码。

来源:澎湃旧事

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

老孙130630 2021-1-8 17:15:48 显示全部楼层
我有个小建议,楼主把内容写详细点吧才会吸引更多读者呀。
回复

使用道具 举报

zhouguiy 2021-1-9 15:19:53 显示全部楼层
不聊了,又该去搬砖了。。。
回复

使用道具 举报

东莞快嘴 2021-1-10 14:01:54 来自手机 显示全部楼层
不错 支持一个了
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies