当我们提到“猫”的时分：约书亚·本吉奥谈自然言语处理难题

oogiglwg · 2019-1-15 11:56:47

当我们提到“猫”的时分，我们不只会想到一个笼统的概念，还会想象到猫的笼统，甚至会记得一只猫咪趴在腿上时柔软的触感。与人类相比，目前的人工智能自然言语处理系统还不能真正了解句子的含义。因此，它们时常犯一些“非常愚笨的错误”。

2018年11月6日，Yoshua Bengio（约书亚·本吉奥）在“二十一世纪的计算”国际学术研讨会暨微软教育峰会上与澎湃旧事（www.thepaper.cn）记者谈到了自然言语处理技术的发展状况。作为其中一位深度学习奠基者，他希望建立自然言语了解系统来了解“言语所指的世界”。

Yoshua Bengio接受澎湃旧事采访

Yoshua Bengio长大于加拿大，现居蒙特利尔，在蒙特利尔大学（University of Montreal）计算机迷信与运算系任教授。业内戏称他与异样活跃于加拿大的“神经网络之父”Geoffrey Hinton和“卷积网络之父”Yann LeCun为“加拿大黑手党”（Canadian Mafia）。

自然言语处理的“常识”难题：“甚至没有两岁小孩的了解才能”

Bengio的其中一个重要研讨范畴是自然言语处理（NLP）。简单来讲，自然言语处理指的是完成人与计算机之间用自然言语停止有效通讯，其中既有自然言语了解的过程，也有自然言语生成的过程。由于自然言语本身存在的歧义性或多义性，完成高质量的自然言语处理有相当的难度，但目前曾经获得了不小的停顿。

Bengio表示，基于大量的文本，人们曾经建立了大型系统，在言语处理中表现不错，但也出现了分明的局限性。最分明的成绩是，目前的自然言语系统其实并不了解句子的真正含义。机器“会犯一些非常愚笨的错误，甚至没有两岁小孩的了解才能”。现有的自然言语处理系统掌握了大量的词汇量和言语转换的技巧，但是系统不了解言语详细指代的是什么。Bengio以为，言语是一个工具，用来指代世界上正在发生的事情，指代我们头脑中的概念，“这些概念不是纯粹笼统的，它们锚定在我们世界的理想中，很多关于这些概念的知识不能经过简单阅读大量的文本而获得。”运用大量的数据，人们可以让机器掌握任何人终身都无法阅历的宏大文本数量，“但这些机器的了解非常有限”，换言之，“机器缺失了常识”。

能否有处理办法？Bengio给出了一定的答案。他首先聊到了常识，聊到了三岁小孩对世界的了解。“常识是指我们对周围世界的广泛了解”，他举例说，一个两岁或三岁的孩子，她有物理常识，她知道重力、液体、容器、压力等等，她也懂一点心思学，甚至懂一点因果关系，“她能在某些方面直观地了解这个世界”，渐渐地，她会知道言语中某些词汇在理想里所指代的事物。

他接着提出了猫的例子。当我们提到“猫”的时分，我们不只会想到一个笼统的概念，还可以想象到猫的笼统，甚至会记得一只猫咪趴在腿上时柔软的触感。“我们用这些词汇时，实践上伴随着一切与它们相关的感知联想。而这些知觉或举动，对于了解句子来说很重要”。他以为这种感知和了解力的缺失是电脑不擅长了解言语的缘由。

人类为了了解语句，必须对理想世界中发生的事情有一个“心思图像”，而这些信息并不存在于言语文本中。对人类而言，人们“必需要有常识，有对世界的直观了解”，才能正确了解语义；同理，对计算机系统来说，“假如只在文本上停止训练，这个成绩就得不到处理”。

下面的例子启示了Bengio，他以为，我们不能独立地用模型构建来停止言语学习，还需求同时建立起这个世界的模型：像一个孩子那样直观地了解这个世界的运作法则，并且为概念命名，如此一来，我们才可以用言语来指代这个世界中的事物。

他一定了神经迷信在其中的作用，并表示，神经迷信曾经在很多方面协助了机器学习。从50年代末尾，深度学习借用了神经迷信和认知迷信的许多概念。近期，人们用来制造深度网络的一些技巧都源于神经迷信或认知迷信。

除了迷信首领，加拿大还想成为“AI道德首领”

美国的“佛系”邻居加拿大在人工智能尤其是机器学习范畴有相当数量的顶尖迷信家和科研人员。除了Yoshua Benjio、Geoffrey Hinton（谷歌大脑人工智能团队首席迷信家）、Yann LeCun（Facebook人工智能研讨主管）这三位深度学习“三巨头”，还有蒙特利尔、多伦多等AI重镇。

为什么加拿大在人工智能范畴如此优秀？Benjio在采访中给出了一些答案。在他看来，

一个重要要素是加拿大比很多国家更早末尾做深度学习研讨，“特别是在蒙特利尔，一大批研讨人员在做这些研讨”。另外，加拿大政府也在这类研讨中投入了大量资金，这些资金被用来招募教授、招收更多的先生、做大量的研讨。

还有一个很重要的缘由是加拿大是第一个提出AI战略的国家。Benjio称，加拿大是第一个真正有国家战略去发展AI科研和AI经济的国家，“加拿大不断是一个迷信首领，它正在建造大量的高科技AI公司。但当然加拿大是个小国家，不像中国或美国。”

除了迷信首领，“加拿大还想成为AI的道德首领”。Benjio以为，AI非常弱小，并且在将来将更弱小。因此，如何开发、运用AI非常重要，这会对社会和普通人都产生影响，“在道德层面，需求政府参与以确保AI没有被滥用”。

为了AI的社会化责任发展，蒙特利尔花了一年左右的工夫提出了一份蒙特利尔宣言（Montreal Declaration）。这个宣言包含七个准绳，关乎到人们应如何从伦理、社会角度去建造AI系统。他希望这将有助于指点公司和政府做出决策。Benjio提到了这份道德宣言的特别之处，它不只仅吸收了计算机迷信家的意见，还有哲学家、经济学家、社会学家、人文学者等参与其中。除此之外，他们与公众停止了磋商，在公共图书馆讯问人们对AI的担忧，以获取对于该声明的反馈。

Benjio还以为，对于AI的伦理成绩，我们需求一些全球性的规则。“有一些明白的道德底线是不应该被跨越的”。他提到了AI的军事用途，他希望一切国家或大多数国家都赞同避免运用能够真正危及人类生命安全的技术。他开玩笑说，“你可以想象比如一些国家建造杀人无人机去瞄准AI迷信家……我们不希望这样”。

自动编程、打破言语妨碍与学习外星言语

澎湃旧事（www.thepaper.cn）还在采访中与Benjio聊到了一些风趣的成绩：

澎湃旧事：有没有能够运用深度学习完成自动编程？

Yoshua Benjio：有好几个人试图这么做。这很难。我以为目前还没有很好的处理方案。但这是一个风趣的成绩，由于它关系到推理，即人们称为系统二义务。在心思学中，系统二义务是我们按顺序执行的义务，比如一些程序设计之类的义务，是需求人们无看法地去做的事情。我不以为当前的机器学习在这些方面能做得很好，但我们需求获得提高。所以我以为研讨人员正在研讨这件事是很好的。

澎湃旧事：在一百年内，人们可以打破言语的妨碍吗？

Yoshua Benjio：是的，但其实我不知道，由于我没有水晶球。我的冤家Yann Lecun有一个很好的比喻：我们在爬山，获得了很大的提高，我们非常高兴，“哦，太好了，看看我们在几年间获得了这么大的提高”。但当我们越爬越高的时分，我们看到了什么？另一座山在后面。你以为另一座山后面是什么？能够是另外一个。这在迷信上很普遍，当我们在这些成绩上获得停顿时，我们看到了我们没无看法到的其他应战。所以也许需求20年，也许需求两百年才能处理这些应战，由于我们还不知道应战是什么。

澎湃旧事：人们能否能经过深度学习掌握外星人的言语，假如有外星人存在的话？

Yoshua Benjio：至少不是经过目前的深度学习。由于目前的深度学习甚至不能学习人类言语。我的意思是，我们目前训练的系统非常有用，但是它们不明白本人在说什么。

acocabook · 2019-1-15 17:49:40

大人，此事必有蹊跷！

冰心诺 · 2019-1-16 08:37:32

哈哈哈，楼主求带

		自动登录	找回密码
密码			立即注册

当我们提到“猫”的时分：约书亚·本吉奥谈自然言语处理难题

本帖子中包含更多资源

大神点评2

最近发表

公社版块

关注我们