在由 DeepMind 主办的 Deep Learning Indaba 2018 深度学习峰会上,20 多名 NLP 领域的研究者接受采访,就 NLP 的研究现状、当前困境和未来走向等问题发表了自己的见解。很多研究者指出:自然语言理解才是当前 NLP 发展的最大问题。
我认为最大的开放性问题是关于自然语言理解的。我们应该通过构建文本表征,开发出能像人类一样阅读和理解文本的系统。在那之前,我们所有的进步都只是在提升系统模式匹配的能力。——Kevin Gimpel在专家采访中,很多专家认为自然语言理解(NLU)问题是最核心的,因为它是很多任务的先决条件(如自然语言生成)。他们认为目前的模型都还没有「真正」理解自然语言。
应对数据较少的场景(低资源语言、方言等)不是一个完全「空白」的问题,因为该领域已经有了很多颇有前景的思路,但我们还没找到一个解决这类问题的普适方案。——Karen Livescu我们探索的第二个主题是在低资源场景下泛化至训练数据之外的领域。在 Indaba 的场景下,一个自然的关注点就是低资源语言。第一个问题聚焦于是否有必要为特定的语言开发专门的 NLP 工具,还是说进行通用 NLP 研究已经足够了。
高效表征大型文本。现有模型主要基于循环神经网络,该网络无法良好地表征较长的文本。受图启发的 RNN 工作流程具有发展潜力,因为它们比普通的 RNN 要更加容易训练,尽管目前只看到了有限的改进,而且还没有被广泛采用。——Isabelle Augenstein对大型文本和多个文本进行推理也是一个较大的开放性问题。最近的 NarrativeQA 数据集是符合这一背景的一个很好的基准示例。使用很大的语境进行推理与 NLU 紧密相关,需要大幅度扩展现有系统,使其可以阅读整本书或整个电影剧本。这里有一个关键问题:我们需要训练更好的模型还是仅仅在更多数据上训练?此处不展开讨论。
或许最大的问题是如何定义问题本身。正确定义问题指的是构建数据集和评估步骤来恰当地衡量我们在具体目标上的进展。如果能将所有问题都简化为 Kaggle 风格的竞赛,事情就简单多了!——Mikel Artetxe本文没有空余篇幅讨论当前基准测试和评估设置的问题,相关回答可以参考调查结果。最后一个问题是,非洲社会最亟待解决的 NLP 问题是什么。Jade 给出的答案是资源不足问题。让人们借助翻译用自己的语言接触所有感兴趣的教育资源是非常重要的一件事情。
欢迎光临 智客公社 (http://bbs.cnaiplus.com/) | Powered by Discuz! X3.4 |