找回密码
 立即注册
搜索

自然言语处理中的实体关系抽取相关重要论文引荐

欢迎离开《每周NLP论文引荐》。在这个专栏里,还是本着有三AI一向的准绳,专注于让大家可以系统性完成学习,所以我们引荐的文章也必定是同一主题的。

实体关系抽取作为信息抽取范畴的重要研讨课题,其次要目的是抽取句子中已标记实体对之间的语义关系,即在实体辨认的基础上确定无结构文本中实体对间的关系类别,并构成结构化的数据以便存储和取用。
作者 | 小Dream哥
编辑 | 言有三



1 早期机器学习方面的探求

文献[1] 应用实体词、实体类型、援用类型等特征构造特征向量,采用最大熵分类器构建抽取模型,在ACE RDC 2003 英文语料上的实体关系抽取实验表明, 该方法在关系分类上获得的F1值为52.8% 。

文献[2] 在之前的研讨的基础上, 分类组织各种特征,构成平面组合核,并采用SVM分类器在ACE RDC 2004 英文语料上停止实体关系抽取,获得了 70. 3% 的F1值。

文献[3] 在已有特征的基础上,引入字特征, 并采用条件随机场停止医学范畴实体间关系的抽取,F1值达到 75% 以上。

文章援用量:300+

引荐指数:✦✦✦✧✧

[1] Kambhatla N. Combining Lexical, Syntactic and Semantic Features with Maximum Entropy Models for Extracting Relationships[C] Proceedings of the ACL 2004 on Interactive Poster and Demonstration Sessions. 2004: 22.

[2] Zhao S, Grishman R. Extracting Relations with Integrated Information using Kernel Methods[C] Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. 2005: 419-426.

[3] Miao Q, Zhang S, Zhang B, et al. Extracting and Visualizing Semantic Relationships from Chinese Biomedical Text[C] Proceedings of the Pacific Asia Conference on Language. 2012: 99-107.

2 CNN与LSTM的运用

现有的有监督学习关系抽取方法曾经获得了较好的效果,但它们严重依赖词性标注、句法解析等自然言语处理标注提供分类特征。而自然言语处理标注工具往往存在大量错误,这些错误将会在关系抽取系统中不断传播放大,最终影响关系抽取的效果。近年来,很多研讨人员末尾将深度学习框架的神经网络模型运用到关系抽取中,神经网络模型可以自动学习句子特征,无需依赖复杂的特征工程以及范畴专家知识,具有很强的泛化才能。

文献[4]提出采用卷积神经网络停止关系抽取。他们在词汇层面特征(Lexical-level Feature)的基础上引入目的实体与句子其他词的相对地位信息,来构造句子层面的特征(Sentence-level Feature),然后经过池化层和非线性层获取句子表示。在没有运用NLP处理工具(POS、NER、syntactic analysis)的状况下,获得了最优的实验效果。

文献[5]提出提出了一种基于端到端神经网络的关系抽取模型。该模型运用双向LSTM和树形LSTM同时对实体和句子停止建模。

文章援用量:150+

引荐指数:✦✦✦✦✧

[4] Santos C N D , Xiang B , Zhou B . Classifying Relations by Ranking with Convolutional Neural Networks[J]. Computer Science, 2015, 86(86):132-137.

[5] Miwa M , Bansal M . End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures[J]. 2016.

3 结合抽取

普通传统的串联抽取方法是在实体抽取的基础上停止实体之间关系的辨认。在这种方法中,先期实体辨认的结果会影响到关系抽取的结果,前后容易产生误差累积。针对这一成绩,基于传统机器学习的结合模(Joint model)被提出并逐渐用于对这一类的NLP义务停止结合学习。

文章援用量:

引荐指数:✦✦✦✦✦

[6] Zheng S , Hao Y , Lu D , et al. Joint entity and relation extraction based on a hybrid neural network[J]. Neurocomputing, 2017: S0925231217301 -613.

[7] Zheng S , Wang F , Bao H , et al. Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme[J]. 2017.

4 FewRel

据了解,这是目前最大的精标注关系抽取数据集。该数据集包含 100 个类别、70000 个实例,片面超越了以往的同类精标注数据集。FewRel 不只可以运用在经典的监督/远监督关系抽取义务中,在新兴的少次学习(few-shot learning)义务上也有极大的探求价值和广阔的运用前景。

文章援用量:较少

引荐指数:✦✦✦✦✦

[8] FewRel: A Large-Scale Supervised Few-Shot Relation Classification Dataset with State-of-the-Art Evaluation

5 多义务和强化学习

引见一些早先的关于实体关系抽取的研讨,包括多义务和强化学习的方法,感兴味的同窗可以基于此,继续跟进。

文章援用量:较少

引荐指数:✦✦✦✦✧


[9] Zhepei Wei, Yantao Jia. Joint Extraction of Entities and Relations with a Hierarchical Multi-task Tagging Model. arXiv:1908.08672v1. 2019

[10] Takanobu R , Zhang T , Liu J , et al. A Hierarchical Framework for Relation Extraction with Reinforcement Learning[J]. 2018.

6 如何获取文章与交流

找到有三AI开源项目即可获取。
https://github.com/longpeng2008/yousan.ai

文章细节众多,阅读交流在有三AI-NLP知识星球中停止,感兴味可以加入。

总结

以上就是实体关系抽取必读的文章,下一期我们将引见FAQ相关的文章。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

蒋天雄 2019-8-29 19:37:25 显示全部楼层
我有个小建议,楼主把内容写详细点吧才会吸引更多读者呀。
回复

使用道具 举报

sky5377 2019-8-31 11:05:59 显示全部楼层
啥玩应呀
回复

使用道具 举报

柒幽莜 2019-9-1 07:55:06 显示全部楼层
楼猪V5啊
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies