摘要

关系抽取作为一种经典的自然语言处理任务,广泛应用于知识图谱的构建与补全、知识库问答和文本摘要等领域,旨在抽取目标实体对之间的语义关系.为了能够高效地构建大规模监督语料,基于远程监督的关系抽取方法被提出,通过将文本与现有知识库进行对齐来实现自动标注.然而由于过强的假设使得其面临诸多挑战,从而吸引了研究者们的关注.本文首先介绍远程监督关系抽取的概念和形式化描述,其次从噪声、信息匮乏以及非均衡3个方面对比分析相关方法及其优缺点,接着对评估数据集以及评测指标进行了解释和对比分析,最后探讨了远程监督关系抽取面对的新的挑战以及未来发展趋势,并在最后做出总结.