触发词与属性值对联合抽取方法研究

作者:汪瀛寰; 薛婵; 包先雨; 吴共庆
来源:计算机工程与应用, 2020, 56(09): 168-174.
DOI:10.3778/j.issn.1002-8331.1901-0151

摘要

传统的属性值对抽取方法通常应用于短文本,且仅限于抽取字符串属性。提出一种触发词与属性值对的联合抽取方法,不仅能够通过识别触发词确定长文本中的信息语句,从而确定二元语义属性的取值,而且能够考虑触发词、字符串属性和属性值的相互依赖关系,基于条件随机场构建联合标记模型,提高字符串属性值对的抽取性能。实验结果显示,与传统方法相比,所提出的方法能够抽取二元语义属性值对,并且对字符串属性的抽取准确率、召回率和F值分别提高15.3%、15.5%和15.5%,同时抽取所用平均时间降低76.29%。

全文