摘要

事件抽取旨在从海量的非结构化的事件相关文本中抽取出人类感兴趣的内容,目前现有的事件抽取方法大多数基于通用语料,很少考虑到领域内的先验知识,并且现有的方法大多数不能很好的处理同一文档包含多个事件的情况,面对存在较多负面样例的测试也表现不佳。该文针对上述问题提出了一种基于Fin-BERT(Financial Bidirectional Encoder Representation from Transformers)和PTPCG(Pseudo-Trigger-aware Pruned Complete Graph)的模型Fin-PTPCG,该方法充分利用Fin-BERT预训练模型的表达能力,在编码阶段融入领域内的先验知识,并且在事件检测模块采用多个二元分类器叠加的方式,保证模型可以有效识别一篇文档内存在多事件的情况并筛除掉负面样例,抽取实体之后将实体连接成完全图并通过计算相似度矩阵进行剪枝,通过选择伪触发器解决无标注触发词的问题,最后接入事件分类器实现事件抽取。该方法在ChFinAnn和Duee-fin数据集上事件抽取任务的F1值相比于基线方法分别取得了0.7%和3.7%的提升。