摘要

为了解决金融领域文本分类算法稀缺,以及现有算法无法充分提取文本中词与词的关系、长距离依赖关系和深层次特征信息的问题,提出了一种改进卷积自注意力模型的文本深度关系抽取算法.该算法在改进的深度金字塔卷积神经网络(DPCNN)中引入自注意力,并联合双向门控神经网络(BiGRU)模块建立文本分类模型,解决了针对金融领域长文本的长距离依赖特征信息和词与词之间关系特征信息的提取问题,实现文本中深层次特征信息和上下文语义信息联合抽取功能.在THUCNews短文本与长文本数据集上分别进行实验,实验结果表明,所提方法与BERT等方法相比,在评价指标上有显著提高.在自制金融长文本数据集上的对比实验表明,与其他模型相比,该算法模型的准确率和F1值更高.通过一系列实验可以证明,该算法模型能够更准确地完成针对金融长文本的分类任务.

全文