基于PGN-CL的文本摘要生成模型

刘雅情; 张海军<sup>*</sup>; 梁科晋; 张昱; 王月阳

摘要

基于Seq2Seq框架的生成式文本摘要模型取得了不错的研究进展，但此类模型大多存在未登录词、生成文本重复、曝光偏差问题。为此，本文提出基于对抗性扰动对比学习的指针生成器网络PGN-CL来建模文本摘要生成过程，该模型以指针生成器网络PGN为基本架构，解决摘要模型存在的未登录词和生成文本重复的问题；采用对抗性扰动对比学习作为一种新的模型训练方式来解决曝光偏差问题。在PGN模型的训练过程中，通过向目标序列添加扰动并建立对比损失函数来生成对抗性正负样本，使负样本与目标序列在嵌入空间相似但语义差别很大，正样本与目标序列在语义空间很相近但嵌入空间差距较大，这些区分困难的正负样本可以引导PGN模型在特征空间更好地学习到正负样本的区分特征，获得更准确的摘要表示。在LCSTS数据集上的实验结果表明，提出的模型在ROUGE评价指标上的表现优于对比基线，证明了融合指针生成器网络和对抗性扰动对比学习对摘要质量提升的有效性。

出版日期2023
单位新疆师范大学

收藏分享被引浏览

更新时间：2024-03-19 06:40

基于PGN-CL的文本摘要生成模型

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友