摘要

为缓解输入语句中噪声对回复生成模型的干扰,提出一个基于编码–解码框架的抗噪模型。首先,在训练集输入序列中随机加入模拟噪声字符;然后,在编码端输出层训练噪声字符识别,提升模型对噪声特征的提取能力;最后,在编码端输出层融合预训练语言模型,扩大模型对噪声的覆盖面。为验证该模型的抗噪效果,构建首个带真实噪声的单轮开放域闲聊系统抗噪能力测试集。在该测试集上的实验结果表明,所提出的抗噪模型自动评测和人工评测结果均优于基准模型。

  • 出版日期2021
  • 单位苏州思必驰信息科技有限公司