改进Bi-LSTM的文本相似度计算方法

冯月春; 陈惠娟

doi:10.16208/j.issn1000-7024.2022.05.026

摘要

为提高自然语言处理任务中文本相似度检测的准确率,提出一种改进双向长短期记忆网络(Bi-LSTM)的文本相似度计算方法。将输入的句子转换成多个单词向量,通过Bi-LSTM提取出每个单词向量的最佳词特征,引入注意力机制,减小非关键因素的影响;采用多层相似加权对两个句子分别从词与词、句子与句子、词与句子3个层面进行多层比较,加权得到其最终的相似度;基于SMTeuroparl、MSRvid和MSRpar这3个数据集对所提方法的性能进行评估。实验结果表明,相比于其它方法,所提方法的文本相似度计算更佳,适用于处理复杂的长文本。

出版日期2022
单位宁夏理工学院; 西安工程大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 19:28

改进Bi-LSTM的文本相似度计算方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友