摘要

[目的 /意义]提出一种基于融合显隐式信息的单类协同过滤算法的文献主题词推荐方法,以提高面向学者和文献的主题词推荐的准确率。[方法 /过程]通过构造一种基于文献丰富度和主题词流行度的矩阵分解模型,测度出文献和未出现在当前文献中的主题词相关性概率,并根据相关性概率的大小将这些主题词划分为文献的隐式相关主题词和隐式无关主题词。然后针对这两种主题词,分别提出两种不同的主题词权值预测方法,即融合偏好系数的自编码器填充模型和零值填充模型。[结果 /结论 ]在面向人工智能领域的科技文献数据集SD4AI上的实验表明,较各种其他典型协同过滤方法,本文方法可分别提高预测主题词权值和识别高权值主题词的推荐效果,MAE和FCP的提升幅度最高达16.07%和16.83%,P@N和NDCG@N的推荐效果最高达22.37%和27.06%。