Q-learning算法优化的SVDPP推荐算法

作者:周运腾; 张雪英*; 李凤莲; 刘书昌; 焦江丽; 田豆
来源:计算机工程, 2021, 47(02): 46-51.
DOI:10.19678/j.issn.1000-3428.0056332

摘要

为进一步改善个性化推荐系统的推荐效果,通过使用强化学习方法对SVDPP算法进行优化,提出一种新的协同过滤推荐算法。考虑用户评分的时间效应,将推荐问题转化为马尔科夫决策过程。在此基础上,利用Q-learning算法构建融合时间戳信息的用户评分优化模型,同时通过预测评分取整填充和优化边界补全方法预测缺失值,以解决数据稀疏性问题。实验结果显示,该算法的均方根误差较SVDPP算法降低了0.005 6,表明融合时间戳并采用强化学习方法进行推荐性能优化是可行的。