摘要

对大数据中用户资源信息的提取,能够有效提高网络用户管理效率。对用户资源信息的提取,需要对用户兴趣进行描述,通过相对熵计算用户行为相似度,完成资源信息的提取。传统方法对用户项目矩阵进行奇异值分解,并在其中添加用户行为特征,但忽略了对用户行为相似度的获取,导致耗时较长、提取精度偏低。提出新的大数据下面向网络用户资源的资源信息提取方法。对用户历史行为进行分析,求用户间相似度,获取资源信息提取列表。对网络用户资源中服务器日志和客户端日志进行挖掘,对用户兴趣度进行计算,利用熵权法对大数据下用户行为进行分析。将兴趣度引入向量空间模型,建立二层树状结构对用户兴趣进行描述。依据用户兴趣度描述结果,通过相对熵对用户行为相似度进行计算,完成大数据中用户资源信息的提取。实验结果表明,所提方法提取准确性高,适用于大数据。

  • 出版日期2018
  • 单位信息工程大学