摘要

在大数据分析下对劣质用户数据进行动态清理时,对提高数据的准确率具有重要意义。进行劣质用户数据的动态清理时,需对数据集的关联因子进行计算,确定数据集的限定阈值。针对传统方法主要根据数据的变量进行清理,导致清理效果差、准确率低的问题,提出基于SVM方法的劣质用户数据动态清理方法。根据劣质用户的输出数据,分析劣质用户数据处于不同数据集时的空间矩阵,利用数据清理因子和数据清理频率对数据集在不同子空间中的距离进行计算,并区分数据集的关联因子,确定关联因子与限定阈值之间的关系,建立清理模型,并利用劣质用户的离散数据计算数据的均值和方差,通过求得结果分析数据的置信区间,并计算数据的置信边界,获得数据的分类函数,实现对劣质用户数据的动态清理。仿真结果表明,提出方法在对劣质用户数据进行动态清理时,具有较好的清理效果和较高的准确率。

  • 出版日期2019
  • 单位防灾科技学院