摘要

大数据下对虚假无效数据进行优化识别,可有效过滤虚假信息,提高基础数据的安全性。对虚假无效信息的识别,首先需要获得数据全部类型,并进行规则参数优化,完成对虚假无效信息的优化识别。传统方法将虚假无效数据设定在一个簇内,同时引入信任管理机制来识别节点,但忽略了先将无效数据进行分类,导致识别精度偏低。提出基于聚类规则的大数据下虚假无效数据识别方法。首先对大数据下的运行数据样本进行归一化处理,对虚假无效数据进行聚类,获得虚假无效数据的全部类型,依据识别规则库,选用能够处理高维数据的支持向量数据描述算法进行规则参数优化,采用增减式在线训练算法对虚假无效数据分类器进行不断训练,最终获得较为精确的虚假无效数据识别模型。仿真证明,所提方法能更快速准确地识别出虚假无效数据,有效减少了训练成本。