摘要

研究针对海量数据流的分类方法,构建分类结果评判数学模型,保证分类系统的稳定性。与静态数据相比,数据流具有动态变化性、传输高速性、高维有序性以及规模宏大性,且存在概念漂移的现象,采用传统的分类方法进行数据流分类,很难处理其中大量的不确定性信息,分类的准确率较低、耗费时间长,无法达到理想的分类效果。为此,提出基于改进决策树算法的海量数据流分类方法。针对原始数据中的冗余进行预处理,去除冗余,提高分类效率,采用改进决策树算法,建立海量数据流决策树分类模型,并依据模糊粗糙集理论构建评判数学模型,对分类结果进行评价。实验结果表明,采用改进的分类方法进行海量数据流分类,能够有效的提高分类系统的稳定性与运行效率,保证分类结果的准确性,能够满足实际的应用需求。

全文