摘要

数据流随时间演变具有突发性及随机性的特点,如何自适应、实时追踪这种变化是数据流挖掘面临的一个重要问题,完全由用户通过试探来甄别这种变化在实际中无法实现,同时也失去了数据流聚类进化追踪的现实意义。针对聚类变化自动追踪问题,考虑到现实的计算资源限制和处理速度要求,结合分形聚类、自适应采样技术与Chernoff不等式,提出了数据流聚类演变实时追踪算法,进行聚类演变的自动追踪;通过合成与实际数据集上的实验工作验证了算法的有效性。