摘要

邻域粗糙集模型在对数据进行粒化时,只考虑了邻域半径内的样本个数,未考虑样本之间的分布信息,在一定程度上造成了原始数据信息的丢失。针对上述问题,定义加权邻域及加权邻域依赖度的概念,证明了加权邻域依赖度具有非单调性变化的特性。以加权邻域依赖度为度量基准,整合变精度和邻域粗糙集的优势,设计一种基于前向启发式的属性约简算法。通过在12个UCI数据集上的对比仿真,可以发现所提算法不仅可以有效提高分类精度,在一定程度上也降低了算法对变精度参数β的敏感性。