摘要

属性选择是数据挖掘领域用于降低数据特征维度的预处理方法.针对大数据环境下高维数据的属性约简问题,提出了融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法.首先,引入了参数控制的位置更新策略、对蚂蚁个体与种群进行交叉变异、重新定义阻塞机制的信息素更新,提出了并行改进的二元蚁群算法MRIBACO.其次,以并行二元蚁群算法作为离散解空间的搜索策略,结合分形维数提出了属性选择模型.在6个UCI数据集上的实验结果表明,较其他方法计算效率更优,同时表明了其有效性与稳定性.