摘要

由于信息受到随机性和离群问题的干扰,导致信息聚类效果不好,从大量不完备数据中划分出有效信息成为各行各业所面临的重要问题。为此,提出改进K-means算法结合深度学习对不完备信息进行选取。首先,建立不完备信息系统粗糙集的表达形式,通过状态集、动作集对信息样本数据的三种行为进行决策,求得不完备信息系统粗糙集的上近似值和下近似值。其次,通过正同域、负反域和边界域来表示不完备信息的聚类结果,采用改进的K-means聚类算法,对缺失属性值进行集对分析。最后,通过深度学习对样本信息进行不断训练,求得这一过程的最优策略。基于MATLAB仿真实验,验证了在不完备信息选取过程中,所提算法能够获得正同域聚类结果以及正同域和边界域聚类结果的最优值,即使在一定的缺失率情况下,仍能保持较高的聚类效果,能够有效应用于不完备信息的选取。

  • 出版日期2021
  • 单位河南大学; 物理与电子学院