摘要

在实际应用中,传统K-means算法存在k值需要预先指定、初始聚类中心随机选择等问题,都影响到K-means的性能。为了解决这些问题,产生了许多K-means算法的变体。笔者对传统K-means进行了简要概述,指出其存在的问题,总结了聚类数的确定、聚类初始化、相似性度量以及噪声和离群值的敏感性等方面的改进,最后给出了进一步的研究方向。

  • 出版日期2021
  • 单位陕西机电职业技术学院