K-means算法的优化及应用

作者:方诗乔; 胡佩玲; 黄莹莹; 张昕
来源:现代信息科技, 2023, 7(06): 111-115.
DOI:10.19850/j.cnki.2096-4706.2023.06.028

摘要

针对K-means算法易受初始值和异常点影响,以及聚类数选取依靠人工经验和初始聚类中心选取随机等缺点,提出一种基于改进Canopy算法的K-means聚类算法。首先将初始数据集进行预处理和分类,然后选取特殊的阈值利用改进的Canopy算法得到聚类数和初始聚类中心,再运行K-means算法实现最终聚类。经检验得知,改进后的算法减少了对人工选择的依赖,并且聚类准确度有了明显的提高。最后将改进后的算法应用于顾客细分实例,取得了良好的分类效果,证明了优化算法的实用性。