摘要

计算机网络技术日益成熟完善,大数据时代日新月异。每时每刻产生的大量数据信息也逐渐复杂,因此数据分析也越来越受到广大学者的关注。而聚类分析是数据挖掘中划分和分组的重要方法之一,在生物、医疗、机器学习、市场营销等诸多领域都得到广泛应用。K-means聚类算法作为一种可扩展性、高效性的聚类算法,在解决大规模数据聚类处理问题时有着独到的优势。基于此,该研究提出了一种针对K-means聚类算法肘点法中的先验性K值不准确的K值纠正优化算法。该算法结合了ISO-DATA算法原理,实现了在先验性K值的一定范围内根据数据集的特征利用多参数实现K值更准确的选择。