面向大数据处理的并行优化抽样聚类K-means算法

周润物; 李智勇; 陈少淼; 陈京; 李仁发

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

面向大数据处理的并行优化抽样聚类K-means算法

作者：周润物; 李智勇; 陈少淼; 陈京; 李仁发

来源：计算机应用, 2016, 36(02): 311-329.

摘要

针对大数据环境下K-means聚类算法聚类精度不足和收敛速度慢的问题,提出一种基于优化抽样聚类的K-means算法(OSCK)。首先,该算法从海量数据中概率抽样多个样本;其次,基于最佳聚类中心的欧氏距离相似性原理,建模评估样本聚类结果并去除抽样聚类结果的次优解;最后,加权整合评估得到的聚类结果得到最终k个聚类中心,并将这k个聚类中心作为大数据集聚类中心。理论分析和实验结果表明,OSCK面向海量数据分析相对于对比算法具有更好的聚类精度,并且具有很强的稳健性和可扩展性。

出版日期2016
单位湖南大学

收藏分享被引浏览

更新时间：2024-05-13 21:10

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号