摘要

针对传统粒度支持向量机(granular support vector machine,GSVM)在处理大规模数据集时划分方法的随机性严重影响模型训练效能的情况,提出一种基于核模糊C均值聚类的粒度支持向量机(granular support vector machine based on kernel-based fuzzy c-means cluster,GSVM-KFCM)的方法。首先利用核映射将数据映射到高维空间进行聚类划分得到若干个信息粒,然后在每个信息粒中进行支持向量机的训练,提取出关键信息并融合建立最终决策模型。实验结果表明:该方法可以降低大规模数据集的训练时间,同时也能提高算法的准确度。