摘要

针对目前网页分类存在的问题,选择利用近义词聚类的方法,将CBC算法运用到网页聚类中,并加入搜索词作为主要的参照数据,通过在聚类算法中加入限定参数的方法对CBC算法进行了改进。用数据集实验对改进后的CBC算法与传统的k-means算法的结果进行了比较,结果表明改进算法在精确度上优于传统的k-means算法,在效率上也有较为明显的优势。

全文