摘要

聚类分析是将数据集划分为若干组,使得同一组中的对象具有较高的相似度,不同组中的对象是不相似的。相似性度量用于测量聚类的分组能力,它在聚类算法中起着核心作用。论文从相似度的角度分析了相似性度量对算法性能的影响,给出了分析的结果和未来发展的方向。