巧用SPSS聚类分析进行异常值预判

作者:齐凤; 杨逸臣
来源:中国计量, 2022, (05): 89-91.
DOI:10.16569/j.cnki.cn11-3720/t.2022.05.032

摘要

<正>本文尝试利用SPSS统计分析软件的聚类分析功能,从另一个思路入手,巧妙实现检定数据中可疑异常值的识别,有针对性地为之后开展异常值的剔除工作打下牢固基础。一、聚类分析方法识别异常值的思路聚类分析简单来讲就是将相似的样本自动归为一类,因此,同一个类中的对象有很大的相似性,而不同类间的对象有很大的相异性。而在异常值的判别中也可以理解为将数据分为两类:一类是异常值数据,另一类就是除异常值外的正常数据。同样地,这两类数据各自有很大的相似性,而这两类数据之间有很大的相异性。从这一角度看,可以发现异常值的识别和剔除与聚类分析的原理有异曲同工之处。这也是本文得以利用SPSS统计分析软件的聚类分析识别出可疑异常值的重要基础。

  • 出版日期2022