摘要

高校体质测试成绩分析工作中常常需要对异常数据进行判别,基于传统的k均值聚类算法不能排除身体素质极差和极好同学对异常检测的影响,误检率高。文章针对以上问题,融合异常检测中常用的基于k均值聚类、距离和密度的三种异常检测方法的思想,根据体质测试数据的结构特点,提出一种体质测试数据异常检测融合算法(ADF-PFT)。ADF-PFT将聚类结果中节点与聚类中心的欧式距离、当前年份节点与历史年份节点欧氏距离的平均值、当前年份节点所在位置的密度与历史节点所在位置的密度差的平均值结合起来,三个要素通过一定权值相加,得到体质测试数据离群指数(PFT-OI)用来判定异常数据。针对体质测试数据,该算法相比于传统的k均值聚类算法可以明显降低误检率,结合高校体育教师的教学经验,能准确的识别异常数据,高效地辅助体育教学和科研工作。最后通过实验验证了ADF-PFT的有效性,实验结果表明,相比于传统的k均值聚类算法,ADF-PFT可以大幅度降低误检率。