摘要

针对气体传感器数据采集过程中可能出现数据失真、数据重复的现象,提出一种基于时间序列滑动窗口的异常检测方法。基于滑动窗口将原始时间序列分割成多个子序列,利用斜率的置信区间距离半径提取子序列时序特征并识别疑似异常序列,再通过时间序列分解与基于密度的噪声应用空间聚类方法(Density-based Spatial Clustering of Applications with Noise, DBSCAN)进一步判定异常值。以某区域挥发性有机物(Volatile Organic Compounds, VOCs)数据作为验证数据集,检测结果表明该算法能够准确识别异常子序列和异常值,精确率、查全率以及平衡F分数(F1)分别为93.7%、90.7%和92.18%,验证了提出方法的可用性。同时,针对异常为缺失值的情况,提出了一种基于支持向量机回归(Support Vector Regression, SVR)的恢复模型,经验证决定系数R2为96.53%,优于对比模型。

全文