摘要

【目的】对普遍存在的时间序列缺失值进行有效估值,进而改善时间序列数据的质量。【方法】以亚热带典型小流域长期定位观测的气象(最低气温、最高气温、太阳辐射)及水文(降水量、地表径流量)数据为样本并利用计算机模拟的方法,比较了线性内插法、K-最近邻插值法、多项式插值法、样条插值法和核密度估值法5种估值方法的性能差异,分析了不同取样时间步长(日和月)及不同数据缺失量(1%、5%、10%、15%、20%)条件下对缺失值进行估值的不确定性。均方根误差(RMSE)、绝对值平均误差(MAE)和Pearson相关系数(r)3个交叉验证指标用于评估5种估值方法的性能优劣。【结果】①5种方法估值性能较好,Pearson相关系数为0.62~0.99(P<0.05),且以核密度估值法和多项式插值法的估值性能为优;②数据缺失量和取样步长增加降低了5种估值方法的估值精度;③数据集的变异系数(CV)与估值评估指标(RMSE、MAE及r)显著相关(P<0.05)。【结论】核密度估值法和多项式插值法的估值结果相对更可靠,变异系数是影响估值不确定性的重要因素。

全文