摘要

为了准确识别和剔除风电机组在实际运行过程中产生的异常数据,以便为功率预测等工作提供有效的数据支持,通过分析风电机组运行数据散点在风速-功率(v-P)坐标系中的分布特征,提出了基于变分贝叶斯推断的狄利克雷过程高斯混合模型异常数据识别方法。将试验机组E17实测数据散点沿水平功率方向以一定间隔划分区间,采用能自适应确定最佳分量个数的狄利克雷过程高斯混合模型对每一个功率区间内的数据散点进行聚类,结合各高斯分量置信椭圆参数及数据散点在v-P坐标系中的分布特征,对试验机组E17各功率区间内的高斯分量及其聚类散点进行异常标识。结果表明:该模型克服了传统高斯混合模型需要人为确定分量个数的缺点,能够对风电机组异常数据进行准确识别。