摘要

针对集中供热系统异常数据识别工作量大的问题,本文提出采用孤立森林(IF)算法进行异常数据的自动识别。以天津某换热站一个供暖季的数据作为样本,详细分析了集中供热系统数据本身的物理规律及IF算法设定参数对模型性能的影响规律。针对集中供热系统运行调节所导致的部分正常数据误诊率高的问题提出了数据集参数相对化的方法,通过该方法可以降低6.7%的数据误诊率和44.6%的漏诊率。通过对比不同IF算法设定参数下的模型性能,给出了供热系统数据异常识别的推荐参数设定范围。