摘要

为了解决地铁轨道杂散电流影响特征众多,常规特征选择方法影响模型预测精度及模型结果可解释性差的问题,提出基于最优特征改进极端梯度提升(XGBoost)的杂散电流预测模型。利用遗传算法的灵活性和较强的搜索能力,在包含原始K个特征的集合中逐代寻找使目标函数MSE最小的前M个特征,建立最优特征选取方法下的杂散电流预测模型OFS-XGBoost(Optimal Feature Selection-XGBoost)。同时为了解决OFS-XGBoost模型预测结果较好,但是算法黑箱模型对预测结果解释性不足的问题,提出基于SHAP理论的归因分析框架,根据杂散电流特征样本的边际贡献,以易于理解的的方式显示特征集合对模型预测结果的影响,提高模型可解释性。结果表明:所提模型预测误差仅为1.684%,低于相同优化策略下的随机森林,BP神经网络等预测模型,基于SHAP值的归因分析方法可以从全局与个体角度解释输入特征对杂散电流预测结果的影响,在提高模型可解释性的基础上辅助地铁智能化健康管理。