摘要

易发性评价精度的提升有助于山区泥石流灾害早期识别和监测预警工作。大部分机器学习模型在训练、验证集合上表现良好,但在实际应用过程中精度较差,这不利于工程选址规划和防灾减灾,如何提高机器学习模型评价精度与泛化性具有重要意义。选取深度全连接神经网络,并与梯度提升树、随机森林模型和贝叶斯网络等机器学习方法共同进行模型精确性评价和OOD泛化性验证,从而找出在训练、预测和应用中均具有较高精度的方法。以四川省雅安市为例进行泥石流灾害易发性评价,采用小流域单元进行区域网格划分,将数据集合随机7:3分为训练集和验证集,使用3sigma法则剔除异常数据并基于IterativeImputer和K-近邻法进行缺失值填充。在泥石流易发性因子的共线性、敏感性和预测能力的分析结果基础上,选定14个易发性因子构建模型评价指标体系,并构建深度全连接神经网络、梯度提升树、随机森林模型以及贝叶斯网络四种模型,进行泥石流易发性评价与对比。通过对模型进行精确性评价以及OOD泛化性验证发现:深度全连接神经网络模型的AUC、Acc、Recall、MAE值同比梯度提升树等分别超出了0.027、0.02、0.02和0.003,此外OOD泛化性验证准确度同样超出了0.056。这表明深度全连接神经网络对于泥石流易发性评价的预测效果较好,能够提高泥石流评价的精度,增加评价的适应性,可为泥石流易发性评价提供新思路。

  • 出版日期2023
  • 单位水力学与山区河流开发保护国家重点实验室; 四川大学

全文