摘要

传统的水-气界面温室气体通量的监测方法具有诸多局限,对其影响因素的分析也大多基于数学统计层面。对此,本研究提供了一种较为新颖的研究和分析方法——基于机器学习的数据预测和分析。本研究采用2种经典机器学习算法——随机森林(RF)和支持向量机(SVM)和2种深度学习算法——卷积神经网络(CNN)和长短时记忆神经网络(LSTM),通过环境因素预测水库水-气界面CO2和CH4扩散通量。此外,采用RF中的特征重要性评估和经典算法决策树(DT),对环境因素和水库温室气体扩散通量的关系进行了全新角度的数据挖掘和分析。结果表明:深度学习算法的预测效果均较好,经典机器学习算法中RF预测效果显著优于SVM。LSTM和RF分别产生了最优的CO2扩散通量和CH4扩散通量的预测精度,均方根误差(RMSE)分别为0.424 mmol/(m2·h)和0.140μmol/(m2·h),预测值与实测值的R2分别为0.960和0.758。RF的特征重要性评估表明沉积物因子和营养因子均为影响CO2和CH4扩散通量的关键因子,气候因子和水环境因子相较次之。采用决策树描绘决定CO2扩散通量源和汇的环境因子的极限阈值,决策树对所有样本的分类准确性高达100%,且其结果还表明低浓度的溶解无机碳和碱性条件有利于水体成为CO2汇。因此,使用机器学习算法预测和分析水库水-气界面温室气体通量的潜力巨大。