改进随机森林模型在人口空间化中的应用

作者:江雪梨; 熊永良; 郭红梅; 赵真*; 张莹; 孟雅湉
来源:测绘通报, 2023, (06): 155-160.
DOI:10.13474/j.cnki.11-2246.2023.0186

摘要

基于随机森林模型的人口空间化方法未考虑人口空间分布非平衡性,利用Bootstrap采样加剧样本的不均衡性,使其不具有代表性,造成模型预测精度较低。针对此问题,本文以成都市为例,通过相关性分析提取影响人口分布的特征因子,基于K-means++聚类算法对数据集进行聚类处理,然后利用Bootstrap采样法从各簇中抽取等量的数据融合作为训练子集构建改进随机森林模型,并与传统随机森林模型进行对比。运用改进后的随机森林模型对成都市2020年人口数据进行空间化,并与WorldPop数据集进行精度对比。结果表明,基于改进随机森林的人口空间化模型整体精度达80.5%,较改进前提高了约3.4%,有效提高了模型预测精度;相较于WorldPop数据集,基于改进随机森林模型的人口空间化结果在拟合度及精度方面均较优。

全文