基于数据不同缺失率的插补方法比较

作者:席梦瑶; 赖俊峰*; 张改梅
来源:内蒙古工业大学学报(自然科学版), 2023, 42(05): 391-395.
DOI:10.13785/j.cnki.nmggydxxbzrkxb.2023.05.002

摘要

缺失数据是一项不可忽略的问题,缺失比例较高时会严重影响试验结果,所以处理缺失数据尤为重要。针对该问题,引用R内置数据集,采用成列删除、单一插补和多重插补方法,在数据缺失10%、25%、50%和75%的条件下,用这三种方法作插补,对插补后的数据做统计检验,结果表明,当缺失比例较小时,三种方法的结果相差不大,可以选择较简便的成列删除。随着缺失比例增加,不同方法的结果相差逐渐增大,相对稳定的方法为多重插补,结果与真实数据相差较小。

全文