摘要

提出基于不完整数据的IHB-LightGBM(Improved Hyperband-Light Gradient Boosting Machine)心脏病预测模型。首先,在Hyperband算法超参数采样的基础上引入了权重值,并通过蓄水池法按特征权重对其进行排序,从而筛选出最优参数以提高算法的参数寻优能力;其次,针对心脏病数据样本小且属性缺失的问题,使用K近邻算法对不完整数据进行缺失值插补,再将处理得到的完整数据进行归一化,使数据映射至0~1范围内;最后,对LightGBM采用改进后的IHB优化算法进行全局参数寻优,建立IHB-LightGBM心脏病预测模型。使用UCI心脏病数据集进行实验,结果表明IHB算法的参数寻优效果优于贝叶斯、随机搜索等优化算法,IHB-LightGBM模型在各项评价指标也上明显高于随机森林、极端随机树等算法,可以获得更快的预测速度和更高的预测精度。