基于机器学习糖尿病并发视网膜病变风险预测模型的构建及验证

作者:蔡菁菁; 肖辉; 李江涛; 杨雨婷; 洪中文; 俞越; 张浩轩; 陆进*
来源:牡丹江医学院学报, 2023, 44(02): 57-64.
DOI:10.13799/j.cnki.mdjyxyxb.2023.02.005

摘要

目的 分析糖尿病并发视网膜病变(DR)的影响因素,构建DR的风险预测模型并进行验证。方法 首先,采用SPSS 22.0软件对数据进行处理并随机分组;其次,利用R软件对建模组数据采用决策树、LASSO与随机森林3种机器学习算法筛选DR影响因素,并构建DR风险预测模型,同时利用C指数(C-index)、决策曲线分析法(DCA)、受试者工作特征曲线(ROC)和校准曲线(CC) 4种方式对风险预测模型进行内部验证;最后,再次利用验证组数据对风险预测模型进行外部验证。结果 共纳入994例糖尿病(DM)患者的临床数据(建模组705例;验证组289例);建模组数据采用机器学习算法筛选出影响DR的因素有DBILI、HDL-C、HBA1C、ALT、AST、PCV、APTT、BP-HIGH、SCR、AGE、HEIGHT、NEPHROPATHY以及LEADDP,并利用其成功构建DR风险预测模型;该模型的内部评价指标C-index为0.822、ROC曲线下面积AUC=0.818、DCA净获益率为3%~95%,外部验证指标C-index为0.805、ROC曲线下面积AUC=0.818、DCA净获益率为1%~91%,且内外部的CC高度一致。结论 基于机器学习构建的DR风险预测模型具有准确性、一致性、区分性与实用性等价值,可为患者的预防、诊断与治疗提供重要依据。

全文