摘要

背景:生物信息学领域的快速发展为骨关节炎的诊断提供了新的方法。人工神经网络具有强大的数据计算能力和分类能力,研究表明其在诊断疾病方面表现出了较好的性能。目的:旨在使用人工神经网络建立一种新的骨关节炎诊断预测模型,并通过外部数据集验证其在骨关节炎中的诊断价值。方法:通过GEO数据库搜索下载符合要求的骨关节炎相关数据集,将其分为Train组与Test组。对Train组的基因表达矩阵进行差异分析,筛选差异表达基因。对差异基因进行GO、KEGG富集分析;通过Lasso回归模型、支持向量机模型、随机森林树模型从差异基因中进一步鉴定骨关节炎关键基因。随后使用R软件“neuralnet”包构建基于人工神经网络的骨关节炎诊断模型,5折交叉验证评估模型表现;使用Test组中2个独立的数据集来验证其诊断效果。结果与结论:通过差异分析共得到90个与骨关节炎相关的差异基因,其中33个下调,57个上调。GO富集分析显示其生物过程主要参与白细胞介导的免疫、骨髓白细胞迁移、趋化因子产生等过程;KEGG富集显示差异基因主要富集在类风湿关节炎、白细胞介素17信号通路、破骨细胞分化等通路。通过3种机器学习方法筛选并取交集后共得到5个诊断骨关节炎的关键基因,分别为HMGB2、GADD45A、SLC19A2、TPPP3、FOLR2。Train组中5个关键基因建立的人工神经网络模型显示其准确率为96.36%,曲线下面积(AUC)为0.997,对神经网络模型的5折交叉验证表明其平均AUC> 0.9,具有一定的稳健性;Test组中2个独立的数据集结果显示其AUC分别为0.814和0.788。提示:建立的人工神经网络骨关节炎诊断模型具有一定的诊断价值。