摘要

[目的]建立一个机器学习预测模型,可用于预测新诊断喉癌患者的淋巴结转移。[方法]回顾性分析2018—2020年美国国立癌症研究所监测、流行病学和最终结果数据库(SEER)中新诊断喉癌患者的人口统计学变量和临床病理变量,开发基于机器学习的淋巴结转移预测模型。利用ROC曲线下面积大小(AUC)、准确率、召回率、精确率和特异度来评估和比较各机器学习模型的预测性能。[结果]共纳入4 462例喉癌患者,其中1 444例发生淋巴结转移。年龄、原发部位、临床分级和T分期可以作为独立的风险因素。原发部位、T分期、年龄在淋巴结转移的重要性评估中排前3位。在所有的机器学习模型中,除KNN模型预测效果较差外,Random Forest、Boost、GLM、Neuralnet、Decision Tree这5种模型对于新诊断喉癌患者是否发生淋巴结转移都有较好的预测效果且分类能力近乎相同(在测试集中AUC值均在0.83左右),而准确率、召回率、特异度和精确率则在较小范围内各有优劣。[结论]本研究构建的机器学习模型可以较好地预测新诊断喉癌患者是否发生淋巴结转移,为临床医生的临床决策提供帮助。机器学习技术有可能帮助喉癌患者淋巴结转移预测模型的开发。