摘要

结节病和肺结核的临床鉴别诊断目前仍然是困难的。搜集了106例结节病和肺结核的对比资料,并筛选出对分类有意义的临床指标作为特征,将其进行必要的量化和缩放形成训练数据,然后分别用支持向量机(SVM:Support Vector Machine)、决策分类树(DCT:Decision Classification Tree)、朴素贝叶斯(NB:Nave Bayes)3种不同的方法进行训练,并用5倍交叉验证评估各种不同的模型的有效性。实验结果表明,这3种方法在识别结节病时对应的ROC曲线下的面积分别为0.978,0.96,0.690,得到的测试精度分别达到100%,96.15%,96.15%,训练精度分别为95.28%,90.57%,92.38%。用这3种方法得到的分类器对19例临床未能确诊的病患进行预测,DCT方法的预测结果与SVM方法的结果高度吻合(19例中仅1例预测结果不同),而NB方法预测结果稍差(19例中有3例与SVM预测结果不一致)。实验结果表明,3种方法中,SVM方法的分类能力和分类精度最高。临床实验结果表明,19例临床未能确诊的病患按照SVM算法预测的结果进行治疗均得到了康复。