摘要

在大脑胶质瘤诊断数据集中,病例样本数通常比正常样本数要少,由此引发了数据不均衡问题下病例诊断的问题。此外,在大脑胶质瘤数据集中有一些冗余甚至是不相关的特征,这些特征降低了学习器的泛化能力。为解决这类问题,提出一种基于互信息特征选择的E asyEnsem b le算法来解决大脑胶质瘤诊断中的数据不均衡问题。在UC I数据集和大脑胶质瘤数据集上的实验结果表明新算法提高了分类器在不均衡数据集上的分类性能和预报能力。