摘要

针对随机森林(RF)在高维空间特征选择过程中计算繁琐和内存开销大、分类准确率低等问题,提出了基于二分搜索(BS)结合修剪随机森林(RFP)的特征选择算法(BSRFP);该算法首先根据纯度基尼指数获取特征重要性评分,删除重要性评分较低的特征,然后利用BS算法结合基分类器差异性的修剪技术得到最优特征子集和最高分类准确率的分类器;为了验证算法的有效性,构建卷烟质量识别模型并与其他方法进行比较。结果表明:BS算法简化了特征搜索过程,RFP算法缩减了RF算法的规模;RFP算法的分类准确率可达96.47%;BSRFP算法选择出的特征相关性更强,对卷烟质量识别具有更高的准确度。

  • 出版日期2017
  • 单位云南中烟工业有限责任公司技术中心; 中国海洋大学