摘要

连续属性离散化方法能够提高数据挖掘和归纳学习等算法的分类预测能力。提出一种统计独立性的离散化新方法,该方法改进了基于卡方统计的区间合并函数,不仅考虑了各对合并区间中卡方自由度对离散化结果的影响,而且考虑了数据类分布的影响,很好地衡量了类-属性之间的相互独立性。实验结果表明,新方法显著地提高了Nave-bayes和SVM分类器的学习精度。

  • 出版日期2012
  • 单位丽水学院