摘要

基于统计特征的机器学习算法已经广泛运用于网络流识别与分类中,但是如何找到高效、简单的统计特征组合一直是本研究领域的重点和难点。针对特征向量维数过高的问题,综合考虑类别之间以及类别内部的方差系数,提出了一种基于方差系数的新型特征选择方法。从数学角度上证明了该方法相较于信息增益和卡方检验具有更低的计算复杂度。实验结果表明,该方法可以比现有方法获得更有效的特征组合以及更高的总体正确率。

全文