摘要

传统的端口号与深度包检测分类技术已不能满足网络中各类应用的分类要求,无法进行准确分类。为此,提出一种基于半监督学习的马尔科夫模型网络流量分类算法。利用流之间的相关性构建马尔科夫模型,采用密度计算的方法估计聚类的中心点,通过KL距离计算中心点与样本之间的相似度,将样本划分到不同的应用类型中。使用马尔科夫模型提取特征参数,用以识别流量应用类型,并提高准确度,解决传统的基于半监督学习的流量分类方法依赖不稳定聚类算法的问题。实验结果表明,使用该方法机器学习得到的网络流量分类器可以取得理想的分类效果。

全文