摘要

为了解决词向量模型选择不当而导致的CNN日志异常检测性能下降问题,文中设计了基于CNN的日志异常检测模型,在预处理阶段采用不同词向量模型构建词向量字典,利用词向量字典将测试日志向量化并输入到CNN中,比较其各项性能指标以选择最优词向量模型提高CNN日志异常检测的性能表现。实验结果表明:当训练日志量较少时,不同词向量模型对应CNN的性能指标差异明显,其中GloVe模型使得CNN性能表现最优,分别在两种实验数据集上取得88.92和97.19最高F1值。随着训练日志量的逐渐增加,不同词向量模型对应CNN的性能指标差异逐渐减小,GloVe模型使得CNN性能依然有最优表现。

全文