基于关联分析和时间窗的日志模板快速提取方法及系统

作者:沈玉龙; 胡晓康; 常二慧; 郝飞扬; 张立; 潘超杰; 祝幸辉; 郑佳伟; 陈俊峰; 张欢; 于子勇; 何明扬; 绳金涛; 张维尊; 贺梦帅; 彭环; 杨凌霄
来源:2019-03-22, 中国, CN201910223704.8.

摘要

本发明属于系统日志分析技术领域,公开了一种基于关联分析和时间窗的日志模板快速提取方法及系统,日志层次关系抽取:对具有关联性的系统日志提取多种子类型,所述子类型作为这一类事件的所有日志模型;构造模板树:经处理过后的有相同的字段日志作为树结构中父节点。本发明利用Rand_index方法分别对手动聚类结果和三种模板抽取方法提取数据集模板,分别比较其相似性;在对比的三种模板抽取方法中,对数据集模板提取效率最低的是在线模板抽取模型,正确率在50%左右,效率最高的是基于关联关系的模板抽取模型,正确率在90%左右,因此本发明提出的基于关联关系的模板抽取模型更为可靠。