提高IT运维效率,深度解读京东云基于自然语言处理的运维日志异常检测AIOps落地实践...
💡
原文中文,约4900字,阅读约需12分钟。
📝
内容提要
我们提出了一种基于自然语言处理技术的运维日志异常检测模型,使用PoS和NER技术,利用NER的权重向量对模板矢量进行修改,并利用DNN实现基于模板修正向量的最终检测,评估结果表明,具有更高的准确度。实验验证了该模型对日志异常检测的改进效果,采用了两个公共数据集和一套内部数据集,与业界最先进的模型比较,结果表明,我们的模型在F1得分和召回率方面表现最好,证明了模型的实用性和准确性。
🎯
关键要点
-
提出了一种基于自然语言处理技术的运维日志异常检测模型。
-
模型使用词性(PoS)和命名实体识别(NER)技术,改进特征提取。
-
通过深度神经网络(DNN)实现基于模板修正向量的最终检测。
-
实验结果表明模型在准确度上优于业界最先进的模型。
-
日志异常检测是识别系统健康状态的重要资源,主要包括异常个体日志的识别。
-
日志异常检测的步骤包括日志解析、特征提取和异常检测。
-
传统的特征提取方法如独热编码效率低,忽略语义信息。
-
自然语言处理技术如word2vec和词袋方法被应用于文本的数字转换。
-
模型通过PoS和NER技术改进特征提取,考虑每个标记的重要性。
-
模型的异常检测过程包括模板解析、PoS分析、初始向量构造、权重计算、复合向量和最终检测。
-
使用CRF工具进行NER识别模版词的重要性,并赋予权重。
-
模型在HDFS和BGL等公共数据集上进行评估,表现优于DeepLog和LogClass模型。
-
在HDFS数据集上,模型获得最高F1得分0.981,召回率表现最佳。
-
模型的评估结果显示其在所有数据集中具有最好的F1得分和最高的召回率。
➡️