Transformer与CNN在恶意URL路径识别中的实践探索

💡 原文中文,约15100字,阅读约需36分钟。
📝

内容提要

本文探讨了Transformer和CNN模型在恶意URL识别中的应用。由于识别恶意流量效率低下,神经网络模型成为解决方案。通过字符级嵌入将URL转化为向量序列,CNN和Transformer分别利用卷积和自注意力机制提取特征,实现正常与恶意流量的分类。

🎯

关键要点

  • 本文探讨了Transformer和CNN模型在恶意URL识别中的应用。
  • 恶意流量识别效率低下,神经网络模型成为解决方案。
  • 通过字符级嵌入将URL转化为向量序列,便于模型处理。
  • CNN利用卷积机制提取特征,识别恶意流量模式。
  • Transformer通过自注意力机制关注序列中其他token的信息。
  • 数据集由正常流量和攻击流量组成,需进行预处理。
  • 模型结构包括1D CNN和Transformer,分别用于特征提取和分类。
  • 训练过程中使用了数据增强和规则检测来提高模型准确性。
  • 模型训练后进行验证,评估其在恶意URL识别中的表现。
  • 提出了改进方案,包括数据预处理和使用大模型辅助判别。
➡️

继续阅读