CTISum:网络威胁情报摘要的新基准数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

介绍了新的网络威胁报告数据集AnnoCTR,由领域专家标注,包括命名实体、时间表达式和网络安全特定概念。数据集与维基百科和MITRE ATT&CK知识库相连。实验研究表明,MITRE ATT&CK的概念描述对于识别文本中的概念是有效的训练数据增强来源。

🎯

关键要点

  • 监测威胁环境对于网络安全专业人员至关重要。
  • 自然语言处理可以帮助管理大量非结构化信息,但尚未受到足够关注。
  • 提出了AnnoCTR,一个新的网络威胁报告数据集,采用CC-BY-SA许可发布。
  • 数据集由领域专家标注,涵盖命名实体、时间表达式和网络安全特定概念。
  • 标注的实体和概念与维基百科和MITRE ATT&CK知识库相连。
  • 数据集以更细粒度的方式标注整个文档,而非单个标签或句子标注。
  • 实验研究使用最先进的神经模型对数据集标注进行建模。
  • 在少样本场景中,MITRE ATT&CK的概念描述被发现是有效的训练数据增强来源。
➡️

继续阅读