已知和新兴恶意软件家族的在线聚类
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
调查发现,基于机器学习的恶意软件检测和分类受到静态特征的影响较大,不同包装方式对分类准确性无关,大量待分类家族使分类更困难,每个家族的样本数越多,准确性越高。训练模型在每个家族的样本均匀分布的情况下对未见数据更好地推广。
🎯
关键要点
- 调查了影响基于机器学习的恶意软件检测和分类的关键因素。
- 静态特征优于动态特征,结合二者只能稍微改善静态特征的性能。
- 不同包装方式与分类准确性之间没有关联。
- 动态提取特征中缺少行为极大地惩罚了它们的性能。
- 较大数量的待分类家族使分类变得更困难。
- 每个家族的样本数越多,分类准确性越高。
- 在每个家族的样本均匀分布的情况下训练的模型对未见数据更好地推广。
➡️