[论文复现] 用机器学习实现社工字典生成工具 Password Guessing using Random Forest

💡 原文中文,约3800字,阅读约需9分钟。
📝

内容提要

本文介绍了口令猜解问题的应用场景和论文RFGuess的核心思想,包括基于PII的定向猜解和基于密码复用的定向猜解方法。使用随机森林进行模型训练,并介绍了特征提取方法和工具的使用。

🎯

关键要点

  • 文章介绍了口令猜解问题的应用场景和RFGuess论文的核心思想。
  • 口令猜解分为离线猜解和在线猜解,在线猜解面临更多限制。
  • 拖网猜解是攻击者无特定目标的密码猜解方式,现有模型包括PCFG和Markov模型。
  • 基于PII的定向猜解针对特定用户,使用个人信息进行密码破解。
  • 基于密码复用的定向猜解利用已知密码进行变换猜测新密码。
  • RFGuess模型使用随机森林克服传统统计和深度学习模型的缺陷。
  • Markov模型假设密码字符与前n个字符相关,适合转化为多分类问题。
  • 随机森林由多个决策树组成,使用Gini指数作为划分标准。
  • 特征提取分为基于长度和基于类型的方法,后者更适合PII场景。
  • 工具化实现了社工字典生成工具,支持可视化训练过程和特征向量转换。
➡️

继续阅读