[论文复现] 用机器学习实现社工字典生成工具 Password Guessing using Random Forest
💡
原文中文,约3800字,阅读约需9分钟。
📝
内容提要
本文介绍了口令猜解问题的应用场景和论文RFGuess的核心思想,包括基于PII的定向猜解和基于密码复用的定向猜解方法。使用随机森林进行模型训练,并介绍了特征提取方法和工具的使用。
🎯
关键要点
- 文章介绍了口令猜解问题的应用场景和RFGuess论文的核心思想。
- 口令猜解分为离线猜解和在线猜解,在线猜解面临更多限制。
- 拖网猜解是攻击者无特定目标的密码猜解方式,现有模型包括PCFG和Markov模型。
- 基于PII的定向猜解针对特定用户,使用个人信息进行密码破解。
- 基于密码复用的定向猜解利用已知密码进行变换猜测新密码。
- RFGuess模型使用随机森林克服传统统计和深度学习模型的缺陷。
- Markov模型假设密码字符与前n个字符相关,适合转化为多分类问题。
- 随机森林由多个决策树组成,使用Gini指数作为划分标准。
- 特征提取分为基于长度和基于类型的方法,后者更适合PII场景。
- 工具化实现了社工字典生成工具,支持可视化训练过程和特征向量转换。
➡️