💡
原文中文,约20400字,阅读约需49分钟。
📝
内容提要
文章讨论了数据安全中的文件上传漏洞测试,使用Python脚本进行网页数据抓取、情感分析、数据清洗和分类。通过正则表达式检测恶意行为,并提到利用脚本提取公司和个人信息。
🎯
关键要点
- 文章讨论了数据安全中的文件上传漏洞测试。
- 使用Python脚本进行网页数据抓取、情感分析、数据清洗和分类。
- 通过正则表达式检测恶意行为,提到利用脚本提取公司和个人信息。
- 文件上传漏洞测试中,尝试上传不同类型的文件,最终通过phtml绕过了限制。
- 数据抓取脚本使用BeautifulSoup库从网页中提取商品信息。
- 数据保存为CSV文件,便于后续处理和分析。
- 情感分析使用本地Ollama模型进行情感标注,生成MD5签名以校验数据完整性。
- 数据清洗和分类使用Ollama模型进行商品分类判断。
- 隐私保护通过正则表达式抓取关键词,检测恶意行为。
- 社会工程部分通过脚本搜索工商信息,提取相关公司和个人信息。
- 使用SQLite数据库查询用户打车数据,分析用户行为。
- 通过OCR识别图片中的手机号,提取相关信息。
- 硬盘取证和内存取证部分涉及使用工具恢复删除文件和分析日志。
❓
延伸问答
文件上传漏洞测试是如何进行的?
文件上传漏洞测试通过尝试上传不同类型的文件,最终使用phtml文件绕过了限制。
如何使用Python进行网页数据抓取?
使用Python的httpx库和BeautifulSoup库可以抓取网页数据,提取商品信息并保存为CSV文件。
情感分析是如何实现的?
情感分析使用本地Ollama模型进行情感标注,判断评论是正面还是负面。
如何检测恶意行为?
通过正则表达式抓取关键词,可以检测用户代理中的恶意行为。
数据清洗和分类的步骤是什么?
数据清洗和分类包括读取数据、处理缺失值、使用Ollama模型进行分类判断,并保存结果。
如何提取公司和个人信息?
通过脚本搜索工商信息,可以提取相关的公司和个人信息。
➡️