【Volcania】2025 数字中国创新大赛数据安全产业积分争夺赛初赛 Writeup

【Volcania】2025 数字中国创新大赛数据安全产业积分争夺赛初赛 Writeup

💡 原文中文,约20400字,阅读约需49分钟。
📝

内容提要

文章讨论了数据安全中的文件上传漏洞测试,使用Python脚本进行网页数据抓取、情感分析、数据清洗和分类。通过正则表达式检测恶意行为,并提到利用脚本提取公司和个人信息。

🎯

关键要点

  • 文章讨论了数据安全中的文件上传漏洞测试。
  • 使用Python脚本进行网页数据抓取、情感分析、数据清洗和分类。
  • 通过正则表达式检测恶意行为,提到利用脚本提取公司和个人信息。
  • 文件上传漏洞测试中,尝试上传不同类型的文件,最终通过phtml绕过了限制。
  • 数据抓取脚本使用BeautifulSoup库从网页中提取商品信息。
  • 数据保存为CSV文件,便于后续处理和分析。
  • 情感分析使用本地Ollama模型进行情感标注,生成MD5签名以校验数据完整性。
  • 数据清洗和分类使用Ollama模型进行商品分类判断。
  • 隐私保护通过正则表达式抓取关键词,检测恶意行为。
  • 社会工程部分通过脚本搜索工商信息,提取相关公司和个人信息。
  • 使用SQLite数据库查询用户打车数据,分析用户行为。
  • 通过OCR识别图片中的手机号,提取相关信息。
  • 硬盘取证和内存取证部分涉及使用工具恢复删除文件和分析日志。

延伸问答

文件上传漏洞测试是如何进行的?

文件上传漏洞测试通过尝试上传不同类型的文件,最终使用phtml文件绕过了限制。

如何使用Python进行网页数据抓取?

使用Python的httpx库和BeautifulSoup库可以抓取网页数据,提取商品信息并保存为CSV文件。

情感分析是如何实现的?

情感分析使用本地Ollama模型进行情感标注,判断评论是正面还是负面。

如何检测恶意行为?

通过正则表达式抓取关键词,可以检测用户代理中的恶意行为。

数据清洗和分类的步骤是什么?

数据清洗和分类包括读取数据、处理缺失值、使用Ollama模型进行分类判断,并保存结果。

如何提取公司和个人信息?

通过脚本搜索工商信息,可以提取相关的公司和个人信息。

➡️

继续阅读