警惕Hugging Face开源组件风险被利用于大模型供应链攻击

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

腾讯朱雀实验室发现Hugging Face开源组件datasets存在不安全特性,可能引发供应链后门投毒攻击风险。建议开发者及时排查。

🎯

关键要点

  • 腾讯朱雀实验室发现Hugging Face开源组件datasets存在不安全特性,可能引发供应链后门投毒攻击风险。
  • 开发者使用datasets组件加载恶意数据集时,可能导致PC/服务器被入侵,甚至大模型参数被窃取或篡改。
  • Hugging Face是全球最具影响力的AI开源社区,提供大量高质量的开源模型和数据集。
  • datasets组件允许开发者高效处理数据集,但存在加载同名Python脚本时默认运行的安全隐患。
  • 攻击者可通过恶意数据集在Hugging Face等平台传播,导致开发者遭受供应链后门投毒攻击。
  • Hugging Face官方认为datasets组件的特性正常,并已在GitHub上发布免责声明。
  • Hugging Face确认并修复了datasets-server组件的漏洞,并评级为严重(CVSS评分9.6)。
  • 建议开发者及时更新datasets-server组件,确保数据集来源可信,检查数据集脚本中的恶意代码。
➡️

继续阅读