腾讯安全应急响应中心博客 ·

警惕Hugging Face开源组件风险被利用于大模型供应链攻击

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

腾讯朱雀实验室发现Hugging Face开源组件datasets存在不安全特性，可能引发供应链后门投毒攻击风险。建议开发者及时排查。

🎯

关键要点

腾讯朱雀实验室发现Hugging Face开源组件datasets存在不安全特性，可能引发供应链后门投毒攻击风险。
开发者使用datasets组件加载恶意数据集时，可能导致PC/服务器被入侵，甚至大模型参数被窃取或篡改。
Hugging Face是全球最具影响力的AI开源社区，提供大量高质量的开源模型和数据集。
datasets组件允许开发者高效处理数据集，但存在加载同名Python脚本时默认运行的安全隐患。
攻击者可通过恶意数据集在Hugging Face等平台传播，导致开发者遭受供应链后门投毒攻击。
Hugging Face官方认为datasets组件的特性正常，并已在GitHub上发布免责声明。
Hugging Face确认并修复了datasets-server组件的漏洞，并评级为严重（CVSS评分9.6）。
建议开发者及时更新datasets-server组件，确保数据集来源可信，检查数据集脚本中的恶意代码。

🏷️

标签

Hugging Face datasets 供应链供应链后门安全特性开源攻击风险组件

➡️

继续阅读

Agent Presence：开源实时语音框架 Qwen-Audio-Agent 来了
Qwen-Audio-Agent 位于用户和后台 Agent 之间。用户面对的是一个实时语音前台。简单问题可以即时回答；复杂任务会交给后台 Agent。
首个鸿蒙PC开源AI统一工作台JiuwenSwarm，办公编程一站式搞定
让多智能体团队随时随地为你干活
Krafton开源语音AI基础模型“A.X K2 Raon-Speech”，发力游戏角色语音交互
Krafton宣布在全球AI平台Hugging Face开源语音AI基础模型“A.X K2 Raon-Speech”。该模型结合SK Telecom的小型...
cinv身份证校验库
✅ 18 位格式校验：长度、字符集、地址码首位 ✅ 出生日期合法性校验：闰年/平年、各月天数（纯标准库，无 chrono 依赖 ✅ MOD 11‑2 校验...
字节跳动AI业务组织调整；朱一明减持兆易创新套现44亿元；三星电子半导体业务季度营业利润增长逾250倍 | 日报
（全球TMT 2026年07月30日讯）今日要点：字节跳动AI业务组织调整；朱一明减持兆易创新套现44亿元；月 […]
互联网时代的话题是「连接」，AI时代的话题是「执行」
2013年开始，OTO成为互联网的主要逻辑，随着微信、各类App成为互联网入口的主流，人们对互联网的认知逐渐达到顶峰，最后提炼出两个字：连接。在移动互联网...