程序师 ·

少量毒样本即可污染任意规模的大型语言模型

💡 原文中文，约34200字，阅读约需82分钟。

📝

内容提要

研究表明，向大型语言模型注入少量恶意文档可以植入后门，影响模型生成的信息可靠性。这种数据污染可能导致用户信任下降，AI公司面临严重后果。

🎯

❓

向大型语言模型注入少量恶意文档可以植入后门，影响模型生成的信息可靠性。

只需向预训练数据注入250份恶意文档，攻击者就能成功对6亿至130亿参数的LLM植入后门。

这种数据污染可能导致用户信任下降，尤其是缺乏数字素养的用户。

LLM的训练数据源之一是开源仓库，恶意行为者可以轻易传播这种污染。

LLM中毒的实际应用场景包括攻击后端通过API调用这些模型的系统，可能影响数据分类和模糊逻辑任务。

用户反馈机制不足，导致模型生成的错误难以被及时发现和修复。

🏷️

凯文·奥利里同意缩减犹他州的大型数据中心规模
凯文·奥利里同意将其在犹他州建设的4万英亩数据中心规模减半，削减至19430英亩，并保留大部分土地作为开放空间。尽管面积缩小至约2万英亩，项目仍将超过曼哈...
论独立游戏的起步立项方法论
在当下这个互联网时代做独立游戏，是幸运的，得益于各路大佬的经验分享，诸如引擎选择、外包渠道、素材获取，编程整合 […]
技嘉在COMPUTEX 2026展示多款生活美学主机
(全球TMT2026年6月5日讯)技嘉科技于COMPUTEX 2026展示多款生活美学主机，包含展现简约风格的 […]
技嘉于COMPUTEX 2026以“ENTER INFINITY”为主题开展
(全球TMT2026年6月5日讯)技嘉科技正式于COMPUTEX 2026以“ENTER INFINITY”为 […]
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
史上最强游戏掌机来了！性能堪比 PS5，但……
坏消息：1 万块#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。