小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Anthropic发现仅需少量文档即可对大型语言模型(LLM)进行毒化

Anthropic的研究表明,仅需250个恶意示例即可在大型语言模型(LLM)中创建“后门”漏洞。随着模型规模的增大,攻击变得更加容易。研究指出,成功攻击的关键在于恶意文档的数量,而非其在训练数据中的比例。这一发现可能使毒化攻击更具可行性,威胁LLM的安全性。

Anthropic发现仅需少量文档即可对大型语言模型(LLM)进行毒化

InfoQ
InfoQ · 2025-11-11T14:00:00Z

本文提出了一种新的毒化攻击方式——延迟毒化攻击,针对深度学习模型的脆弱性。该方法在训练和验证阶段表现正常,但对规避攻击和自然噪声极为敏感,显著降低了模型的鲁棒性。

Delayed Poisoning: Increasing Model Vulnerability through Hessian Singularization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本文综合研究和分类了联合学习中的毒化攻击,重点关注了生产环境中的非定向毒化攻击及防御机制。实验证明,即使是简单低成本的防护措施,联合学习也是强健的。同时,提出了新型的数据和模型毒化攻击,并探究了在简单防御机制下的攻击效果。

针对自主驾驶联邦学习的毒化攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-02T00:00:00Z

本研究探讨了分布式学习系统中的毒化攻击和防御交互,特别是在使用深度学习进行无线信号分类的下一代通信(NextG)的背景下。通过利用地理分散的客户端,全局模型的训练在无需客户端交换数据样本的情况下进行,用于保护现有用户识别,促进频谱共享。为了解决恶意客户端的存在,本文采用主动防御机制,对参与分布式学习系统的客户端进行准入或拒绝决策。结果提供了保护NextG通信中分布式学习系统免受毒化攻击的新型操作模式洞察。

基于联邦学习的无线流量预测中的攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z

本文综合研究和分类了联合学习中的毒化攻击,并关注了生产环境中的非定向毒化攻击及防御机制。实验证明,即使是简单低成本的防护措施,联合学习也是强健的。同时,提出了新型的数据和模型毒化攻击,并研究了在简单防御机制下的攻击效果。

计算机网络中的数据污染攻击暴露下的联邦学习漏洞

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本文研究了联合学习中的毒化攻击,分类了威胁模型和攻击形式,并关注非定向毒化攻击及防御机制。实验证明,即使是简单低成本的防护措施,联合学习也很强健。同时,提出了新型的数据和模型毒化攻击,并探究了在简单防御机制下的攻击效果。

面向联邦学习中高效且可验证的恶意攻击恢复

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

本研究探讨了分布式学习系统中的毒化攻击和防御交互,特别是在使用深度学习进行无线信号分类的下一代通信(NextG)的背景下。通过利用地理分散的客户端,全局模型的训练在无需客户端交换数据样本的情况下进行,用于保护现有用户识别,促进频谱共享。本文采用主动防御机制,对参与分布式学习系统的客户端的准入或拒绝进行明智决策。结果提供了保护 NextG 通信中分布式学习系统免受毒化攻击的新型操作模式洞察,通过量化攻击和防御在 NextG 通信背景下的性能。

防止联邦学习中的中毒攻击的 NextG 系统安全保障:一种博弈论解决方案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码