小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Anthropic发现仅需少量文档即可对大型语言模型(LLM)进行毒化

Anthropic的研究表明,仅需250个恶意示例即可在大型语言模型(LLM)中创建“后门”漏洞。随着模型规模的增大,攻击变得更加容易。研究指出,成功攻击的关键在于恶意文档的数量,而非其在训练数据中的比例。这一发现可能使毒化攻击更具可行性,威胁LLM的安全性。

Anthropic发现仅需少量文档即可对大型语言模型(LLM)进行毒化

InfoQ
InfoQ · 2025-11-11T14:00:00Z

本文提出了一种新的毒化攻击方式——延迟毒化攻击,针对深度学习模型的脆弱性。该方法在训练和验证阶段表现正常,但对规避攻击和自然噪声极为敏感,显著降低了模型的鲁棒性。

Delayed Poisoning: Increasing Model Vulnerability through Hessian Singularization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

联邦蒸馏(FD)是一种新型的分布式机器学习方法,通过知识蒸馏提高跨设备的知识传输效率。研究提出了FDLA攻击,显著降低了客户端模型的性能,强调在FD环境中需要加强防御机制。同时,探讨了针对联邦学习的毒化攻击及其防御策略,提出了FLCert和FLDetector等工具以提高模型的安全性。实验结果表明,现有防御措施存在缺陷,需关注数据污染攻击的隐蔽性和有效性。

联邦训练中基于峰值控制的逻辑回归中毒攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文探讨了垂直联邦学习中的数据隐私保护及毒化攻击问题,提出了端到端毒化框架P-GAN和基于深度自编码器的异常检测算法,并评估其效能。研究介绍了多种联邦学习模型,如FedVGCN和VFGNN,以提高隐私保护和模型准确性,并通过实验验证了这些方法在不同数据集上的有效性。

VFLGAN: 基于垂直联合学习的生成对抗网络用于垂直分割数据发布

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

该研究探讨了神经机器翻译系统的安全性,指出其易受对抗性攻击和训练攻击影响。提出了一种毒化攻击方法,通过插入误导性样本影响翻译行为,并强调了防御策略的必要性。研究显示,针对低资源语言的攻击成功率高达75%,呼吁加强多语言安全保护措施。

多语言机器翻译的后门攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本文综合研究和分类了联合学习中的毒化攻击,并关注了生产环境中的非定向毒化攻击及防御机制。实验证明,即使是简单低成本的防护措施,联合学习也是强健的。同时,提出了新型的数据和模型毒化攻击,并研究了在简单防御机制下的攻击效果。

计算机网络中的数据污染攻击暴露下的联邦学习漏洞

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本文研究了联合学习中的毒化攻击,分类了威胁模型和攻击形式,并关注非定向毒化攻击及防御机制。实验证明,即使是简单低成本的防护措施,联合学习也很强健。同时,提出了新型的数据和模型毒化攻击,并探究了在简单防御机制下的攻击效果。

面向联邦学习中高效且可验证的恶意攻击恢复

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

本研究探讨了分布式学习系统中的毒化攻击和防御交互,特别是在使用深度学习进行无线信号分类的下一代通信(NextG)的背景下。通过利用地理分散的客户端,全局模型的训练在无需客户端交换数据样本的情况下进行,用于保护现有用户识别,促进频谱共享。本文采用主动防御机制,对参与分布式学习系统的客户端的准入或拒绝进行明智决策。结果提供了保护 NextG 通信中分布式学习系统免受毒化攻击的新型操作模式洞察,通过量化攻击和防御在 NextG 通信背景下的性能。

防止联邦学习中的中毒攻击的 NextG 系统安全保障:一种博弈论解决方案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码