小红花·文摘

Anthropic发现仅需少量文档即可对大型语言模型（LLM）进行毒化

InfoQ ·

本文提出了一种新的毒化攻击方式——延迟毒化攻击，针对深度学习模型的脆弱性。该方法在训练和验证阶段表现正常，但对规避攻击和自然噪声极为敏感，显著降低了模型的鲁棒性。

Delayed Poisoning: Increasing Model Vulnerability through Hessian Singularization

BriefGPT - AI 论文速递 ·

联邦蒸馏（FD）是一种新型的分布式机器学习方法，通过知识蒸馏提高跨设备的知识传输效率。研究提出了FDLA攻击，显著降低了客户端模型的性能，强调在FD环境中需要加强防御机制。同时，探讨了针对联邦学习的毒化攻击及其防御策略，提出了FLCert和FLDetector等工具以提高模型的安全性。实验结果表明，现有防御措施存在缺陷，需关注数据污染攻击的隐蔽性和有效性。

联邦训练中基于峰值控制的逻辑回归中毒攻击

BriefGPT - AI 论文速递 ·

本文探讨了垂直联邦学习中的数据隐私保护及毒化攻击问题，提出了端到端毒化框架P-GAN和基于深度自编码器的异常检测算法，并评估其效能。研究介绍了多种联邦学习模型，如FedVGCN和VFGNN，以提高隐私保护和模型准确性，并通过实验验证了这些方法在不同数据集上的有效性。

VFLGAN: 基于垂直联合学习的生成对抗网络用于垂直分割数据发布

BriefGPT - AI 论文速递 ·

该研究探讨了神经机器翻译系统的安全性，指出其易受对抗性攻击和训练攻击影响。提出了一种毒化攻击方法，通过插入误导性样本影响翻译行为，并强调了防御策略的必要性。研究显示，针对低资源语言的攻击成功率高达75%，呼吁加强多语言安全保护措施。

多语言机器翻译的后门攻击

BriefGPT - AI 论文速递 ·

本文综合研究和分类了联合学习中的毒化攻击，并关注了生产环境中的非定向毒化攻击及防御机制。实验证明，即使是简单低成本的防护措施，联合学习也是强健的。同时，提出了新型的数据和模型毒化攻击，并研究了在简单防御机制下的攻击效果。

计算机网络中的数据污染攻击暴露下的联邦学习漏洞

BriefGPT - AI 论文速递 ·

本文研究了联合学习中的毒化攻击，分类了威胁模型和攻击形式，并关注非定向毒化攻击及防御机制。实验证明，即使是简单低成本的防护措施，联合学习也很强健。同时，提出了新型的数据和模型毒化攻击，并探究了在简单防御机制下的攻击效果。

本研究探讨了分布式学习系统中的毒化攻击和防御交互，特别是在使用深度学习进行无线信号分类的下一代通信（NextG）的背景下。通过利用地理分散的客户端，全局模型的训练在无需客户端交换数据样本的情况下进行，用于保护现有用户识别，促进频谱共享。本文采用主动防御机制，对参与分布式学习系统的客户端的准入或拒绝进行明智决策。结果提供了保护 NextG 通信中分布式学习系统免受毒化攻击的新型操作模式洞察，通过量化攻击和防御在 NextG 通信背景下的性能。

防止联邦学习中的中毒攻击的 NextG 系统安全保障：一种博弈论解决方案

BriefGPT - AI 论文速递 ·

Anthropic发现仅需少量文档即可对大型语言模型（LLM）进行毒化

Delayed Poisoning: Increasing Model Vulnerability through Hessian Singularization

联邦训练中基于峰值控制的逻辑回归中毒攻击

VFLGAN: 基于垂直联合学习的生成对抗网络用于垂直分割数据发布

多语言机器翻译的后门攻击

计算机网络中的数据污染攻击暴露下的联邦学习漏洞

面向联邦学习中高效且可验证的恶意攻击恢复

防止联邦学习中的中毒攻击的 NextG 系统安全保障：一种博弈论解决方案