小红花·文摘

本研究揭示了多语言大语言模型中的跨语言后门攻击（X-BAT）问题，表明攻击者可以通过单一语言的数据投毒，利用稀有标记作为触发器，威胁多语言系统的安全性。

BriefGPT - AI 论文速递 ·

本研究针对联邦学习中的客户端数据投毒和模型投毒攻击，提出了统一的基准和分析框架，分类了攻击类型及防御策略，并进行了跨算法和数据异质性的比较评估，推动了该领域的发展。

BriefGPT - AI 论文速递 ·

本文探讨了聚类算法的攻击风险及评估方法，重点分析了恶意软件行为聚类的注入攻击。研究提出了MetaPoison等对策，以提高聚类算法的安全性和鲁棒性，并讨论了数据投毒攻击及其防御措施，强调了数据污染的危害及防御策略的必要性。

BriefGPT - AI 论文速递 ·

本文探讨了联邦学习中的模型中毒攻击及其防御机制，提出了FedDefender和FreqFed等新方法，通过本地元更新和全局知识蒸馏提高鲁棒性，抵御恶意攻击。同时，研究了数据投毒攻击的漏洞，提出LearnDefend模型，有效检测和防范攻击，增强系统安全性。

BriefGPT - AI 论文速递 ·

OpenAI于2022年11月30日开放测试ChatGPT，它面临着AI自身数据和模型方面的安全隐患，包括数据投毒、模型劫持攻击、Prompt Injection攻击、海绵样本攻击等，呼吁ChatGPT自身的安全隐患不容忽视。

绿盟科技技术博客 ·