本研究揭示了多语言大语言模型中的跨语言后门攻击(X-BAT)问题,表明攻击者可以通过单一语言的数据投毒,利用稀有标记作为触发器,威胁多语言系统的安全性。
本研究针对联邦学习中的客户端数据投毒和模型投毒攻击,提出了统一的基准和分析框架,分类了攻击类型及防御策略,并进行了跨算法和数据异质性的比较评估,推动了该领域的发展。
OpenAI于2022年11月30日开放测试ChatGPT,它面临着AI自身数据和模型方面的安全隐患,包括数据投毒、模型劫持攻击、Prompt Injection攻击、海绵样本攻击等,呼吁ChatGPT自身的安全隐患不容忽视。
完成下面两步后,将自动完成登录并继续当前操作。