Char-mander 利用 mBackdoor!多语言大语言模型中的跨语言后门攻击研究
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究揭示了多语言大语言模型中的跨语言后门攻击(X-BAT)问题,表明攻击者可以通过单一语言的数据投毒,利用稀有标记作为触发器,威胁多语言系统的安全性。
🎯
关键要点
- 本研究揭示了多语言大语言模型中的跨语言后门攻击(X-BAT)问题。
- 攻击者可以通过单一语言的数据投毒,利用稀有标记作为触发器。
- 后门可以通过共享的嵌入空间自动转移到其他语言。
- 以毒性分类为案例,证明了攻击者的危害。
- 研究暴露了多语言系统在跨语言传递中的关键脆弱性。
➡️