探索针对大型语言模型增强推荐系统的后门攻击与防御
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出“后门注入污染推荐系统”(BadRec)框架,探讨大型语言模型驱动的推荐系统在后门攻击下的安全性。研究表明,仅需污染1%的训练数据即可植入后门,并提出“污染扫描器”(P-Scanner)作为防御策略,利用大型语言模型检测被污染的数据。
🎯
关键要点
- 本研究提出了“后门注入污染推荐系统”(BadRec)框架。
- 研究探讨了大型语言模型驱动的推荐系统在后门攻击下的安全性。
- 仅需污染1%的训练数据即可成功植入后门。
- 提出了“污染扫描器”(P-Scanner)作为防御策略。
- P-Scanner利用大型语言模型检测被污染的数据,增强安全性。
➡️