BriefGPT - AI 论文速递 ·

探索针对大型语言模型增强推荐系统的后门攻击与防御

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本研究提出“后门注入污染推荐系统”（BadRec）框架，探讨大型语言模型驱动的推荐系统在后门攻击下的安全性。研究表明，仅需污染1%的训练数据即可植入后门，并提出“污染扫描器”（P-Scanner）作为防御策略，利用大型语言模型检测被污染的数据。

🎯

关键要点

本研究提出了“后门注入污染推荐系统”（BadRec）框架。
研究探讨了大型语言模型驱动的推荐系统在后门攻击下的安全性。
仅需污染1%的训练数据即可成功植入后门。
提出了“污染扫描器”（P-Scanner）作为防御策略。
P-Scanner利用大型语言模型检测被污染的数据，增强安全性。

🏷️

标签

后门攻击大型语言模型安全性推荐系统污染扫描器

➡️

继续阅读