HijackRAG: Hijacking Attacks Against Retrieval-Augmented Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究揭示了一种名为检索提示劫持攻击(HijackRAG)的新型安全漏洞,攻击者通过向知识数据库注入恶意文本,操控检索增强生成系统,导致生成错误答案。研究提出了针对不同攻击者的攻击策略,并通过实验表明HijackRAG在多种基准数据集上的成功率高,显示出其对RAG系统的广泛风险。
🎯
关键要点
- 研究揭示了一种名为检索提示劫持攻击(HijackRAG)的新型安全漏洞。
- 攻击者可以通过向知识数据库注入恶意文本来操控检索增强生成(RAG)系统。
- HijackRAG攻击会导致生成错误答案而非正确答案。
- 研究提出了针对不同攻击者知识水平的黑箱和白箱攻击策略。
- 实验表明,HijackRAG在多种基准数据集上的成功率较高。
- HijackRAG攻击具有跨不同检索模型的转移性,显示出其对RAG系统的广泛风险。
➡️