小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了CtrlRAG，一种新型的对抗攻击方法，针对检索增强生成系统。该方法通过掩蔽语言模型动态优化恶意内容，实验结果表明其在情感操控和幻觉增强方面优于三种基线方法。同时，现有防御机制对CtrlRAG的有效性有限，强调了加强防御的必要性。

CtrlRAG: Black-box Adversarial Attacks Based on Masked Language Models in Retrieval-Augmented Language Generation

BriefGPT - AI 论文速递 ·

本研究提出了ERRR框架，旨在解决检索增强生成系统中的预检索信息缺口问题。通过优化查询，该框架确保仅检索生成准确响应所需的相关信息。评估结果表明，ERRR在多个问答数据集上优于现有基准，提升了RAG系统的效用和准确性。

Query Optimization for Parametric Knowledge Refinement in Retrieval-Augmented Large Language Models

BriefGPT - AI 论文速递 ·

本研究揭示了一种名为检索提示劫持攻击（HijackRAG）的新型安全漏洞，攻击者通过向知识数据库注入恶意文本，操控检索增强生成系统，导致生成错误答案。研究提出了针对不同攻击者的攻击策略，并通过实验表明HijackRAG在多种基准数据集上的成功率高，显示出其对RAG系统的广泛风险。

HijackRAG: Hijacking Attacks Against Retrieval-Augmented Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一个统一框架来评估RAG系统的可信性，并为提高其在实际应用中的可信性提供了实用见解和未来研究的挑战。

检索增强生成系统的可信性研究

BriefGPT - AI 论文速递 ·

每家大语言模型公司都在挑战搜索技术：未来的大语言模型检索系统展望 [译]

每家大语言模型公司都在挑战搜索技术：未来的大语言模型检索系统展望 [译]

宝玉的分享 ·