UltraRAG是一个基于模型上下文协议(MCP)架构的低代码检索增强生成框架,提供可视化开发工具,支持模块化的检索、生成和评估,适用于RAG研究、企业文档问答和知识检索系统。
向量数据库是现代AI系统的基础,但在检索增强生成应用中面临挑战,如缺乏全文搜索、结构化数据支持不足、排名灵活性差、外部推理延迟及实时更新困难。这些限制影响个性化和多模态理解,传统向量搜索无法满足企业级AI应用需求。
该研究提出了一种基于图的重排序方法(GRADA),旨在应对检索增强生成框架中的对抗文档攻击。实验结果表明,该方法将攻击成功率降低至80%,且仅造成微小的准确度损失。
本研究提出ARCS框架,旨在解决超级计算中的高效代码生成问题。通过结合检索增强生成和推理链,显著提高了代码翻译和生成的质量,展示了自动化和优化代码开发的潜力。
本文探讨了自动驾驶车辆的安全需求,提出了一种基于智能体的检索增强生成方法,显著提升了信息相关性,为安全应用提供了新方案。
本研究探讨了在隐私限制下,日本医学问答中基于知识图谱的检索增强生成框架(KG-based RAG)的有效性。结果表明,KG-based RAG对小规模开源LLMs的影响有限,效果依赖于外部检索内容的质量和相关性。
RAGFlow是一个开源的检索增强生成框架,能够在回答问题前获取实时知识,避免错误。它通过检索相关信息并结合内置知识生成准确的回应,支持多种AI模型,易于设置,适合智能应用的构建。
HyDE是一种检索增强生成技术,旨在解决RAG在查询关键词不足时无法获取相关数据的问题。它通过生成假设性响应,并利用该响应与原始查询共同搜索向量数据库,从而提高信息检索的准确性,减少模型产生错误信息的风险。
本文提出了一种新方法RAG-Tuned-LLM,通过微调小型LLM,结合长上下文LLM和检索增强生成的优点。实验结果显示,该方法在多种查询类型上优于现有技术。
本研究针对长文本生成中的“失落中间”问题,提出了长输入输出基准(LongInOutBench)和合成数据集,开发了检索增强长文本生成器(RAL-Writer),显著提升了长输入和长输出任务的生成效果。
本研究提出了多模态检索增强生成基准(M^2RAG),旨在评估多模态大型语言模型的有效性,并引入了多模态检索增强指令调优(MM-RAIT)方法,显著提升了模型性能。
本研究提出了一种生菜检测框架,解决了检索增强生成系统在幻觉回答中的脆弱性,克服了传统编码器的上下文限制和大型语言模型的计算低效性,F1得分达到79.22%。
本研究提出了GGatrieval方法,旨在解决现有检索增强生成系统的响应问题。该方法通过动态更新查询和筛选高质量文档,显著提升生成文本的准确性和可靠性,优于多种基线。
微软与中国人民大学合作推出CoRAG框架,改进了传统检索增强生成模型。CoRAG通过动态查询重构,实现了迭代检索和推理,克服了信息整合不足的问题,特别在多跳问答任务中表现优异,提升了检索的智能性和动态性。
本研究提出了一种检索增强的大语言模型,解决了其在有限样本场景下处理表格数据的不足,显著提升了69个数据集的性能,展示了语言模型在表格数据学习中的潜力。
本研究比较了医疗对话生成中的微调与检索增强生成技术,评估了多种模型在语言质量、事实准确性和人类判断等方面的表现,揭示了各方法的优缺点,并探讨了领域知识整合对模型效果的提升潜力。
本研究提出了RAMQA框架,解决了传统方法与现代生成大语言模型在多模态检索增强问答中的结合问题,显著提升了MultiModalQA和WebQA的性能。
LightRAG是一种快速的检索增强生成方法,通过大语言模型提取实体和关系,存储为图结构。根据用户查询提取关键词,召回相关信息,最终整合生成答案。该方法注重高层和低层关键词的提取,以提高检索效率。
本研究提出了一种新颖的多视角偏好对齐方法(PA-RAG),有效解决了现有检索增强生成模型在信息量、鲁棒性和引用质量方面的不足,显著提升了生成器的性能。
本研究提出了一种新索引方法SiReRAG,旨在解决现有检索增强生成系统的不足。通过构建相似性树和相关性树,SiReRAG在三个多跳数据集上的F1分数平均提高了1.9%。
完成下面两步后,将自动完成登录并继续当前操作。