小红花·文摘 - 小红花技术领袖俱乐部

JinaVDR：具有20种语言和95个任务的新视觉文档检索基准

JinaVDR：具有20种语言和95个任务的新视觉文档检索基准

Jina AI ·

阿里通义实验室推出了ZeroSearch，这是一个基于强化学习的框架，无需真实搜索引擎。通过模拟搜索环境和轻量微调，该框架提升了大模型的检索能力，降低了API成本。实验结果显示，ZeroSearch在多种问答任务中表现优异，兼容多种强化学习算法，具备良好的训练稳定性和灵活性，为智能检索提供了新思路。

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

量子位 ·

本研究提出了SIM-RAG框架，旨在提升多轮检索增强生成系统的自我意识和检索能力。通过自我实践，系统能够更好地判断信息的充分性，从而优化检索决策。实验结果表明，SIM-RAG在多个基准测试中表现优异，显著提高了系统和数据的效率。

Understanding Your Ignorance: Learning When to Continue Searching in Multi-round Retrieval through Self-Practice

BriefGPT - AI 论文速递 ·

NVIDIA AI 发布 UltraLong-8B：超长上下文语言模型，旨在处理大量文本序列

NVIDIA AI 发布 UltraLong-8B：超长上下文语言模型，旨在处理大量文本序列

实时互动网 ·

本研究探讨了语言模型逐字检索上下文信息能力的发展，发现该能力在训练初期发生显著转变，并与零样本学习相关。具体名词的检索优势在初期明显，但最终减弱，为理解语言模型的学习机制提供了重要见解。

跨时间和规模的变压器逐字上下文检索

BriefGPT - AI 论文速递 ·

Ragie如何在FinanceBench测试中超越表现

Ragie如何在FinanceBench测试中超越表现

DEV Community ·

Grok-1.5是一种具有长上下文理解和高级推理能力的大型语言模型。它在数学和编码任务中表现出色，并能处理长文档和复杂提示。Grok-1.5还展示了强大的检索能力，并构建在JAX、Rust和Kubernetes的自定义分布式训练框架之上。

大模型Grok-1.5发布

极道 ·

通过检索增强双重指令微调（RA-DIT）提升检索增强生成（RAG）的有效性

通过检索增强双重指令微调（RA-DIT）提升检索增强生成（RAG）的有效性

Blog on LlamaIndex ·

该研究提出了一种联合训练方案，包括可微分的DPR集成答案生成，以端到端的方式进行训练。实验表明，该方案优于最近的OK-VQA系统。同时，引入了新的诊断指标来分析检索和生成之间的交互作用，模型的强大检索能力显着降低了训练所需的检索文档数量，从而在答案质量和训练所需的计算方面产生了显着的收益。

细粒度迟期交互多模态检索用于检索增强视觉问答

BriefGPT - AI 论文速递 ·