小红花·文摘 - 小红花技术领袖俱乐部

本文研究中介标记的语义对模型表现的影响，发现模型即使在正确推理轨迹上也会生成无效轨迹，并且在使用噪声轨迹时表现良好，表明中介标记与解决方案的准确性关系不强。

Beyond Semantics: The Unreasonable Effectiveness of Groundless Intermediate Markers

BriefGPT - AI 论文速递 ·

本文提出了AlignRAG框架，旨在解决检索增强生成（RAG）模型中推理轨迹与检索证据不对齐的问题。AlignRAG通过迭代的批评驱动对齐步骤，性能优于现有方法，并能无缝集成到RAG管道中，提升检索意识生成的效果。

AlignRAG: An Adaptable Framework for Resolving Misalignments in Retrieval-Aware Reasoning of RAG

BriefGPT - AI 论文速递 ·

本研究提出了一种“反蒸馏采样”方法，通过调整模型下一个标记的概率分布，降低推理轨迹的影响，有效防止模型蒸馏，具有重要的应用价值。

Anti-Distillation Sampling

BriefGPT - AI 论文速递 ·