小红花·文摘 - 小红花技术领袖俱乐部

本研究提出QLASS方法，解决语言代理在缺乏中间交互注释时的次优政策问题。通过推理树和过程奖励建模，QLASS在复杂任务中显著提升推理性能，并在标注数据减少时仍保持良好表现。

QLASS：通过Q引导的逐步搜索提升语言代理推理

BriefGPT - AI 论文速递 ·

思维链？思维树？华为诺亚：现在到了思维森林时刻！

思维链？思维树？华为诺亚：现在到了思维森林时刻！

机器之心 ·

本研究提出了一种基于视频的推理树方法，解决常识视频问答中的虚假关联问题。该方法通过构建推理树和动态扩展，适应现有的视频和图像模型，实验结果表明其在不同基准和推理类型中表现显著。

Video-Based Reasoning Tree for Commonsense Video Question Answering

BriefGPT - AI 论文速递 ·

该研究提出了“思维森林”框架，以解决大语言模型在复杂推理中的局限性。通过集成多个推理树和采用稀疏激活及动态自我纠正机制，FoT显著提升了模型的推理精度和效率。

Forest-of-Thought: Scaling Test-Time Compute to Enhance LLM Reasoning Capabilities

BriefGPT - AI 论文速递 ·