小红花·文摘

本研究提出了计划-执行-审查（PAR RAG）框架，以解决多跳问答中的推理路径偏差和结果错误传播问题，显著提升了准确性和可靠性，实验结果优于现有方法。

BriefGPT - AI 论文速递 ·

本研究提出了一种名为GeoGen的管道，旨在提升多模态大语言模型在几何问题解决中的能力。GeoGen结合符号推理与多模态模型，能够自动生成几何图形的逐步推理路径，从而显著改善模型在几何推理任务中的表现。

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过结合成功与失败的推理路径微调大型语言模型，以增强其搜索能力。采用较小的学习率可以减缓性能下降，显著提高推理表现并减少180倍的推理时间。

BriefGPT - AI 论文速递 ·

本研究提出VEGAS模型，解决社交智能评估中视觉上下文被忽视的问题，提高推理路径的解释性和准确性，推动类人社会人工智能的发展。

BriefGPT - AI 论文速递 ·

本研究提出了一种名为FastMCTS的新采样策略，旨在解决合成多步推理数据中的低效和不平衡问题。实验结果表明，FastMCTS生成的正确推理路径比拒绝采样方法增加超过30%，并提升了模型性能3.9%。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究探讨了大型语言模型（LLMs）训练中快速与慢速思维的影响，发现慢速思维的梯度更稳定，能够有效区分推理路径，从而为提高训练效率提供新见解。

BriefGPT - AI 论文速递 ·

本研究提出了一种基于知识图谱的离线思维链评估框架OCEAN，旨在提升大型语言模型的评估能力。该框架通过优化推理路径，提高思维链的对齐度，同时保持模型在下游任务中的通用性。

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）与知识图谱（KGs）结合在问答任务中的应用，提出了多种框架和方法以提升模型性能。研究表明，LLMs能够有效处理复杂的知识图谱信息，并在多个基准测试中超越传统方法。通过优化推理路径和知识构建，展示了LLMs在知识密集型任务中的潜力，为未来研究提供了重要见解。

BriefGPT - AI 论文速递 ·

本文介绍了一种新方法II-MMR，用于视觉和语言中的多模多跳推理。该方法通过两种语言提示改进视觉问答（VQA）问题的推理路径，发现大多数问题只需“单跳”推理。II-MMR在零-shot和微调设置中表现出色，提升了模型的推理能力，并在多个基准测试中取得了优异成绩。

BriefGPT - AI 论文速递 ·

本文提出了一种新的判别推理框架，用于建模文档中实体对之间的推理路径，并利用图形和文档上下文来估计推理路径的关系概率分布，从而识别它们的关系。实验证明该方法在大规模数据集上表现优异。

BriefGPT - AI 论文速递 ·

GATHER是一种新型KB-VQA框架，通过构建图、修剪和路径级别排序，能够准确检索答案并提供解释推理过程的路径。该框架可在整个知识库上进行开放式问题回答，提供明确的推理路径。

BriefGPT - AI 论文速递 ·