本研究提出了计划-执行-审查(PAR RAG)框架,以解决多跳问答中的推理路径偏差和结果错误传播问题,显著提升了准确性和可靠性,实验结果优于现有方法。
本研究提出了一种名为GeoGen的管道,旨在提升多模态大语言模型在几何问题解决中的能力。GeoGen结合符号推理与多模态模型,能够自动生成几何图形的逐步推理路径,从而显著改善模型在几何推理任务中的表现。
本研究提出了一种新方法,通过结合成功与失败的推理路径微调大型语言模型,以增强其搜索能力。采用较小的学习率可以减缓性能下降,显著提高推理表现并减少180倍的推理时间。
本研究提出VEGAS模型,解决社交智能评估中视觉上下文被忽视的问题,提高推理路径的解释性和准确性,推动类人社会人工智能的发展。
本研究提出了一种名为FastMCTS的新采样策略,旨在解决合成多步推理数据中的低效和不平衡问题。实验结果表明,FastMCTS生成的正确推理路径比拒绝采样方法增加超过30%,并提升了模型性能3.9%。
ReasoningAgent是一种AG2代理,利用树状思维和束搜索并行探索多个推理路径,通过评分代理评估并选择最佳路径,从而提升大语言模型在复杂推理中的能力。
本研究探讨了大型语言模型(LLMs)训练中快速与慢速思维的影响,发现慢速思维的梯度更稳定,能够有效区分推理路径,从而为提高训练效率提供新见解。
本研究提出了一种基于知识图谱的离线思维链评估框架OCEAN,旨在提升大型语言模型的评估能力。该框架通过优化推理路径,提高思维链的对齐度,同时保持模型在下游任务中的通用性。
本文提出了一种新的判别推理框架,用于建模文档中实体对之间的推理路径,并利用图形和文档上下文来估计推理路径的关系概率分布,从而识别它们的关系。实验证明该方法在大规模数据集上表现优异。
GATHER是一种新型KB-VQA框架,通过构建图、修剪和路径级别排序,能够准确检索答案并提供解释推理过程的路径。该框架可在整个知识库上进行开放式问题回答,提供明确的推理路径。
完成下面两步后,将自动完成登录并继续当前操作。