利用计划评估进行最远推理:检索增强的大型语言模型稳定推理路径
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种针对多跳问题回答的新方法,称为 FuRePA,其中包括改进框架(Furthest Reasoning)和附加模块(Plan Assessor)。通过屏蔽之前的推理路径和生成的查询,鼓励 LLM 在每次迭代中从头开始生成思路,从而打破先前误导思想和查询的束缚。通过对三个公认的多跳问题回答数据集的评估,我们的方法在大多数指标上优于现有技术(回答准确率提高了 10%-12%)。
本文提出了一种名为FuRePA的新方法,用于解决多跳问题回答。该方法在三个公认的多跳问题回答数据集的评估中,回答准确率提高了10%-12%。