组合问题的自我导航探索
原文中文,约400字,阅读约需1分钟。发表于: 。通过引入自主的探索策略,该研究首次将大型语言模型应用于各种组合问题,表明自主探索策略在组合问题的优化性能上超过现有的提示策略 27.84%。此外,在算术、常识和符号推理等其他推理任务中,自主探索策略的准确性也比现有方法高 2.46%。
SELF-DISCOVER是一个通用的框架,能够自我发现任务内在的推理结构来解决复杂的推理问题。在多个推理基准上,相较于Chain of Thought (CoT),性能提升高达32%。同时,在推理计算量较少的情况下,超过了CoT-Self-Consistency等推理密集型方法20%以上。证明了自我发现的推理结构在不同模型之间是普适的。