机器之心 ·

大模型推理新范式！清华&蚂蚁：用编程思维来思考，用自然语言来表达

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

AIxiv专栏促进学术交流，研究团队提出CodePlan框架，通过代码规划提升大模型推理能力，解决自然语言推理中的结构性缺陷。实验表明，CodePlan在复杂任务中表现优异，并开源200万条数据，推动相关研究发展。

🎯

🔎

当前大模型推理能力的提升面临自然语言非结构化特性带来的挑战。逻辑断裂和焦点漂移等问题使得模型在处理复杂任务时效率低下。CodePlan通过引入代码形式的规划，提供了一种新的思维框架，帮助模型更好地捕捉和复用推理结构。

CodePlan在复杂推理任务中展现出显著的性能提升，尤其在多跳问答等高难度任务中表现突出。这种结构化思维的引入，不仅提高了模型的推理能力，也为未来在金融、医疗等领域的应用提供了新的可能性。

研究团队开源的200万条数据为CodePlan的进一步研究提供了宝贵资源。这些数据不仅有助于验证和优化推理模型，还能推动相关领域的研究进展，促进学术界和工业界的合作与创新。

❓

CodePlan框架的主要创新是引入了代码形式规划，通过编程思维来提升大模型的推理能力。

CodePlan通过结构化思维引擎，利用代码规划构建严谨的推理蓝图，从而解决逻辑断裂和焦点漂移等缺陷。

CodePlan在13个基准测试中实现了平均25.1%的性能提升，尤其在复杂任务中表现显著。

自然语言推理存在逻辑断裂的问题，主要是因为自然语言的非结构化特性导致推理过程中的系统性缺陷。

CodePlan通过引入结构化的代码规划作为中间表示，降低了任务间的表达差异，从而提高了训练效率和稳定性。

研究团队开源了200万条包含代码形式规划的推理数据，以推动相关研究的发展。

🏷️