量子位 ·

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

Meta的田渊栋团队开发了Dualformer模型，结合快慢思考，提升性能并降低推理成本。该模型通过训练推理轨迹和最终答案，解决复杂问题。在慢思考模式下，最优解率达97.6%，推理步骤减少45.5%；自动模式下最优率为96.6%，推理步骤减少59.9%。模型基于Searchformer，采用丢弃策略优化推理过程。

🎯

关键要点

Meta的田渊栋团队开发了Dualformer模型，结合快慢思考，提升性能并降低推理成本。
Dualformer模型通过训练推理轨迹和最终答案，解决复杂问题，如迷宫和推箱子。
在慢思考模式下，Dualformer的最优解率达到97.6%，推理步骤减少45.5%。
自动模式下最优率为96.6%，推理步骤减少59.9%。
Dualformer基于Searchformer模型，采用丢弃策略优化推理过程。
模型在路径规划任务中表现良好，能以更高效率找到最优解。
Dualformer在训练过程中依据定制的丢弃策略丢弃部分结构，学习更简洁有效的搜索和推理过程。
模型可配置快速模式、慢速模式或自动模式，根据不同任务需求自适应调整。
在迷宫任务中，Dualformer以80%的最优率完成，显著优于Solution-Only模型。
在Mistral-7B和Llama3-8B模型上，Dualformer在Aug-MATH数据集上表现提升。
研究团队由田渊栋等人组成，成员在生成模型和强化学习等领域有丰富经验。

🔎

延伸解读

快慢思考的结合与应用

Dualformer模型通过结合快思考和慢思考，能够在复杂问题上实现更高的解题效率。这种灵活的推理模式不仅提高了模型的最优解率，还显著减少了推理步骤，适应不同任务需求，展现出更接近人类思维的决策方式。

丢弃策略的创新

Dualformer在训练过程中采用定制的丢弃策略，随机丢弃部分推理轨迹。这种方法使得模型能够学习到更简洁有效的推理过程，提升了在路径规划等任务中的表现，显示出在复杂推理任务中的潜力。

模型性能的对比

在迷宫和推箱子任务中，Dualformer的表现明显优于传统的Solution-Only模型，最优解率高达80%。这种显著的性能提升表明，Dualformer在处理复杂推理任务时具有更强的能力，值得关注其在实际应用中的潜力。

❓

延伸问答

Dualformer模型的主要功能是什么？

Dualformer模型结合快慢思考，能够解决复杂问题，如迷宫和推箱子，提升推理性能并降低成本。

在慢思考模式下，Dualformer的最优解率是多少？

在慢思考模式下，Dualformer的最优解率达到97.6%。

Dualformer是基于哪个模型开发的？

Dualformer是基于Searchformer模型开发的。

Dualformer如何优化推理过程？

Dualformer通过丢弃策略优化推理过程，丢弃部分推理轨迹以学习更简洁有效的搜索和推理。

在迷宫任务中，Dualformer的表现如何？

在迷宫任务中，Dualformer以80%的最优率完成，显著优于仅基于解决方案数据训练的模型。

Dualformer的推理模式有哪些？

Dualformer可配置快速模式、慢速模式或自动模式，根据不同任务需求自适应调整。

🏷️