小红花·文摘

Meta的田渊栋团队开发了Dualformer模型，结合快慢思考，提升性能并降低推理成本。该模型通过训练推理轨迹和最终答案，解决复杂问题。在慢思考模式下，最优解率达97.6%，推理步骤减少45.5%；自动模式下最优率为96.6%，推理步骤减少59.9%。模型基于Searchformer，采用丢弃策略优化推理过程。