Ying’s Blog ·

LLM Paper&Practice：从 CoT 到 ReAct

💡 原文中文，约11800字，阅读约需28分钟。

📝

内容提要

本文总结了思维链（CoT）和 ReAct 两种大模型应用范式。CoT 通过逐步推理提升模型在复杂问题上的准确性，而 ReAct 则结合思考与行动，使模型能够与外部世界交互，克服知识过时等问题。这两种方法的演进展示了从封闭知识库到智能代理的转变，强调了推理能力与可控性之间的平衡。

🎯

🔎

思维链（CoT）通过逐步推理的方式，显著提升了大模型在复杂问题上的准确性。这种方法强调过程而非结果，帮助模型避免因快速推理而导致的错误。因此，在处理逻辑推理和数学问题时，使用CoT可以有效提高模型的表现。

ReAct范式通过引入思考、行动和观察的循环，使模型能够与外部世界交互，克服知识过时的问题。然而，ReAct的实现依赖于精心设计的提示和外部控制循环，当前技术仍存在脆弱性，模型和提示的组合对结果影响显著，需不断优化以确保稳定性。

在实践中，选择合适的模型对ReAct的成功至关重要。不同模型在执行相同任务时可能表现出显著差异，甚至可能导致控制链的崩溃。因此，开发者在选择模型时需谨慎，确保其能够遵循设计的提示和流程。

❓

思维链（CoT）是一种提示技术，通过逐步思考的范例引导模型输出详细的推理过程，从而提升复杂问题的准确性。

ReAct范式是CoT的演进，除了推理能力外，还引入了行动的概念，使模型能够与外部世界交互，克服知识过时的问题。

ReAct的核心机制是思考、行动和观察的循环，允许模型主动获取实时信息并进行决策。

CoT可以帮助模型在处理复杂问题时避免错误结论，提升推理任务的准确性，尤其是在数学和逻辑推理方面。

ReAct通过引入行动，使模型能够调用外部工具获取实时信息，从而克服知识过时的缺点。

当前的Agent技术对模型和提示的组合高度敏感，模型的选择和提示的微小变化可能导致整个控制链的崩溃。

🏷️