量子位 ·

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

Search-o1是清华与人大合作开发的推理模型框架，通过自主检索外部知识，显著提升推理能力，解决知识不足的问题。实验表明，其在科学、数学和编码等复杂任务中表现优于人类专家，增强了模型的可信度和实用性。

🎯

🔎

Search-o1通过自主检索外部知识，显著提升了推理模型的能力。这种机制不仅解决了知识不足的问题，还能在推理过程中保持连贯性，避免因知识缺失导致的错误传递。对于需要处理复杂问题的智能系统而言，这一特性尤为重要。

实验结果显示，Search-o1在多个领域的推理能力超过了人类专家，尤其在科学和数学任务中表现突出。然而，在化学领域，模型的表现仍不及专业化的化学家。这表明，尽管模型在某些方面表现优异，但在特定领域仍需进一步优化。

在开放域问答基准测试中，Search-o1在多跳QA任务中表现尤为突出，准确率提升近30%。然而，在单跳任务上的提升不显著，提示我们在设计智能问答系统时，需要关注不同类型问题的处理能力，以确保全面的性能提升。

❓

Search-o1是清华与人大合作开发的推理模型框架，旨在通过自主检索外部知识提升推理能力。

Search-o1通过自主检索外部知识，暂停推理过程以查找缺失的信息，从而解决知识不足的问题。

在科学、数学和编码等复杂任务中，Search-o1的表现优于人类专家，特别是在多个评测中取得了第一名。

Reason-in-Documents模块用于分析文档并生成与当前推理步骤相关的精炼知识，以确保推理过程的连贯性。

Agentic RAG机制允许模型在推理过程中自主决定何时检索外部知识，从而增强推理的灵活性和准确性。

Search-o1项目已开源，用户可以在GitHub上获取相关资源。

🏷️