量子位 ·

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

阿里推出的WebDancer信息检索Agent具备自主上网搜索和复杂推理能力，超越GPT-4o。该模型经过四阶段训练，能够执行多步骤任务，并在GAIA和WebWalkerQA基准测试中表现优异，开源框架促进其他智能代理的发展。

🎯

🔎

WebDancer采用四阶段训练方法，包括浏览数据构建、轨迹采样、有监督微调和强化学习。这种系统化的训练流程使其能够在复杂的网页环境中进行自主信息检索，显著提升了模型的推理能力和决策能力。

与传统的固定流程模型相比，WebDancer具备多步推理和工具使用能力，能够更灵活地应对复杂任务。这种自主信息搜索能力使其在GAIA和WebWalkerQA基准测试中表现优异，显示出主动信息获取的重要性。

WebDancer的开源框架不仅促进了自身的发展，也为其他智能代理提供了学习和借鉴的机会。这种开放性有助于推动整个领域的进步，鼓励更多研究者参与到自主信息检索技术的探索中。

❓

WebDancer具备自主上网搜索和复杂推理能力，能够执行多步骤任务。

WebDancer经过四个阶段的训练，包括浏览数据构建、轨迹采样、有监督微调和强化学习。

WebDancer在GAIA和WebWalkerQA上分别达到46.6%和43.2%的平均准确率，超越了基线模型。

强化学习阶段优化代理在真实网络环境中的决策能力和泛化能力。

开源框架促进其他智能代理的发展，使其能够自主获取搜索和推理技能。

WebDancer通过浏览数据构建阶段创建复杂QA对，模拟人类行为进行信息收集。

🏷️