开源Agent模型榜第一名,现在是阿里通义DeepResearch
💡
原文中文,约5100字,阅读约需13分钟。
📝
内容提要
阿里通义DeepResearch模型在多个评测中超越OpenAI,成为开源Agent模型的领军者。该模型通过增量预训练和后训练,利用合成数据生成高质量训练集,提升推理和决策能力,已广泛应用于阿里内部项目。
🎯
关键要点
- 阿里通义DeepResearch模型成为开源Agent模型的领军者,超越OpenAI等竞争对手。
- 通义DeepResearch模型通过增量预训练和后训练,利用合成数据生成高质量训练集。
- 模型在多个权威评测集上取得SOTA成绩,表现优异。
- 团队设计了一套多阶段数据策略,旨在大规模生成高质量训练数据,减少对人工标注的依赖。
- 通过知识文档、爬虫数据和知识图谱等构建开放世界知识记忆,提升模型的推理能力。
- 开发了全自动的合成数据生成方案,提升问答数据的复杂性和质量。
- 模型具备ReAct模式和Heavy模式,适应不同复杂度的任务。
- 采用IterResearch范式解决认知瓶颈,提升模型在长期任务中的推理能力。
- 团队革新了Agent模型的训练流程,结合强化学习优化模型性能。
- 使用合成数据进行训练,提升模型的学习和泛化能力。
- 通义DeepResearch已应用于多个阿里巴巴内部项目,如高德出行Agent和通义法睿。
- 通义法睿提供专业的法律智能服务,满足法律用户的多种需求。
➡️