DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型

上海交通大学与SII联合发布的DeepResearcher是首个在真实网络环境中通过强化学习训练的AI研究模型。该模型能够自主规划研究步骤、动态调整搜索策略并进行交叉验证,展现出人类研究者的复杂行为。DeepResearcher在多个问答数据集上表现优异,显著提升了研究效率,填补了开源Deep Research领域的空白。

DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型
原文中文,约7100字,阅读约需17分钟。发表于:
阅读原文