DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型 上海交通大学与SII联合发布的DeepResearcher是首个在真实网络环境中通过强化学习训练的AI研究模型。该模型能够自主规划研究步骤、动态调整搜索策略并进行交叉验证,展现出人类研究者的复杂行为。DeepResearcher在多个问答数据集上表现优异,显著提升了研究效率,填补了开源Deep Research领域的空白。 AI研究 DeepResearcher ai 开源 强化学习 研究效率