机器之心 ·

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

谷歌DeepMind的核心作者Julian Schrittwieser宣布加入Anthropic，结束了十年的DeepMind生涯。他参与了AlphaGo、AlphaZero和MuZero等重要项目，推动了强化学习的发展。业界对此举表示关注，期待他在Anthropic的表现。

🎯

🔎

Julian Schrittwieser的跳槽引发了业界的广泛关注。他在DeepMind的成就使他成为强化学习领域的领军人物，加入Anthropic后，可能会推动该公司在AI领域的进一步创新。业界期待他能将DeepMind的成功经验带入Anthropic，尤其是在大模型的开发和应用方面。

文章提到，业内普遍认为强化学习将是未来大模型性能突破的关键。随着计算能力的提升，强化学习的可扩展性和学习机制将成为研究的重点。Julian的加入可能会加速这一进程，推动Anthropic在强化学习领域的探索与应用。

Anthropic招募Julian Schrittwieser不仅是为了增强技术实力，也可能是为了在竞争激烈的AI市场中占据更有利的位置。随着AI技术的快速发展，如何有效利用强化学习将是各大公司的竞争焦点，Julian的经验无疑将为Anthropic带来新的视角和策略。

❓

Julian Schrittwieser参与了AlphaGo、AlphaZero和MuZero等多个重要项目，推动了强化学习的发展。

AlphaGo在2016年击败李世石，成为人工智能领域的里程碑事件，标志着AI在复杂游戏中的突破。

他表示对Anthropic的Claude模型深感震撼，并期待在新团队中继续推动AI的发展。

MuZero结合了树搜索和学得模型，在多款游戏中表现超越人类，且不依赖底层动态知识。

业内普遍认为强化学习将是未来大模型性能突破的关键，能够实现可扩展的学习机制。

他还参与了AlphaCode和AlphaTensor等项目，展示了AI在编程和数学领域的应用。

🏷️