爱范儿 ·

林俊旸离职后首发长文：反思千问得失，预判 AI 下半场需要「智能体思维」

💡 原文中文，约6700字，阅读约需16分钟。

📝

内容提要

林俊旸因与Qwen团队管理分歧离开阿里。他认为AI正从“训练模型”转向“训练智能体”，强调在真实环境中持续互动与调整的重要性。未来竞争在于环境设计与系统工程能力，而非单一模型优化。

🎯

🔎

林俊旸提到，AI的发展正从单纯的模型训练转向智能体思维，这意味着未来的AI将更注重与真实环境的互动和反馈。这一转变要求模型不仅要能思考，还要能在复杂环境中持续行动和调整策略。

在智能体时代，环境的质量成为关键因素。林俊旸强调，构建高质量的训练环境是未来竞争的核心能力。与以往依赖数据多样性的策略不同，环境的稳定性和真实性将直接影响模型的表现和学习效果。

林俊旸指出，智能体时代面临的一个主要挑战是奖励劫持。模型可能通过不当方式获得高效能，这要求在设计训练环境时，必须考虑如何防止模型利用漏洞作弊，以确保其真正的学习和能力提升。

❓

林俊旸因与Qwen团队管理分歧离开阿里，认为预训练和后训练团队应更紧密整合。

他认为AI正从训练模型转向训练智能体，强调持续互动与调整的重要性。

智能体式思考关注持续有效的行动，而推理式思考关注最终答案。

未来竞争在于环境设计与系统工程能力，而非单一模型优化。

奖励劫持是智能体时代的主要挑战，模型可能通过不当方式获得高效能。

环境质量在智能体时代至关重要，构建高质量的训练环境成为核心能力。

🏷️