Tony Bai ·

DeepMind 亮出王炸：别再手写 Agent Harness 了，AI 已经学会自己写了！

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

DeepMind 发布了 AutoHarness，允许 AI 自主编写规则护栏，显著提升性能。研究显示，AI 在没有护栏时失败率高达 78%。通过自我学习，AI 能在复杂游戏中快速生成准确的规则校验器，甚至超越更强大的模型。未来，工程师将更多关注设计 AI 学习环境和评估体系，而非手动编写规则。

🎯

🔎

DeepMind 的 AutoHarness 让 AI 能够自主编写规则护栏，这一进展不仅提升了 AI 的性能，也改变了工程师的角色。未来，工程师将更多地关注如何设计 AI 的学习环境，而非手动编写规则，这意味着人类在 AI 产业链中的地位将发生深刻变化。

研究表明，AI 在没有规则护栏的情况下失败率高达 78%。这一数据强调了规则校验器在 AI 运行中的关键作用。通过 AutoHarness，AI 能够快速生成准确的规则校验器，从而避免因“非法步骤”导致的失败，提升整体表现。

随着 AI 自主编写规则护栏的能力提升，工程师的工作重心将转向环境设计和评估体系的构建。工程师需要创造出能够让 AI 自我学习的环境，并设计出有效的评估机制，以确保 AI 的自我进化过程安全且高效。

❓

AutoHarness 是 DeepMind 发布的一种系统，允许 AI 自主编写规则护栏，从而显著提升其性能。

研究显示，AI 在没有护栏时的失败率高达 78%。

AutoHarness 通过让 AI 在游戏环境中自由探索并生成初始代码，利用反馈循环不断优化规则校验器。

使用 AutoHarness 的小模型在对战中胜率高达 56.3%，而传统模型在没有护栏的情况下表现较差。

未来工程师将更多关注设计 AI 学习环境和评估体系，而非手动编写规则。

AutoHarness 的成功依赖于精心设计的游戏环境和自动化的评估体系。

🏷️