DeepMind 发布了 AutoHarness,允许 AI 自主编写规则护栏,显著提升性能。研究显示,AI 在没有护栏时失败率高达 78%。通过自我学习,AI 能在复杂游戏中快速生成准确的规则校验器,甚至超越更强大的模型。未来,工程师将更多关注设计 AI 学习环境和评估体系,而非手动编写规则。
完成下面两步后,将自动完成登录并继续当前操作。