弱 LLM 评判强 LLM 的可扩展监督

📝

内容提要

可扩展的监督协议旨在使人类能够准确监督超级智能。本文研究辩论、咨询和基准测试三种情景下两个 AI 之间的竞争,以及一个单个 AI 试图说服一个提问的法官的情况。

🏷️

标签

➡️

继续阅读