弱 LLM 评判强 LLM 的可扩展监督
📝
内容提要
可扩展的监督协议旨在使人类能够准确监督超级智能。本文研究辩论、咨询和基准测试三种情景下两个 AI 之间的竞争,以及一个单个 AI 试图说服一个提问的法官的情况。
🏷️
标签
➡️
可扩展的监督协议旨在使人类能够准确监督超级智能。本文研究辩论、咨询和基准测试三种情景下两个 AI 之间的竞争,以及一个单个 AI 试图说服一个提问的法官的情况。