我们训练了“批评写作”模型,以识别摘要中的缺陷。人类评估者在模型的批评下更容易发现问题。较大的模型在自我批评方面表现更佳,规模的增加对批评写作的提升超过了摘要写作。这表明AI系统在复杂任务中辅助人类监督的潜力。
完成下面两步后,将自动完成登录并继续当前操作。