本文介绍了CritiqueLLM,一种新型批判生成模型,可用于评估生成文本质量。实验结果显示,CritiqueLLM在8个任务中有3个胜过GPT-4,具有可扩展性特性。生成的批评可作为反馈,提高语言模型的生成质量。
完成下面两步后,将自动完成登录并继续当前操作。