小红花·文摘

本文介绍了CritiqueLLM，一种新型批判生成模型，可用于评估生成文本质量。实验结果显示，CritiqueLLM在8个任务中有3个胜过GPT-4，具有可扩展性特性。生成的批评可作为反馈，提高语言模型的生成质量。