小红花·文摘

本研究提出了一种名为“reflection-tuning”的新方法，通过反思调整指令的判断能力，优化大型语言模型（LLMs）的质量。实验证明，用反思调整后的数据训练的LLMs在各种测评中表现优于使用现有数据集训练的模型。