本研究提出了一种名为“reflection-tuning”的新方法,通过反思调整指令的判断能力,优化大型语言模型(LLMs)的质量。实验证明,用反思调整后的数据训练的LLMs在各种测评中表现优于使用现有数据集训练的模型。
完成下面两步后,将自动完成登录并继续当前操作。