MAGDi: 多智能体交互图的结构化蒸馏提升较小语言模型的推理能力 通过多个大型语言模型之间的多智能体交互,结构化蒸馏途径(MAGDi)通过将多智能体交互表示为图形、通过图形编码器增强基础学生模型,并使用三个目标函数进行知识蒸馏,即下一个标记预测、正确和错误推理之间的对比损失以及基于图形的目标函数。对七个广泛使用的常识和数学推理基准进行的实验证明,MAGDi 提高了较小模型的推理能力,表现优于从单个教师和多个教师进行蒸馏的几种方法。此外,MAGDi... 多智能体 小语言模型