小红花·文摘

本文揭示了小模型在强推理能力方面的“学习能力差距”，发现其在短推理链上的表现优于长推理链。提出“混合蒸馏”方法，通过结合长短推理示例提升小模型的推理性能，强调适应推理复杂性的重要性。