我们提出了一种方法,通过大型语言模型的示范,将推理能力传递给较小模型,并通过优化策略提升其自我改进能力。结果表明,该方法在常识和数学推理任务中表现出色,使较小模型的推理能力逐渐接近大型模型。
完成下面两步后,将自动完成登录并继续当前操作。