该文研究了较小的语言模型在挑战性问答任务中表现出的强大推理能力,并评估了两种改进方法。结果表明,使用理由排名模型和训练较小的推理模型都有效,但RATD方法更容易应用并产生最佳结果。
完成下面两步后,将自动完成登录并继续当前操作。