小红花·文摘

在挑战性问答任务中，较小的语言模型展现出强大的推理能力。使用理由排名模型和训练较小的推理模型可以进一步改进这一设置。两种方法都有效，但RATD方法更易应用且产生最佳结果。

BriefGPT - AI 论文速递 ·

该文介绍了两种改进小型语言模型在挑战性问答任务中表现的方法，一种是使用理由排名模型对生成的合理性进行评分，另一种是通过训练较小的推理模型来利用长文本序列中的相关信息。研究发现，这两种方法都有效，但RATD方法更容易应用并在未见设置中产生最佳结果。

BriefGPT - AI 论文速递 ·