代码提示引发了文本 + 代码模型的条件推理能力

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

最近的大型语言模型 (LLMs) 的进展使得思维链 (CoT) 提醒的紧急能力增加。为了设计 LLM 提示,有一个重要的设置,称为演示选择。我们介绍了一种新方法,称为推理技能发现 (RSD),它使用无监督学习创建合理性的潜在空间表示,同时学习一个推理策略来确定给定问题所需的推理技能。RSD 在多个推理任务中的答案准确性方面优于现有方法多达 6%。

🎯

关键要点

  • 大型语言模型 (LLMs) 的进展增强了思维链 (CoT) 提醒的能力。
  • 思维链通过在问题和答案之间添加合理步骤来构造提示。
  • 演示选择是设计 LLM 提示的重要设置,涉及从示例库中选择演示。
  • 现有方法使用启发式选择,但对于 CoT 提示而言,基于合理性所需技能的选择更为重要。
  • 推理技能发现 (RSD) 是一种新方法,使用无监督学习创建合理性的潜在空间表示。
  • RSD 学习推理策略以确定问题所需的推理技能,指导演示选择。
  • RSD 方法理论基础扎实,样本需求少,不依赖 LLM 推断或手动提示设计。
  • RSD 在多个推理任务中的答案准确性优于现有方法多达 6%。
➡️

继续阅读