BriefGPT - AI 论文速递 ·

代码提示引发了文本 + 代码模型的条件推理能力

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

最近的大型语言模型 (LLMs) 的进展使得思维链 (CoT) 提醒的紧急能力增加。为了设计 LLM 提示，有一个重要的设置，称为演示选择。我们介绍了一种新方法，称为推理技能发现 (RSD)，它使用无监督学习创建合理性的潜在空间表示，同时学习一个推理策略来确定给定问题所需的推理技能。RSD 在多个推理任务中的答案准确性方面优于现有方法多达 6%。

🎯

关键要点

大型语言模型 (LLMs) 的进展增强了思维链 (CoT) 提醒的能力。
思维链通过在问题和答案之间添加合理步骤来构造提示。
演示选择是设计 LLM 提示的重要设置，涉及从示例库中选择演示。
现有方法使用启发式选择，但对于 CoT 提示而言，基于合理性所需技能的选择更为重要。
推理技能发现 (RSD) 是一种新方法，使用无监督学习创建合理性的潜在空间表示。
RSD 学习推理策略以确定问题所需的推理技能，指导演示选择。
RSD 方法理论基础扎实，样本需求少，不依赖 LLM 推断或手动提示设计。
RSD 在多个推理任务中的答案准确性优于现有方法多达 6%。

🏷️

代码提示引发了文本 + 代码模型的条件推理能力

内容提要

关键要点

标签

继续阅读