最近的大型语言模型 (LLMs) 的进展使得思维链 (CoT) 提醒的紧急能力增加。为了设计 LLM 提示,有一个重要的设置,称为演示选择。我们介绍了一种新方法,称为推理技能发现 (RSD),它使用无监督学习创建合理性的潜在空间表示,同时学习一个推理策略来确定给定问题所需的推理技能。RSD 在多个推理任务中的答案准确性方面优于现有方法多达 6%。
完成下面两步后,将自动完成登录并继续当前操作。