小红花·文摘

扩大语言模型参数至数十亿，使上下文学习成为可能，提升翻译、摘要和问答性能。本文回顾提示推理的发展，探讨多步推理的方法和挑战，强调推理与提示学习的关系，并研究其与顺序决策和强化学习的联系。合理使用提示可实现自我改进，但真正的自我推理仍需进一步研究。