扩大语言模型参数至数十亿,使上下文学习成为可能,提升翻译、摘要和问答性能。本文回顾提示推理的发展,探讨多步推理的方法和挑战,强调推理与提示学习的关系,并研究其与顺序决策和强化学习的联系。合理使用提示可实现自我改进,但真正的自我推理仍需进一步研究。
完成下面两步后,将自动完成登录并继续当前操作。