PRewrite: 提示重写与强化学习
原文中文,约300字,阅读约需1分钟。发表于: 。我们在这篇论文中研究了自动化提示工程,提出了一种基于强化学习框架的自动工具 PRewrite,能够生成高效的新提示,优于以前提出的方法。
本文介绍了MultiPrompter框架,利用强化学习的自动化提示优化,通过协作博弈中的提示者共同生成提示,减小问题规模,帮助提示者学习到最优提示。在文本到图像任务上测试,展示了其生成高质量图像的能力。
我们在这篇论文中研究了自动化提示工程,提出了一种基于强化学习框架的自动工具 PRewrite,能够生成高效的新提示,优于以前提出的方法。
本文介绍了MultiPrompter框架,利用强化学习的自动化提示优化,通过协作博弈中的提示者共同生成提示,减小问题规模,帮助提示者学习到最优提示。在文本到图像任务上测试,展示了其生成高质量图像的能力。