本文介绍了MultiPrompter框架,利用强化学习的自动化提示优化,通过协作博弈中的提示者共同生成提示,减小问题规模,帮助提示者学习到最优提示。在文本到图像任务上测试,展示了其生成高质量图像的能力。
MultiPrompter是一种基于强化学习的自动化提示优化方法,通过协作博弈中提示者轮流共同组成提示的过程,有效地减小了问题的规模,并帮助提示者学习到最优提示。作者在文本到图像任务上测试了该方法,并展示了其生成比基准模型更高质量图像的能力。
完成下面两步后,将自动完成登录并继续当前操作。