小红花·文摘

Parrot是一种新的强化学习框架，用于文本到图像生成。它通过批处理Pareto最优选择来自动识别不同奖励之间的最佳权衡。Parrot还采用联合优化方法，生成质量感知的文本提示，提高最终图像的质量。实验和用户研究表明，Parrot在多个质量指标上优于基线方法。

鹦鹉：多目标 Pareto 最优强化学习框架的文本到图像生成

BriefGPT - AI 论文速递 ·

本文介绍了一种强化学习框架，用于在未知的随机环境中合成控制策略。该框架将环境建模为马尔可夫决策过程，并学习一种最优策略，以满足给定的规范。通过引入基于规范的奖励和路径相关的折扣机制，最优策略能够有效地满足规范目标。无模型强化学习算法使用这些奖励和折扣因子，保证收敛到最优策略。通过两个运动规划案例研究，展示了该基于强化学习的合成方法的适用性。

基于采样规范的智能能源系统学习控制的保护

BriefGPT - AI 论文速递 ·