小红花·文摘

本研究提出了一种基于遗传算法的模型演化框架（MEGA），旨在解决多任务强化学习中的模型资源配置不足问题。该框架能够根据任务难度自动演化模型，提升其能力。实验结果表明，MEGA在多个机器人工具操作任务中表现优异，验证了其有效性。

Model Evolution Framework with Genetic Algorithm for Multi-Task Reinforcement Learning

BriefGPT - AI 论文速递 ·

本研究通过引入残差策略学习和混合专家框架，解决了机器人灵巧抓取中的多物体识别和抓取问题。ResDex 在3,200个物体上抓取成功率达88.8%，对未见物体无泛化差距，训练效率大幅提升。

Efficient Residual Learning with Mixture of Experts for Generalized Dexterous Grasping

BriefGPT - AI 论文速递 ·

本文介绍了一种新型的约束强化学习方法CPPO，将其视为概率推理问题，通过一阶更新优化策略，解决了传统方法的复杂性和低效性。同时，研究提出了多任务强化学习和基于原始-对偶算法的策略，旨在统一现有技术并提供多种策略约束的工具箱。

约束强化学习的政策梯度最后迭代全局收敛

BriefGPT - AI 论文速递 ·

该研究使用多任务软演员-评论家算法（MT-SAC）训练机械臂在Meta World环境中执行七项任务。与MT-QWALE算法比较，发现MT-QWALE在隐藏目标位置的情况下表现更佳，成功完成任务。此外，研究提出的任务不可知学习方法（TAL）在虚拟场景中优于现有算法，展示了多任务强化学习的探索优势和样本效率提升。

通过任务特定的动作修正实现高效多任务强化学习

BriefGPT - AI 论文速递 ·

本文提出了CMTA方法，通过对比学习和时间注意力来解决多任务强化学习方法的限制。实验结果表明CMTA优于单独学习每个任务，并在基准上取得了显著的性能改进。

具有时间注意力的对比模块的多任务强化学习

BriefGPT - AI 论文速递 ·