小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新方法，解决元强化学习在多任务优化中的训练损失不平衡问题，特别是由于任务回报尺度不均造成的瓶颈。该方法在不同环境中表现出显著进展，推动了在线多任务适应和记忆问题的解决。

AMAGO-2: Breaking the Multi-Task Barrier in Meta-Reinforcement Learning with Transformers

BriefGPT - AI 论文速递 ·

本研究探讨机器遗忘的优化问题，将其视为正则化的多任务优化。提出了归一化梯度差异（NGDiff）算法，以优化遗忘目标与模型性能之间的平衡，并在TOFU和MUSE数据集上验证了其优越性和稳定性。

Unlearning as Multi-Task Optimization: A Normalized Gradient Difference Method with an Adaptive Learning Rate

BriefGPT - AI 论文速递 ·