小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了SMAC-HARD基准，旨在解决多智能体强化学习中对手策略多样性不足的问题。通过支持可定制的对手策略和无监督自我对弈，增强了训练的鲁棒性，促进了多智能体强化学习算法的发展。

SMAC-Hard: Enabling Mixed Opponent Strategy Scripts and Self-Play in SMAC

BriefGPT - AI 论文速递 ·

本研究提出了一种名为任务感知行为场（TAB-Fields）的方法，旨在解决自主代理在对抗场景中无法预测对手策略的问题。该方法通过计算最无偏概率分布，更好地表征对手状态分布，实验结果表明其性能优于传统方法。

A Maximum Entropy Framework for Mission-Aware Adversarial Planning

BriefGPT - AI 论文速递 ·