本研究提出了一种基于多代理强化学习的Flip Learning框架,旨在提高乳腺超声结节分割的精确性。该方法在大型数据集上进行验证,性能超过现有的弱监督方法,接近完全监督学习的效果。
VolleyBots是一个新测试平台,结合运动控制与战略游戏,专注于多无人机排球。该平台解决了现有多代理强化学习测试平台在高机动性无人机方面的不足,支持高保真仿真和现实转移,推动灵活机器人平台的研究。
本研究探讨了多代理强化学习中代理与人类的协调问题。通过学习人类合作伙伴的生成模型,提出了一种新方法,能够生成多样化的合作伙伴,从而提升代理的协作能力。实验结果表明,该方法在真实人类团队中的表现持续改善。
本文提出了MASER方法,针对稀疏奖励的多代理强化学习问题,显著优于其他算法。MASER通过生成子目标和奖励机器,提高学习效率和策略可解释性,适用于复杂环境中的合作任务。实验结果表明,该方法在多智能体领域表现出色,具有良好的研究前景。
本研究提出了用于特定司法管辖区决策分析的多代理强化学习模型,并在实验中发现 MARL 在指导公共卫生政策方面的优势和适用性。
完成下面两步后,将自动完成登录并继续当前操作。