本研究提出了一种适用于多种无人机的神经网络控制器,采用领域随机化训练,展现出良好的适应性和通用性,尽管速度略低于特定模型。
本研究提出了一种可泛化的自主渗透测试框架(GAP),旨在解决真实环境中的应用能力不足问题。通过领域随机化和元强化学习,GAP实现了策略学习、零-shot策略迁移和快速策略适应,展现出重要的应用潜力。
本研究提出了一种基于深度强化学习的方法,旨在解决无人机竞速中的障碍感知复杂性问题。通过领域随机化和经验收集,该方法有效提升了无人机在复杂环境中的导航能力。
本研究发现现有的无监督环境设计方法在选择训练数据的问题上并未超越简单的领域随机化基线,需要大量超参数调优。通过直接针对高学习性级别进行训练,研究表明这种直观的方法在多个二元输出环境中表现优于现有方法和领域随机化,提升了学习的有效性。
本文介绍了基于无模型视觉强化学习的变形物体操作问题,通过迭代拾取-放置空间和显式学习放置策略加速学习,使用MVP选择策略,比独立空间快一个数量级的学习,通过领域随机化将策略转移到PR2机器人上,对布料和绳索覆盖任务进行了实验验证。
该文介绍了一种基于学习驱动的自适应控制方法,通过生物启发的经验回放机制、领域随机化技术和物理平台上的评估协议,实现了仿真到真实的迁移策略。实验结果表明,该方法能够从AUV的次优仿真模型中学到有效的策略,并在实际环境中将控制性能提高3倍。
完成下面两步后,将自动完成登录并继续当前操作。