本研究提出了一种Wasserstein质量多样性模仿学习(WQDIL)方法,旨在解决有限示例学习的挑战。该方法提高了模仿学习的稳定性,并减轻了行为过拟合的问题。实验结果表明,在MuJoCo环境中,其表现优于现有方法,接近专家水平。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: