本文介绍了一种使用弱监督来自动区分语义明确的任务子空间和无意义的任务空间的方法,该方法在多种具有挑战性的基于视觉的连续控制问题中实现了显著的性能提升。
介绍了一种使用弱监督的方法来区分语义明确的任务子空间和无意义的任务空间。
学习到的子空间能够实现高效探索,并提供状态间距离的表示形式。
该方法在多种基于视觉的连续控制问题中表现出显著的性能提升。
特别是在环境复杂性增加的情况下,性能提升更加明显。
完成下面两步后,将自动完成登录并继续当前操作。