本文解决了长时间任务中的子任务分解问题,提出通过选择机制获取子任务。研究开发了序列非负矩阵分解方法,验证了选择变量及其作为子目标的作用,从而提升了多任务模仿学习的任务泛化能力。
本文提出了一个质量多样性优化算法统一框架,包括变体和集合管理机制。新的选择机制在实验中表现出更好的性能。
完成下面两步后,将自动完成登录并继续当前操作。