$StageACT——基于CVAE的多阶段ACT：把开门任务分为五个阶段，且做好分段标注以引导低层策略逐一执行$

结构之法算法之道 ·

StageACT——基于CVAE的多阶段ACT：把开门任务分为五个阶段，且做好分段标注以引导低层策略逐一执行

💡 原文中文，约7100字，阅读约需17分钟。

📝

内容提要

本文探讨了StageACT，一种基于人类示范的自主行走-操作策略，旨在解决人形机器人开门任务的复杂性。通过将任务分解为多个阶段并引入阶段条件化，该方法显著提高了成功率，尤其在处理观察歧义和失败恢复方面表现优异。此方法无需依赖外部感知或门的特定信息，展示了模仿学习在长时域任务中的潜力。

🎯

🔎

StageACT通过将开门任务分解为多个阶段，显著提高了机器人在复杂环境中的成功率。这种分解不仅反映了人类在执行类似任务时的自然策略，也为机器人提供了清晰的操作指引，减少了因状态歧义导致的错误。

StageACT展示了模仿学习在长时域任务中的应用潜力。通过引入阶段条件化，机器人能够在面对观察歧义时更有效地进行决策，并在失败时迅速恢复。这一策略为未来的机器人自主操作提供了新的思路。

与许多依赖外部感知的机器人系统不同，StageACT不需要特定的门信息或外部感知。这种独立性使得该方法在多种环境中具有更好的适应性，尤其是在不确定性较高的情况下，能够更灵活地应对各种挑战。

❓

StageACT旨在解决人形机器人开门任务的复杂性，通过将任务分解为多个阶段来提高成功率。

StageACT通过引入阶段条件化策略，利用时间上下文消歧，并在失败时重新进入较早阶段以实现恢复行为。

StageACT显著优于标准行为克隆，尤其在解决观测歧义和实现失败恢复方面表现更佳。

StageACT将开门任务分解为接近、抓取、解锁和推门等多个阶段，以反映动作的时间顺序结构。

StageACT无需依赖外部感知或门的特定信息，展示了模仿学习在长时域任务中的潜力。

StageACT通过模仿学习训练，使用条件变分自编码器（CVAE）来生成动作序列，并在训练中引入阶段条件。

🏷️