plus studio ·

act笔记

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

ACT通过将动作打包，能够一次性预测未来k个时间步的动作序列，有效减少误差累积。它结合超低成本的遥操作平台、CVAE模型和Transformer架构，提升了机器人的控制精度和动作平滑度。

🎯

🔎

ACT通过将动作打包，一次性预测未来k个时间步的动作序列，显著减少了误差累积。这种方法不仅提高了机器人的控制精度，还使得动作更加平滑，适用于复杂的操作任务。与传统的单步预测相比，ACT的策略更能应对动态环境中的变化。

ALOHA遥操作平台由廉价机械臂和3D打印部件组成，具备高控制带宽和稳定性。这种低成本的设计使得高精度的机器人操作变得更加可行，尤其适合预算有限的研究和开发项目。操作员通过直观的拖动方式控制机械臂，提升了操作的灵活性和稳定性。

ACT采用条件变分自编码器（CVAE）进行策略训练，能够有效捕捉人类演示中的变异性。通过引入风格变量，模型在生成动作时考虑了多样性，这对于提高机器人在复杂环境中的适应能力至关重要。使用L1损失优化动作建模，进一步提升了预测的精确性。

❓

ACT通过将动作打包，一次性预测未来k个时间步的动作序列，从而有效减少误差累积。

ALOHA遥操作平台由廉价机械臂和3D打印部件组成，提供高控制带宽和稳定性。

ACT在每个时间步查询策略网络，并使用指数加权方案对多个预测动作进行加权平均，以提高动作的平滑度。

ACT将策略训练为条件变分自编码器（CVAE），以捕捉人类演示中的变异性。

在推理时，CVAE编码器被丢弃，风格变量设置为先验分布的均值，即全零向量。

ACT使用标准的VAE目标函数进行优化，包含重构损失和KL散度正则化项。

🏷️