$π0.7——4层prompt下的技能组合泛化能力：先高层策略基于指令历史和当前画面输出子任务指令，后世界模型基于子任务指令生成子目标图像$

结构之法算法之道 ·

π0.7——4层prompt下的技能组合泛化能力：先高层策略基于指令历史和当前画面输出子任务指令，后世界模型基于子任务指令生成子目标图像

💡 原文中文，约10400字，阅读约需25分钟。

📝

内容提要

π0.7是一种新型通用机器人模型，具备强大的组合泛化能力。通过多模态数据和详细上下文标注，该模型能够有效执行多样化任务，并在新任务中展现灵巧技能。它结合了人类视频和机器人自主数据，提升了在复杂环境中的表现。引入子目标图像和任务元数据增强了模型的指令理解和执行能力，使其在多样化数据上训练时表现出色。

🎯

🔎

π0.7模型的组合泛化能力使其能够在多样化任务中表现出色。这种能力不仅提升了机器人在复杂环境中的适应性，还为未来的机器人应用提供了更广泛的可能性，尤其是在需要灵活应对新任务的场景中。

通过结合人类视频、机器人自主数据和多模态上下文标注，π0.7能够有效理解和执行复杂指令。这种多模态数据的使用，不仅提高了模型的指令理解能力，还增强了其在新任务中的表现，值得在其他领域的机器人研究中借鉴。

π0.7的训练数据集包含了多种质量的示范数据，包括失败案例和次优行为。这种多样性使得模型在面对不同任务时更具鲁棒性，能够从错误中学习并提升性能，提示研究者在训练过程中应重视数据的多样性和质量。

❓

π0.7是一种新型通用机器人模型，具备强大的组合泛化能力，能够有效执行多样化任务，并在复杂环境中展现灵巧技能。

通过引入子目标图像和任务元数据，π0.7增强了模型的指令理解和执行能力，使其能够更好地处理复杂任务。

训练数据包括来自人类视频、机器人自主数据、互联网的多模态数据以及次优行为的数据。

该模型结合人类视频和机器人自主数据，提升了在复杂环境中的表现，展现出色的灵巧技能。

为数据添加详细的上下文标注可以帮助模型理解做什么和如何做，从而提高训练效果和泛化能力。

π0.7在π0.6的基础上增加了高级策略模块和世界模型模块，具备多模态上下文条件能力。

🏷️