结构之法算法之道 ·

GMT——用于人形全身控制的通用运动跟踪：两阶段师生训练框架下，全身基于单一策略，且自适应采样、MoE架构

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

本文介绍了KungfuBot，一个基于物理约束和自适应运动追踪的人形全身控制系统，旨在模仿和控制类人动作。文章分析了通用运动跟踪控制器面临的挑战，如可观测性、硬件限制和数据不均衡，并提出了自适应采样和运动专家混合架构以提升模型性能。

🎯

🔎

人形机器人在执行复杂动作时面临多重挑战，包括可观测性不足、硬件限制和数据不均衡。这些因素使得训练通用运动跟踪控制器变得困难，尤其是在需要高精度和灵活性的场景中。了解这些挑战有助于研究者在设计控制系统时更好地应对潜在问题。

自适应采样策略通过优化训练数据的选择，能够有效提升模型的学习效率。尤其是在面对类别不平衡的数据集时，这种方法能够确保模型在学习复杂动作时获得足够的训练样本，从而提高整体性能。关注这一策略的应用，可以为其他领域的机器学习提供借鉴。

运动专家混合（MoE）架构通过结合多个专家网络，增强了模型的表达能力和泛化能力。这种设计使得模型能够更好地处理多样化的动作类别，尤其是在复杂的运动任务中。理解这一架构的工作原理，有助于推动人形机器人控制技术的进一步发展。

❓

KungfuBot是一个基于物理约束和自适应运动追踪的人形全身控制系统，旨在模仿和控制类人动作。

主要挑战包括可观测性、硬件限制和数据不均衡。

自适应采样策略旨在缓解由于动作类别分布不均导致学习罕见动作困难的问题，提高训练效率。

运动专家混合架构通过多个专家网络和门控网络增强模型的表达能力和泛化能力。

数据集整理通过两阶段过滤去除不可行动作，确保训练数据的质量。

通过堆叠多个连续帧以捕捉运动序列的长期趋势，并使用局部关键部位位置来提高跟踪性能。

🏷️