结构之法算法之道 ·

机器人领域中的scaling law：清华高阳团队通过复现斯坦福UMI——探讨数据规模化定律(含UMI的复现关键)

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

在七月的线下营中，学员们复现了UMI，丁老师分享了fastumi的改进。UMI面临硬件成本高和SLAM算法复杂的局限。清华高阳团队尝试复现UMI，但效果不佳。研究表明，增加训练对象和环境数量能显著提升机器人泛化能力，尤其在低示范比例下表现突出。

🎯

🔎

UMI在硬件成本和SLAM算法复杂性上存在显著局限，这使得其在实际应用中受到限制。清华高阳团队的尝试虽然未能成功复现UMI的效果，但为未来的改进提供了重要的参考。通过引入fastumi等新方法，研究者们希望能够降低硬件依赖，简化算法，从而提升机器人的实用性和灵活性。

研究表明，增加训练对象和环境的数量能够显著提升机器人的泛化能力，尤其是在低示范比例下。这一发现强调了数据规模化的重要性，未来的研究和应用应更加关注如何有效收集和利用多样化的数据，以提高机器人在未知环境中的表现。

清华高阳团队在策略学习中采用了扩散策略和CNN模型，结合DINOv2视觉编码器，显著提升了模型的性能。这一技术进展不仅有助于提高机器人控制的精确性，也为其他领域的机器学习应用提供了借鉴，展示了深度学习在复杂任务中的潜力。

❓

UMI面临硬件成本高和SLAM算法复杂的局限性。

清华高阳团队使用昂贵的国外硬件复现UMI，但效果不佳，未达到原始论文中的效果。

数据缩放定律实验旨在描述泛化能力如何依赖于环境、对象和演示的数量，并确定有效的数据收集策略。

增加训练对象和环境数量能显著提升机器人在低示范比例下的泛化能力。

他们采用扩散策略和基于CNN的U-Net模型进行策略学习。

随着训练对象数量的增加，策略在未见对象上的表现一致性提高，所需示范数量减少。

🏷️