机器之心 ·

京东联合地瓜机器人等多家企业高校，推出业内首个具身智能原子技能库架构

💡 原文中文，约5200字，阅读约需13分钟。

📝

内容提要

具身智能技术正在快速发展，核心挑战是操作的泛化能力。京东研究院与多方合作，提出了基于三轮数据驱动的原子技能库构建框架，旨在突破数据瓶颈，提高技能的适应性和效率。这一框架有助于解决数据不足的问题，推动具身智能技术在物流、制造和医疗等领域的应用。

🎯

🔎

具身智能技术的发展面临操作泛化能力的挑战，尤其是在复杂环境中。京东提出的原子技能库构建框架，旨在通过动态更新技能库来应对这一挑战。这一创新不仅有助于提升机器人的适应性，还能推动具身智能在物流、制造和医疗等领域的实际应用。

京东的三轮数据驱动方法显著降低了数据采集成本，同时提升了技能适配能力。这种方法通过将任务分解为可重用的原子技能，减少了对大量数据的依赖，解决了传统端到端方法中的数据爆炸问题，为具身智能的广泛应用提供了新的可能性。

京东与多家企业和高校的合作，展示了学术界与产业界在技术创新中的重要性。通过共享数据和技术，能够加速具身智能技术的研究与应用，推动行业的整体进步。这种跨界合作模式值得其他领域借鉴，以实现更高效的技术转化。

❓

该框架旨在突破数据瓶颈，提高技能的适应性和效率，推动具身智能技术在多个领域的应用。

主要挑战是操作的泛化能力，即如何在有限的数据下使机器人适应复杂场景并实现技能高效迁移。

该方法通过将任务分解为可重用的原子技能，结合数据收集与少样本学习，减少了在仿真或真实环境中对数据的需求。

VLP Agent通过集成视觉感知、语言理解和空间智能，指导机器人执行任务并有效分解端到端任务。

实验结果表明，该方法在数据效率和操作性能上优于传统端到端方法，且能有效适应新任务。

原子技能库的构建旨在降低数据采集成本，增强任务适配能力，提升具身操作的通用性，以满足产业应用需求。

🏷️