结构之法算法之道 ·

PI发布的Human to Robot数采工作——头戴iPhone且手戴两相机采集数据：混合数据中像“用机器人数据一样”用人类数据，而无需显式对齐

📝

内容提要

摘要：本文探讨如何利用人类视频数据训练通用机器人策略，提出通过多样化VLA预训练实现人机动作自然对齐的方法。研究发现，随着预训练数据多样性的提升，模型能形成与具身形式无关的表征，实现跨形体技能迁移。具体方案包括：采用头戴/腕部摄像机采集人类动作数据，通过3D手部轨迹预测末端执行器动作，结合子任务语言标注进行联合训练。相比传统需要显式对齐的方法，该方案更具通用性，为具身智能的工业落地提供了新思...

🏷️

继续阅读

首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖
浙江推出首个物理AI数据基座平台“无垠”，旨在解决机器人数据短缺问题。该平台结合真实数据与虚拟仿真，提供高质量数据，支持具身智能的训练与应用，推动行业发展。
这款坚固手机的一台相机是可弹出的动作摄像头
RugOne Xsnap 7 Pro原型在MWC 2026展示，尚未公布价格和上市日期。配置包括MediaTek Dimensity 8400 5G芯片、...
Messenger中高级浏览保护的工作原理
Messenger的高级浏览保护（ABP）通过分析聊天链接来保护用户隐私，并警告潜在的恶意链接。该系统利用更新的恶意网站列表和加密技术，确保用户在端到端加...
ABB机器人利用NVIDIA Omniverse大规模交付工业级物理AI
ABB与NVIDIA合作，将工业级物理AI引入工厂，通过整合NVIDIA Omniverse库到RobotStudio，实现高精度仿真，降低工程时间和部署...
iPhone 17e 上手体验：「苹替」的平替，今年少有的性价比？
iPhone 17e 相较于 iPhone 16e 显著升级，新增淡粉色、支持 MagSafe、搭载 A19 处理器，性能提升，起售价不变，存储从 128...
一次有诚意的升级，一份加量不加价的体验：iPhone 17e 首发体验
iPhone 17e作为入门版，起售价不变，存储容量翻倍，告别128GB时代。外观与前代相同，新增浅粉色选项，支持MagSafe充电。配备4800万像素镜...

PI发布的Human to Robot数采工作——头戴iPhone且手戴两相机采集数据：混合数据中像“用机器人数据一样”用人类数据，而无需显式对齐

内容提要

标签

继续阅读