小红花·文摘 - 小红花技术领袖俱乐部

德国数字协会Bitkom的调研显示，89%的企业认为工业4.0对竞争力重要，78%认为人工智能关键，63%认为类人机器人重要。97%的公司已在使用工业4.0应用，20%预计未来十年类人机器人将在大多数工业企业中普遍使用。

报告显示，德国工业认为类人机器人在生产中被广泛使用具备可能性

全球TMT-美通国际 ·

$Ψ0——人形全身VLA：先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM，再后训练MM-DiT，最后用AMO做下肢RL跟踪$

Ψ0——人形全身VLA：先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM，再后训练MM-DiT，最后用AMO做下肢RL跟踪

结构之法算法之道 ·

$HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略：基于人工势场APF和混合场景建模的全身RL算法$

HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略：基于人工势场APF和混合场景建模的全身RL算法

结构之法算法之道 ·

VIRAL——仿真中训练但现实中视觉驱动(解决loco-mani所需训练数据大的难题)：先Sim中训练教师策略，后蒸馏出基于视觉的学生策略

VIRAL——仿真中训练但现实中视觉驱动(解决loco-mani所需训练数据大的难题)：先Sim中训练教师策略，后蒸馏出基于视觉的学生策略

结构之法算法之道 ·

中国警告：类人机器人行业正形成泡沫

中国警告：类人机器人行业正形成泡沫

The Verge ·

$GMR——人形动作追踪的通用动作重定向：在不做复杂奖励和域随机化的前提下，缓解或消除重定向带来的伪影(含PHC的详解)$

GMR——人形动作追踪的通用动作重定向：在不做复杂奖励和域随机化的前提下，缓解或消除重定向带来的伪影(含PHC的详解)

结构之法算法之道 ·

$DreamControl——结合扩散模型和RL的全身人形控制：利用在人体运动数据上训练得到的扩散先验，随后在仿真中引导RL策略完成特定任务$

DreamControl——结合扩散模型和RL的全身人形控制：利用在人体运动数据上训练得到的扩散先验，随后在仿真中引导RL策略完成特定任务

结构之法算法之道 ·

$VisualMimic——基于视觉的人形行走-操作控制：低层策略负责平衡控制且跟踪高层下发的指令、高层策略则基于自我中心视觉输入以生成任务跟踪指令$

VisualMimic——基于视觉的人形行走-操作控制：低层策略负责平衡控制且跟踪高层下发的指令、高层策略则基于自我中心视觉输入以生成任务跟踪指令

结构之法算法之道 ·

类人机器人是Meta下一个‘AR规模的赌注’

类人机器人是Meta下一个‘AR规模的赌注’

The Verge ·

VideoMimic是一种通过单目视频学习人类动作并转化为类人机器人控制策略的方法。该系统能够重建人类及其环境，训练机器人在不同场景中自主执行动作，如上下楼梯和坐下。研究表明，VideoMimic在多样化环境中表现出良好的鲁棒性，未来将扩展应用以实现更复杂的人机交互。

一看视频就能学会的VideoMimic——三步走：先real2sim(涉及视频作为输入、提取姿态且点云化、重定向到G1上)，后sim中训练，最后sim2real

结构之法算法之道 ·

本文介绍了R2S2和OpenWBT项目，旨在通过构建多技能的现实世界技能空间，提升类人机器人在复杂任务中的表现。研究者结合模仿学习与强化学习，优化技能协调与切换，以确保机器人在真实环境中的稳定性与有效性。

从R2S2到OpenWBT——提高人形的到达能力：模仿教师策略下RL探索新行为，最终实现技能之间的协调与切换(含OpenWBC移动抓娃娃简介)

结构之法算法之道 ·

微软亚洲研究院的ACE Talk系列讲座邀请北京大学副教授卢宗青，主题为“利用互联网视频扩展类人机器人学习”。他将探讨如何通过视觉-语言模型、动作模型和强化学习，利用互联网视频数据教授机器人类人技能。讲座定于6月11日举行，欢迎报名参加。

Lecture Registration | ACE Talk Invites Associate Professor Lu Zongqing from Peking University to Share Insights on Enhancing Humanoid Robot Learning through Internet Videos

dotNET跨平台 ·

类人策略 ~ 人类策略

类人策略 ~ 人类策略

Apple Machine Learning Research ·

NVIDIA研究突破推动先进机器人运动

NVIDIA研究突破推动先进机器人运动

NVIDIA Blog ·

本研究提出HuB框架，解决类人机器人在平衡控制中面临的不稳定性、学习难度和传感器噪声问题，显著提高其在极端单腿姿势下的平衡稳定性。

HuB: Learning Extreme Humanoid Balance

BriefGPT - AI 论文速递 ·

本研究提出了SoccerDiffusion，一个基于变压器的扩散模型，旨在从现实比赛记录中学习类人机器人足球的控制策略。该模型能够实时推理复杂运动行为，为后续强化学习提供基础，并发布了相关数据集和代码，推动机器人体育智能的发展。

SoccerDiffusion: Learning End-to-End Humanoid Robot Soccer from Gameplay Recordings

BriefGPT - AI 论文速递 ·

本研究开发了一种高强度抓取器，具备嵌入式多模态感知功能，能够产生110牛顿的抓取力。该抓取器通过优化感知驱动，提升了物体抓取的精准性和效率，为类人机器人在复杂环境中的应用提供了新方案。

A High-Force Gripper with Embedded Multimodal Sensing for Powerful and Perception-Driven Grasping

BriefGPT - AI 论文速递 ·

小鹏汽车138亿美元投资类人机器人：重塑自动化的未来

小鹏汽车138亿美元投资类人机器人：重塑自动化的未来

DEV Community ·

Nvidia表示‘通用机器人时代已经到来’

Nvidia表示‘通用机器人时代已经到来’

The Verge ·

本研究提出了一种新颖的解决方案StyleLoco，结合强化学习与生成对抗模仿学习，以提升类人机器人在多样化运动任务中的自然运动表现。

StyleLoco：用于自然类人机器人运动的生成对抗蒸馏

BriefGPT - AI 论文速递 ·