小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

德国数字协会Bitkom的调研显示,89%的企业认为工业4.0对竞争力重要,78%认为人工智能关键,63%认为类人机器人重要。97%的公司已在使用工业4.0应用,20%预计未来十年类人机器人将在大多数工业企业中普遍使用。

报告显示,德国工业认为类人机器人在生产中被广泛使用具备可能性

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-15T02:04:59Z
Ψ0——人形全身VLA:先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM,再后训练MM-DiT,最后用AMO做下肢RL跟踪

本文介绍了Ψ0模型,该模型结合大规模人类视频数据与真实机器人数据,训练出一种用于类人机器人灵巧运动的视觉-语言动作模型,能够有效提取运动先验,实现复杂的全身控制。

Ψ0——人形全身VLA:先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM,再后训练MM-DiT,最后用AMO做下肢RL跟踪

结构之法 算法之道
结构之法 算法之道 · 2026-03-21T11:15:57Z
HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略:基于人工势场APF和混合场景建模的全身RL算法

本文介绍了HumanoidPF(类人潜力场),一种用于人形机器人在杂乱室内场景中无碰撞穿越的技术。该方法通过编码人形体与障碍物的关系,提升机器人在复杂环境中的避障能力。研究者提出了一种混合场景生成策略,结合真实和程序化障碍物,增强训练效果。HumanoidPF被应用于Click-and-Traverse系统,实现高效遥操作导航,实验结果显示其在拥挤场景中表现优异,具有良好的泛化能力。

HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略:基于人工势场APF和混合场景建模的全身RL算法

结构之法 算法之道
结构之法 算法之道 · 2026-02-01T15:30:55Z
VIRAL——仿真中训练但现实中视觉驱动(解决loco-mani所需训练数据大的难题):先Sim中训练教师策略,后蒸馏出基于视觉的学生策略

本文讨论了VIRAL项目,该项目通过教师-学生框架结合强化学习和视觉蒸馏,实现了类人机器人在真实环境中的自主行走与操作。技术利用仿真训练和领域随机化,提高了机器人的鲁棒性和泛化能力,展现出在复杂任务中的潜力。尽管取得了进展,仍面临物理和任务覆盖等挑战,未来需结合仿真与现实世界数据以实现更广泛的应用。

VIRAL——仿真中训练但现实中视觉驱动(解决loco-mani所需训练数据大的难题):先Sim中训练教师策略,后蒸馏出基于视觉的学生策略

结构之法 算法之道
结构之法 算法之道 · 2025-11-30T04:44:44Z
中国警告:类人机器人行业正形成泡沫

中国国家发展和改革委员会警告,类人机器人行业可能面临泡沫风险。尽管应用案例稀少,投资仍在涌入,导致市场上出现大量相似模型。目前中国有超过150家类人机器人公司,其中一半为初创企业。

中国警告:类人机器人行业正形成泡沫

The Verge
The Verge · 2025-11-27T15:57:49Z
GMR——人形动作追踪的通用动作重定向:在不做复杂奖励和域随机化的前提下,缓解或消除重定向带来的伪影(含PHC的详解)

本文讨论了通用动作重定向(GMR)在类人机器人动作追踪中的应用。GMR通过重定向人类运动数据,克服了人类与机器人之间的结构差异。研究表明,重定向方法的选择对机器人性能至关重要,伪影如脚部滑动和穿透会影响学习效果。GMR的流程包括关键身体部位匹配、姿态对齐、局部缩放和逆运动学求解,以提高动作重定向的质量和效率。

GMR——人形动作追踪的通用动作重定向:在不做复杂奖励和域随机化的前提下,缓解或消除重定向带来的伪影(含PHC的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-10-30T10:55:45Z
DreamControl——结合扩散模型和RL的全身人形控制:利用在人体运动数据上训练得到的扩散先验,随后在仿真中引导RL策略完成特定任务

本文讨论了DreamControl,一种结合扩散模型与强化学习的全身类人机器人控制方法。该方法利用人类动作数据生成自然运动轨迹,提升机器人在复杂环境中的自主操作能力,解决了稳定性和协调性问题。研究表明,该方法在多种任务中有效,推动了人形机器人技术的发展。

DreamControl——结合扩散模型和RL的全身人形控制:利用在人体运动数据上训练得到的扩散先验,随后在仿真中引导RL策略完成特定任务

结构之法 算法之道
结构之法 算法之道 · 2025-10-03T16:01:40Z
VisualMimic——基于视觉的人形行走-操作控制:低层策略负责平衡控制且跟踪高层下发的指令、高层策略则基于自我中心视觉输入以生成任务跟踪指令

本文讨论了VisualMimic框架在类人机器人行走与操作中的应用,通过分层设计提升强化学习的泛化能力。该框架结合低层关键点跟踪与高层视觉运动策略,使机器人在真实环境中执行多样化任务,展现出良好的鲁棒性和适应性。研究强调自我中心视觉感知与全身灵巧性的结合,推动了人形机器人在物体交互方面的进展。

VisualMimic——基于视觉的人形行走-操作控制:低层策略负责平衡控制且跟踪高层下发的指令、高层策略则基于自我中心视觉输入以生成任务跟踪指令

结构之法 算法之道
结构之法 算法之道 · 2025-09-28T14:32:19Z
类人机器人是Meta下一个‘AR规模的赌注’

Meta计划投入数十亿美元开发类人机器人,CTO安德鲁·博斯沃斯指出软件是主要瓶颈。Meta将其软件平台授权给其他制造商,旨在实现灵活的机器人操作能力。该团队由前Scale CEO领导,吸引了多位顶尖人才。

类人机器人是Meta下一个‘AR规模的赌注’

The Verge
The Verge · 2025-09-26T19:45:00Z

VideoMimic是一种通过单目视频学习人类动作并转化为类人机器人控制策略的方法。该系统能够重建人类及其环境,训练机器人在不同场景中自主执行动作,如上下楼梯和坐下。研究表明,VideoMimic在多样化环境中表现出良好的鲁棒性,未来将扩展应用以实现更复杂的人机交互。

一看视频就能学会的VideoMimic——三步走:先real2sim(涉及视频作为输入、提取姿态且点云化、重定向到G1上),后sim中训练,最后sim2real

结构之法 算法之道
结构之法 算法之道 · 2025-08-06T08:46:08Z

本文介绍了R2S2和OpenWBT项目,旨在通过构建多技能的现实世界技能空间,提升类人机器人在复杂任务中的表现。研究者结合模仿学习与强化学习,优化技能协调与切换,以确保机器人在真实环境中的稳定性与有效性。

从R2S2到OpenWBT——提高人形的到达能力:模仿教师策略下RL探索新行为,最终实现技能之间的协调与切换(含OpenWBC移动抓娃娃简介)

结构之法 算法之道
结构之法 算法之道 · 2025-06-24T14:12:37Z

微软亚洲研究院的ACE Talk系列讲座邀请北京大学副教授卢宗青,主题为“利用互联网视频扩展类人机器人学习”。他将探讨如何通过视觉-语言模型、动作模型和强化学习,利用互联网视频数据教授机器人类人技能。讲座定于6月11日举行,欢迎报名参加。

Lecture Registration | ACE Talk Invites Associate Professor Lu Zongqing from Peking University to Share Insights on Enhancing Humanoid Robot Learning through Internet Videos

dotNET跨平台
dotNET跨平台 · 2025-06-07T00:05:16Z
类人策略 ~ 人类策略

本研究探讨通过人类自我中心示范数据训练类人机器人,以提升其任务和平台间的鲁棒性与泛化能力。我们收集了与类人操作示范对齐的任务导向数据集,并训练了人类-类人行为策略(HAT),实现了人类与类人机器人的统一状态-动作空间。结果显示,人类数据显著增强了HAT的泛化能力和鲁棒性。

类人策略 ~ 人类策略

Apple Machine Learning Research
Apple Machine Learning Research · 2025-05-21T00:00:00Z
NVIDIA研究突破推动先进机器人运动

NVIDIA在亚特兰大国际机器人与自动化会议上展示了其在生成AI、仿真和自主操作方面的研究突破。这些创新将推动自主车辆和类人机器人的发展,提升安全性和控制能力,主要研究包括生成4D驾驶场景、实时感知故障监测和人机交互政策调整,旨在改善机器人学习和应用的可靠性。

NVIDIA研究突破推动先进机器人运动

NVIDIA Blog
NVIDIA Blog · 2025-05-19T15:00:53Z

本研究提出HuB框架,解决类人机器人在平衡控制中面临的不稳定性、学习难度和传感器噪声问题,显著提高其在极端单腿姿势下的平衡稳定性。

HuB: Learning Extreme Humanoid Balance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究提出了SoccerDiffusion,一个基于变压器的扩散模型,旨在从现实比赛记录中学习类人机器人足球的控制策略。该模型能够实时推理复杂运动行为,为后续强化学习提供基础,并发布了相关数据集和代码,推动机器人体育智能的发展。

SoccerDiffusion: Learning End-to-End Humanoid Robot Soccer from Gameplay Recordings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究开发了一种高强度抓取器,具备嵌入式多模态感知功能,能够产生110牛顿的抓取力。该抓取器通过优化感知驱动,提升了物体抓取的精准性和效率,为类人机器人在复杂环境中的应用提供了新方案。

A High-Force Gripper with Embedded Multimodal Sensing for Powerful and Perception-Driven Grasping

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z
小鹏汽车138亿美元投资类人机器人:重塑自动化的未来

小鹏汽车投资138亿美元进军类人机器人领域,计划在2024年发布具有人类运动能力和强大处理器的机器人“铁”。该机器人将整合进汽车生产,以提高效率、减少错误和降低人力成本,助力中国的AI和自动化战略。

小鹏汽车138亿美元投资类人机器人:重塑自动化的未来

DEV Community
DEV Community · 2025-03-21T10:55:09Z
Nvidia表示‘通用机器人时代已经到来’

Nvidia发布了Isaac GR00T N1,这是一个开源可定制的基础模型,旨在加速类人机器人开发。创始人黄仁勋表示,通用机器人时代已经到来。该模型采用双系统架构,结合快速反应与环境推理,支持开发者进行后期训练。

Nvidia表示‘通用机器人时代已经到来’

The Verge
The Verge · 2025-03-19T13:12:57Z

本研究提出了一种新颖的解决方案StyleLoco,结合强化学习与生成对抗模仿学习,以提升类人机器人在多样化运动任务中的自然运动表现。

StyleLoco:用于自然类人机器人运动的生成对抗蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码