小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

本文探讨了觉-语言-动作(VLA)模型在机器人学习中的应用,提出了一种视频生成式价值模型(ViVa),通过预测未来状态来改进价值估计。ViVa结合预训练的视频生成模型、当前观测和本体感知,评估任务进展,提升机器人在复杂环境中的操作能力。研究表明,该方法在真实世界任务中表现优越,能够有效跟踪任务进度并处理新颖物体。

ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法 算法之道
结构之法 算法之道 · 2026-04-16T05:50:55Z
X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

本文介绍了一种新型机器人学习模型X-VLA,采用软提示技术以提升跨具身机器人学习的适应性和泛化能力。通过引入可学习的嵌入,X-VLA有效解决了不同硬件和任务环境下的异质性问题,增强了模型在多样化数据集上的表现。该模型在多个基准测试中表现优异,展现出在灵巧操作和适应新领域方面的强大能力。

X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

结构之法 算法之道
结构之法 算法之道 · 2026-02-21T05:00:30Z
具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

本文探讨了具身智能的研究及其在物理世界中的应用,强调通过与环境互动形成智能。推荐了一系列高质量数据集、在线教程和论文,涵盖机器人学习、视觉问答等领域,以支持学习与研究。

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

HyperAI超神经
HyperAI超神经 · 2026-01-23T04:03:34Z
GR-RL——首个让机器人系鞋带的VLA:先离线RL训练一个“分布式价值评估器”以做任务进度预测,后数据增强,最后在线RL

本文探讨了视觉语言动作(VLA)与强化学习(RL)结合的必要性,提出了GR-RL框架,以提高机器人在长时域操作中的灵巧性和精确度。GR-RL通过离线RL过滤次优数据,增强动作并进行在线RL调整,解决了人类示范中的噪声和不匹配问题。尽管GR-RL在高精度任务中表现出色,但仍面临行为漂移等局限性。

GR-RL——首个让机器人系鞋带的VLA:先离线RL训练一个“分布式价值评估器”以做任务进度预测,后数据增强,最后在线RL

结构之法 算法之道
结构之法 算法之道 · 2025-12-08T06:57:55Z
π∗0.6——RL微调流式VLA π0.6:先基于演示数据做离线RL预训练,再在线RL后训练(与环境自主交互,从经验数据中学习,且必要时人工干预)

本文介绍了RECAP框架在π∗0.6模型中的应用,通过结合示范数据和自主经验,提升机器人在复杂任务中的学习能力。该框架采用离线预训练和在线微调,优化决策过程,显著提高了机器人在制作咖啡和折叠衣物等任务中的表现。

π∗0.6——RL微调流式VLA π0.6:先基于演示数据做离线RL预训练,再在线RL后训练(与环境自主交互,从经验数据中学习,且必要时人工干预)

结构之法 算法之道
结构之法 算法之道 · 2025-11-18T15:13:09Z
走进全宇宙:开源物理引擎与OpenUSD推动机器人学习

NVIDIA的Newton物理引擎和Isaac GR00T模型通过OpenUSD加速机器人学习,支持人形机器人在复杂环境中高效操作。采用“模拟优先”方法,机器人可在虚拟环境中并行训练,提升技能,优化在工厂和公共场所的应用。

走进全宇宙:开源物理引擎与OpenUSD推动机器人学习

NVIDIA Blog
NVIDIA Blog · 2025-09-30T13:00:07Z

美国东北大学与波士顿动力RAI联合提出的HEP框架,通过坐标系转移接口实现机器人高效学习。该框架的分层结构提升了灵活性,自动适应空间变化,显著降低了数据依赖。实验结果显示,HEP在复杂任务中的成功率提升了60%,为未来多模态智能体集成提供了新路径。

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

量子位
量子位 · 2025-07-22T09:28:14Z
NVIDIA研究突破推动先进机器人运动

NVIDIA在亚特兰大国际机器人与自动化会议上展示了其在生成AI、仿真和自主操作方面的研究突破。这些创新将推动自主车辆和类人机器人的发展,提升安全性和控制能力,主要研究包括生成4D驾驶场景、实时感知故障监测和人机交互政策调整,旨在改善机器人学习和应用的可靠性。

NVIDIA研究突破推动先进机器人运动

NVIDIA Blog
NVIDIA Blog · 2025-05-19T15:00:53Z
迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准

RoboVerse是一个统一的机器人学习平台,解决了数据集和评估体系的碎片化问题。它提供MetaSim接口,支持多种仿真器,构建高质量合成数据集,并实现混合仿真,提升迁移效果。此外,平台支持遥操作和AI自动生成任务,显著提高研究效率与实验规模。

迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准

机器之心
机器之心 · 2025-04-08T10:38:12Z

本研究提出AutoEval系统,旨在全自动化评估机器人学习中的策略,提升评估效率与质量,并与人工评估高度一致,促进广泛应用。

AutoEval: Autonomous Evaluation of General Robot Operating Policies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了一种增强时间感知和任务完成感的方法,以应对预训练视觉表征(PVRs)在视觉-运动机器人学习中的挑战,显著提升了在分布外场景中的鲁棒性和机器人学习性能。

When Pre-trained Visual Representations Are Insufficient: Limitations in Visual-Motor Robot Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z
在开源冲刺中为Imagination-to-Real贡献力量!

Imagination-to-Real通过结合生成性AI和经典物理模拟器,提供真实、多样和几何准确的视觉数据,改变了机器人学习方式,帮助机器人训练复杂任务,并鼓励开源贡献。

在开源冲刺中为Imagination-to-Real贡献力量!

DEV Community
DEV Community · 2025-01-16T06:35:00Z

「新锐论前沿」第四期线上分享活动将于12月18日举行,普渡大学博士生徐政通将分享机器人学习中的数据高效触觉表征,介绍GelSight的应用,并探讨少量样本学习的可泛化触觉表征。活动还将进行抽奖,参与者有机会获得算力资源。

线上分享| 面向机器人学习的数据高效触觉表征

HyperAI超神经
HyperAI超神经 · 2024-12-17T03:09:29Z

本研究提出了一种自回归预训练方法Moto,旨在解决机器人学习中缺乏标记数据的问题。通过将视频内容转化为潜在运动标记序列,提升机器人在动态环境中的操控性能。

Moto: A Latent Motion Token as the Bridging Language for Robot Manipulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
机器人能从机器梦中学习吗?

麻省理工学院研究团队开发的“LucidSim”系统利用生成AI和物理模拟器,创建多样化的虚拟训练环境,帮助机器人在缺乏真实数据的情况下实现专家级表现。该系统有效解决了机器人学习中的“模拟与现实差距”问题,显著提升了机器人在复杂环境中的适应能力,研究显示成功率高达88%。

机器人能从机器梦中学习吗?

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2024-11-19T19:50:00Z

本研究提出利普希茨常数作为提高神经网络在感知系统中对小规模干扰鲁棒性的关键指标,为安全的机器人学习系统提供理论基础。

通过利普希茨常数和架构敏感性估计神经网络鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文探讨了机器人数据集中自然语言注释的稀缺问题,提出了NILS方法,能够自动标注长时间跨度的数据,从而提高标注效率和质量,对机器人学习产生重要影响。

通过基础模型的零样本标注扩展机器人策略学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本研究通过引入残差策略学习和混合专家框架,解决了机器人灵巧抓取中的多物体识别和抓取问题。ResDex 在3,200个物体上抓取成功率达88.8%,对未见物体无泛化差距,训练效率大幅提升。

通用灵巧抓取的混合专家高效残差学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

研究探讨了机器人学习中与人类互动的多种输入模式,提出了“元模态”概念,超越传统反馈机制。研究发现,组合使用多种元模态能显著改善学习行为和可用性,为优化人机互动任务提供了新见解,并增强了用户的互动自由度和支持能力。

和谐:人机团队中的认知与控制协作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本研究提出了一种低成本、易于复制和适应不同机器人及环境的学习框架,解决了模仿学习在机器人领域中应用成本高昂的问题。研究表明即使使用简单的网络结构和较少的演示,亦可实现多任务机器人学习。此外,研究还提出了投票正率(VPR)这一新评价策略,以提供对真实操作任务更客观的性能评估。

通用机器人学习框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码