小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

本文探讨了觉-语言-动作(VLA)模型在机器人学习中的应用,提出了一种视频生成式价值模型(ViVa),通过预测未来状态来改进价值估计。ViVa结合预训练的视频生成模型、当前观测和本体感知,评估任务进展,提升机器人在复杂环境中的操作能力。研究表明,该方法在真实世界任务中表现优越,能够有效跟踪任务进度并处理新颖物体。

ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法 算法之道
结构之法 算法之道 · 2026-04-16T05:50:55Z
X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

本文介绍了一种新型机器人学习模型X-VLA,采用软提示技术以提升跨具身机器人学习的适应性和泛化能力。通过引入可学习的嵌入,X-VLA有效解决了不同硬件和任务环境下的异质性问题,增强了模型在多样化数据集上的表现。该模型在多个基准测试中表现优异,展现出在灵巧操作和适应新领域方面的强大能力。

X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

结构之法 算法之道
结构之法 算法之道 · 2026-02-21T05:00:30Z
具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

本文探讨了具身智能的研究及其在物理世界中的应用,强调通过与环境互动形成智能。推荐了一系列高质量数据集、在线教程和论文,涵盖机器人学习、视觉问答等领域,以支持学习与研究。

具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文……

HyperAI超神经
HyperAI超神经 · 2026-01-23T04:03:34Z
GR-RL——首个让机器人系鞋带的VLA:先离线RL训练一个“分布式价值评估器”以做任务进度预测,后数据增强,最后在线RL

本文探讨了视觉语言动作(VLA)与强化学习(RL)结合的必要性,提出了GR-RL框架,以提高机器人在长时域操作中的灵巧性和精确度。GR-RL通过离线RL过滤次优数据,增强动作并进行在线RL调整,解决了人类示范中的噪声和不匹配问题。尽管GR-RL在高精度任务中表现出色,但仍面临行为漂移等局限性。

GR-RL——首个让机器人系鞋带的VLA:先离线RL训练一个“分布式价值评估器”以做任务进度预测,后数据增强,最后在线RL

结构之法 算法之道
结构之法 算法之道 · 2025-12-08T06:57:55Z
π∗0.6——RL微调流式VLA π0.6:先基于演示数据做离线RL预训练,再在线RL后训练(与环境自主交互,从经验数据中学习,且必要时人工干预)

本文介绍了RECAP框架在π∗0.6模型中的应用,通过结合示范数据和自主经验,提升机器人在复杂任务中的学习能力。该框架采用离线预训练和在线微调,优化决策过程,显著提高了机器人在制作咖啡和折叠衣物等任务中的表现。

π∗0.6——RL微调流式VLA π0.6:先基于演示数据做离线RL预训练,再在线RL后训练(与环境自主交互,从经验数据中学习,且必要时人工干预)

结构之法 算法之道
结构之法 算法之道 · 2025-11-18T15:13:09Z
走进全宇宙:开源物理引擎与OpenUSD推动机器人学习

NVIDIA的Newton物理引擎和Isaac GR00T模型通过OpenUSD加速机器人学习,支持人形机器人在复杂环境中高效操作。采用“模拟优先”方法,机器人可在虚拟环境中并行训练,提升技能,优化在工厂和公共场所的应用。

走进全宇宙:开源物理引擎与OpenUSD推动机器人学习

NVIDIA Blog
NVIDIA Blog · 2025-09-30T13:00:07Z

美国东北大学与波士顿动力RAI联合提出的HEP框架,通过坐标系转移接口实现机器人高效学习。该框架的分层结构提升了灵活性,自动适应空间变化,显著降低了数据依赖。实验结果显示,HEP在复杂任务中的成功率提升了60%,为未来多模态智能体集成提供了新路径。

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

量子位
量子位 · 2025-07-22T09:28:14Z
NVIDIA研究突破推动先进机器人运动

NVIDIA在亚特兰大国际机器人与自动化会议上展示了其在生成AI、仿真和自主操作方面的研究突破。这些创新将推动自主车辆和类人机器人的发展,提升安全性和控制能力,主要研究包括生成4D驾驶场景、实时感知故障监测和人机交互政策调整,旨在改善机器人学习和应用的可靠性。

NVIDIA研究突破推动先进机器人运动

NVIDIA Blog
NVIDIA Blog · 2025-05-19T15:00:53Z
迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准

RoboVerse是一个统一的机器人学习平台,解决了数据集和评估体系的碎片化问题。它提供MetaSim接口,支持多种仿真器,构建高质量合成数据集,并实现混合仿真,提升迁移效果。此外,平台支持遥操作和AI自动生成任务,显著提高研究效率与实验规模。

迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准

机器之心
机器之心 · 2025-04-08T10:38:12Z

本研究提出AutoEval系统,旨在全自动化评估机器人学习中的策略,提升评估效率与质量,并与人工评估高度一致,促进广泛应用。

AutoEval: Autonomous Evaluation of General Robot Operating Policies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了一种增强时间感知和任务完成感的方法,以应对预训练视觉表征(PVRs)在视觉-运动机器人学习中的挑战,显著提升了在分布外场景中的鲁棒性和机器人学习性能。

When Pre-trained Visual Representations Are Insufficient: Limitations in Visual-Motor Robot Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z
在开源冲刺中为Imagination-to-Real贡献力量!

Imagination-to-Real通过结合生成性AI和经典物理模拟器,提供真实、多样和几何准确的视觉数据,改变了机器人学习方式,帮助机器人训练复杂任务,并鼓励开源贡献。

在开源冲刺中为Imagination-to-Real贡献力量!

DEV Community
DEV Community · 2025-01-16T06:35:00Z

「新锐论前沿」第四期线上分享活动将于12月18日举行,普渡大学博士生徐政通将分享机器人学习中的数据高效触觉表征,介绍GelSight的应用,并探讨少量样本学习的可泛化触觉表征。活动还将进行抽奖,参与者有机会获得算力资源。

线上分享| 面向机器人学习的数据高效触觉表征

HyperAI超神经
HyperAI超神经 · 2024-12-17T03:09:29Z

本研究提出了一种自回归预训练方法Moto,旨在解决机器人学习中缺乏标记数据的问题。通过将视频内容转化为潜在运动标记序列,提升机器人在动态环境中的操控性能。

Moto: A Latent Motion Token as the Bridging Language for Robot Manipulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
机器人能从机器梦中学习吗?

麻省理工学院研究团队开发的“LucidSim”系统利用生成AI和物理模拟器,创建多样化的虚拟训练环境,帮助机器人在缺乏真实数据的情况下实现专家级表现。该系统有效解决了机器人学习中的“模拟与现实差距”问题,显著提升了机器人在复杂环境中的适应能力,研究显示成功率高达88%。

机器人能从机器梦中学习吗?

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2024-11-19T19:50:00Z

本文介绍了多个增强现实(AR)系统的研究进展,包括机器人学习可视化、用户体验优化、情境感知游戏、知识推理交互机制、文本简化系统和环境光照估计等。这些系统在教育、深度学习和用户交互中展现出显著潜力,能够提升用户体验和认知负荷。

智能增强现实(iAR)研究:上下文分类、iAR架构和实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出利普希茨常数作为提高神经网络在感知系统中对小规模干扰鲁棒性的关键指标,为安全的机器人学习系统提供理论基础。

Estimating Neural Network Robustness through Lipschitz Constants and Architecture Sensitivity

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文介绍了多种基于文本指导的3D物体交互生成方法,包括手物接触和运动生成。研究提出了一种新的神经网络架构,结合扩散模型和空间-时间抽象,提升了物体操纵和人机互动的真实感,显著提高了机器人学习性能。实验结果显示,这些方法在真实场景中表现优异,推动了语义感知机器人操作的发展。

隐式接触扩散器:基于潜在点云扩散的顺序接触推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文介绍了多个机器人学习和模拟框架,如gradSim、Differentiable Stereopsis、VRDP和DiffGen。这些框架通过可微分物理模拟和渲染,提升了机器人在视觉理解和物理模型推断方面的表现,研究表明其在真实场景中具有较高的成功率和鲁棒性,推动了机器人技术的发展。

可微分机器人渲染

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文探讨了现代生成模型在机器人学习中的应用,研究表明大型语言模型(LLMs)能够理解低级机器人控制,并在多任务中实现有效的技能学习。RoboGen通过生成仿真系统自动学习多种机器人技能,减少人类监督。此外,提出了新的评估框架,以促进人类动作生成模型的比较和评估。

生成机器人仿真评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码