小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新的粗到细自回归策略学习框架(CARP),旨在提高机器人视觉运动策略学习的效率和灵活性。该框架通过多尺度表示学习和细化预测两个阶段,显著提升了动作生成的精度和流畅性,推理速度提高了10倍,并实现了竞争性的成功率。

CARP: Visuomotor Policy Learning Based on Coarse-to-Fine Autoregressive Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本文介绍了扩散策略在机器人视觉运动中的应用,强调其在多模态动作分布、高维输出空间和稳定训练方面的优势。扩散策略通过条件去噪生成机器人行为,结合闭环动作序列和视觉条件化,提升了动作一致性和实时推理能力。同时,文章探讨了Diff-Control的背景及其通过ControlNet整合状态信息以增强动作生成一致性的技术架构。

Diffusion Policy——斯坦福UMI所用的动作预测算法:基于扩散模型的扩散策略(从原理到其编码实现)

结构之法 算法之道
结构之法 算法之道 · 2024-11-09T13:53:57Z

本文探讨了机器人视觉表征学习的局限性,提出利用语义三维关键点和半监督训练的方法,以提升精度至毫米级。介绍了DIAL和Voltron等新方法,通过语言标签和多模态模型改善机器人学习能力,增强其在新指令和复杂任务中的表现。此外,研究了结合模仿与强化学习的方法,以提高机器人在新环境中的适应性和技能优化。

使用大型模型进行物体相关模仿学习的关键点抽象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文探讨了自监督学习在机器人视觉预训练中的应用,提出了Mask3D和M$^{3}$3D等方法,通过多视角视频和动态加权重构损失,提升模型对3D结构的理解,从而改善动作识别等任务的表现。

3D-MVP:用于机器人操纵的三维多视角预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

该研究提出了基于三维重建环境的机器人视觉和语言导航(Robo-VLN)的设定,并通过分层决策、模块化训练和分离推理和模仿的策略成功解决了这一新任务。研究者使用HCM代理展示了比现有基线效果更好的结果,为Robo-VLN创造了新的基准。

开放式多智能体导航的层次自动组织系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码