小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种名为ARCHIE的自主强化学习方法,利用GPT-4从自然语言任务描述生成奖励函数,解决复杂人机协作中的奖励函数设计难题。实验结果表明,该方法能够有效将人类可读文本转化为可部署的机器人技能。

Combining Autonomous Reinforcement Learning and Large Language Models for Real-World Robotic Manipulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z
速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据

研究团队提出了一种基于忆阻器的深度贝叶斯主动学习(DBAL)方法,显著提高了标记效率并降低了成本。该方法在内存计算框架中实现,相较于传统硬件速度提升44%,节能153倍,适用于机器人技能学习等任务。

速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据

机器之心
机器之心 · 2024-12-26T08:38:56Z

本研究提出了一种基于视频预测和深度强化学习的观察型模仿学习方法,能够从视频中学习机器人技能,如扫地和推物品。结合自然语言描述,提升了机器人在复杂环境中的操作能力。研究表明,该方法在多项任务中显著提高了成功率,并在真实世界中表现良好。

基于下一个令牌预测的上下文模仿学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-28T00:00:00Z

本研究探讨了通过多样化数据集提高机器人技能学习效率的方法,重点解决模仿学习、领域自适应和数据质量问题。研究表明,丰富的数据集可以显著提升机器人在新任务中的成功率,减少对新数据的需求,并提出了新颖的学习方法和模型。

重新混合:大规模模仿学习的数据混合优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了一种结合前瞻性搜索与基本技能的探索方法,旨在提高强化学习中的操作策略学习效率。通过无监督学习和互信息框架,提出了UPSIDE方法,以解决稀疏奖励任务中的探索问题。同时,研究探讨了语言模型在机器人技能发现中的应用,强调了技能在强化学习中的重要性和有效性。

单一目标足矣:技能与探索在无奖励、无示范或子目标的对比强化学习中涌现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-11T00:00:00Z

本文探讨了内在表征的多种方法,强调指示性基础在矢量基础问题中的重要性。研究发现,某些大语言模型能够克服这一问题,并提出了一种无监督的文本与图像对应关系方法,显著提高文本识别的准确性。此外,基于视觉语言感知的新方法能够高效学习机器人技能,减少数据需求。

无基础对齐问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本文介绍了XSkill模仿学习框架,通过分析人类和机器人操纵视频,提取可重用的机器人操作技能。该框架结合条件扩散策略和人类视频经验,显著提升了机器人在复杂任务中的表现,实验结果表明其性能优于传统方法。

R+X: 从日常人类视频中检索和执行

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

本文探讨了通过生成模型和强化学习提升机器人技能学习的方法,包括创建通用模拟器UniSim、数字双子和RialTo系统,以实现从模拟到现实的有效转移。研究提出了利用少量真实数据优化模拟模型的策略,并展示了在多个机器人操作任务中的有效性和性能提升。

IRASim:学习交互式真实机器人行为模拟器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文探讨了如何利用预训练视觉语言模型提升对象可承受性接地任务的性能,提出了多种方法,如超现实视角的特定元素分割、物体感知知识的学习以及图神经网络推理等。这些方法在处理复杂场景和新物体时表现出色,有效结合语言与物理世界的互动,提升机器人技能的学习效率。

WorldAfford: 基于自然语言指令的可实施性落地

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-21T00:00:00Z

该研究提出了DiffSkill框架,通过图像扩散模型和可微分物理模拟,自动生成机器人技能学习任务,减少人类监督。利用少量示范合成丰富数据集,提升机器人在长期任务中的表现。DiffVL方法允许用户通过自然语言描述操控任务,DiffusionBot则生成软体机器人形态,增强任务泛化能力。

DiffGen: 通过可微分物理仿真、可微分渲染和视觉 - 语言模型生成机器人演示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-12T00:00:00Z

本文提出了一种基于认知学“全球工作区”概念的神经网络架构,利用自监督训练进行输入对齐和翻译,应用于分类任务和转移学习。同时,研究了深度增强学习和多模态强化学习方法,以提高机器人技能获取和状态表示的效率,并验证了其在模拟和实际环境中的有效性。

通过全局工作区实现强化学习策略的零样本跨模态转移

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码