小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

浙大与vivo合作推出LearnAct框架,通过示范学习使手机AI能够在多样场景中完成复杂操作,提升了AI性能,为个性化手机助手奠定基础。

一次示范就能终身掌握!让手机AI轻松搞定复杂操作丨浙大&vivo出品

量子位
量子位 · 2025-05-01T03:54:57Z

本文介绍了一种基于物体为中心的增强学习方法,用于训练软机械手进行复杂操作。该方法通过新算法实现示范学习,成功应用于RBO Hand 2,完成开关阀门和抓取等任务。同时,研究探讨了安全强化学习框架和模块化机器人操控平台,解决了软体机器人操作中的技能学习和硬件耐用性问题。

通过结合软硬机器人与模仿学习掌握接触丰富的任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文探讨了自由能原理与主动推理在机器学习中的应用,特别是在强化学习和示范学习中的结合。研究提出了预期自由能的数学基础,分析了探索与利用的平衡,并介绍了基于主动推理的深度强化学习理论及其在复杂任务中的应用,提供了新的算法和视角。

主动推理和部分可观测马尔可夫决策过程中的信息价值和奖励规范化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文介绍了多种强化学习技术,重点在于通过任务分解、适应性探索和示范学习来提高学习效率。这些方法在稀疏奖励环境中表现优越,能够加速机器人任务的学习和收敛。

DrS: 针对多阶段任务学习可重复使用的密集奖励

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-25T00:00:00Z

该文章讨论了在未知的随机马尔可夫环境或游戏中,从代理人的示范学习的问题。作者通过扩展逆强化学习方法,提出了一种估计代理人偏好并构建改进策略的方法。他们使用简化的概率模型和最大后验估计来处理这个问题,并发现该算法在与其他了解动态的逆强化学习方法相比具有很高的竞争力。

自动编码贝叶斯逆博弈

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

本研究利用半监督学习和示范学习技术,使机器人能够识别实物属性并生成所需运动。实验证明该方法在未知海绵上成功识别属性并生成擦拭运动,优于其他方法。通过机器人硬件验证模型生成的运动,并通过预训练触觉表示编码器提高实验结果的泛化能力。

DaFoEs:混合数据集以实现微创机器人手术视觉状态深度学习力估计的泛化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-17T00:00:00Z

该研究探讨了在未知的随机马尔可夫环境或游戏中代理人示范学习的问题。通过扩展逆强化学习方法,估计代理人的偏好并构建改进策略。通过简化概率模型处理演示者策略和效用,使用最大后验估计来解决凸优化问题。该算法在先验分布相同的情况下与其他了解动态的逆强化学习方法相比具有竞争力。

脱机环境的贝叶斯逆转移学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-09T00:00:00Z
会学习的机器人

研究人员开发了一种机器人系统,能够通过一次示范学习新任务。该系统包含视觉网络和模仿网络,前者处理图像,后者从示范中推断任务意图并在不同环境中执行。模仿网络经过多种任务训练后,能够在不同起始状态下完成任务,如堆叠彩色方块。

会学习的机器人

OpenAI
OpenAI · 2017-05-16T07:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码