小红花·文摘

本文介绍了一种简单的视觉模仿学习方法，可以从人类演示中学习机器人操作任务，无需先前了解对象交互情况，并通过自监督学习进行训练。该方法将模仿学习建模为状态估计问题，通过自动移动末端执行器的摄像头围绕对象进行自监督训练。实验结果表明，该方法可以从单个人类演示中学习多样的技能，并产生稳定且可解释的控制器。

SWBT：基于相似度加权行为变换和不完全演示的机器人操作

BriefGPT - AI 论文速递 ·

本文介绍了一种简单的视觉模仿学习方法，可以从人类演示中学习机器人操作任务，无需先前了解与对象的交互情况，并通过自监督学习进行训练。该方法将模仿学习建模为状态估计问题，在自监督训练中让摄像头自动移动。实验结果表明，该方法可以从单个人类演示中学习多样的技能，并产生稳定且可解释的控制器。

机器人模仿人类动作

BriefGPT - AI 论文速递 ·

本研究探讨了基于真实世界数据的视觉预训练对机器人操作任务的影响，并提出了一种名为Vi-PRoM的方案，结合了自监督学习和监督学习。实验证明了该方案的优越性。

大规模视频生成预训练在视觉机器人操作中的应用

BriefGPT - AI 论文速递 ·

本文提出了一种名为LAMP的方法，利用Vision-Language Models的零样本能力作为预训练工具，生成探索奖励，以获得受语言条件约束的预训练策略。该方法可以在RLBench的机器人操作任务上启动样本效率高的学习。

释放预训练语言模型在离线强化学习中的能力

BriefGPT - AI 论文速递 ·

该研究提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题，并在机器人操作任务中进行了基准测试。该方法在各种挑战性的操纵任务中取得了93%的成功率，并证明了模拟器训练的策略在真实场景中的视觉变化下具有更好的鲁棒性。

BayRnTune: 自适应贝叶斯领域随机化策略微调

BriefGPT - AI 论文速递 ·

该文介绍了一种用于视觉模仿学习的简单方法，可以从一个人类演示中学习机器人操作任务，通过自监督学习进行训练。该方法将模仿学习建模为状态估计问题，在自监督训练过程中让末端执行器的摄像头围绕对象自动移动。

模仿大师：探索虚拟 AI 教师在精细运动技能习得中的有效性

BriefGPT - AI 论文速递 ·

该研究提出了一种利用少量演示数据协助深度强化学习代理的方法，并将其应用于机器人操作任务。实验结果表明，该方法相比仅使用强化学习或模仿学习训练代理的方法，取得了显著的性能提高，并且在模拟到现实世界的零样本情况下也能获得初步的成功。

通过密集对应学习从无行为视频中行动

BriefGPT - AI 论文速递 ·

使用稀疏自编码器解释 RLHF 调整的语言模型中的奖励模型

BriefGPT - AI 论文速递 ·

该文介绍了DSR-Net模型，一种用于三维动态场景表示的方法，能够实现3D场景动力学建模，为机器人操作任务提供准确规划。该方法能够发现、跟踪、重构对象及预测其动态，性能表现较高。

学习无标记可变形线性物体的准静态三维模型，用于双手机器人操纵

BriefGPT - AI 论文速递 ·

本文提出了一种名为LAMP的方法，利用基于学习的奖励函数和Vision-Language Models的零样本能力作为强化学习的预训练工具，以获得受语言条件约束的预训练策略。LAMP可以在RLBench的机器人操作任务上启动样本效率高的学习。

自我完善的大型语言模型作为机器人深度强化学习的自动奖励函数设计耠

BriefGPT - AI 论文速递 ·