小红花·文摘

本研究提出了一种新颖的X-Sim框架，旨在克服跨躯体学习方法在处理人类与机器人动作差异时的局限性。X-Sim通过学习物体运动信号来优化机器人策略，显著提升多项操作任务的性能，并能适应现实世界的变化。

X-Sim：通过真实-模拟-真实的跨躯体学习

BriefGPT - AI 论文速递 ·

本研究提出了一种新的离散时间高斯过程混合模型（MiDiGap），用于机器人策略学习。该模型仅需五个演示和摄像头观察即可快速学习，在多项复杂任务中表现出色，显著提高了策略成功率和样本效率，具有重要的实用价值。

The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures in Robot Policy Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法FuSe，通过语言作为跨模态基础，微调通用机器人策略，解决了仅依赖视觉和本体感知的问题。实验结果表明，FuSe在复杂任务中的成功率提高了20%以上，显示出广泛的应用前景。

Beyond Vision: Empowering Generalist Robot Policies with Heterogeneous Sensors through Language Grounding

BriefGPT - AI 论文速递 ·

本研究提出了一种无政策依赖的强化学习（PA-RL）方法，旨在解决现有强化学习在不同策略适应性不足的问题。PA-RL通过通用监督学习损失替代传统的策略改进步骤，使机器人策略微调性能提升40%至70%，样本效率提高两倍。

Policy-Agnostic Reinforcement Learning: Offline and Online Fine-Tuning for Any Class and Structure

BriefGPT - AI 论文速递 ·

研究人员介绍了一个新的模拟基准测试COLOSSEUM，用于评估机器人策略对环境变化的适应能力。他们比较了4种操作模型，在环境扰动下的成功率下降了30-50%，同时应用多个扰动时，成功率下降≥75%。改变干扰对象的数量、目标对象的颜色或照明条件是最大程度降低模型性能的扰动因素。研究人员证明了模拟结果与真实实验中的类似扰动相关。他们公开了COLOSSEUM的使用代码，并发布了用于复制真实世界扰动的三维打印对象的代码。希望COLOSSEUM能成为评估操作泛化能力的基准。

THE COLOSSEUM: 机器人操作泛化评估基准

BriefGPT - AI 论文速递 ·