小红花·文摘

本研究提出了一种基于大型语言模型的自动化混合奖励调度框架，旨在简化高自由度机器人技能学习中的奖励函数设计。实验结果表明，该方法在多个任务中平均提升了6.48%的性能。

Automated Hybrid Reward Scheduling for Robotic Skill Learning Based on Large Language Models

BriefGPT - AI 论文速递 ·

本文探讨了机器人技能学习中的数据重用，提出了多任务离线强化学习框架、自监督感知动作预训练方法和Skill Transformer方法，以提高机器人在新任务中的成功率并减少新数据集需求。此外，研究还提出了基于预测流的学习方法和身体变换器架构，优化了机器人学习过程，展示了不同机器人平台间的策略转移能力。

跨体学习的扩展：一个政策用于操控、导航、移动和航空

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLM）在机器人技能学习和任务规划中的应用。研究表明，LLM结合深度强化学习和社交机器人规划器，能够在复杂环境中高效执行任务，尤其在路径规划和人机交互方面表现出色，提升了用户满意度和实用性。

LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人

BriefGPT - AI 论文速递 ·