BriefGPT - AI 论文速递 ·

LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文探讨了大型语言模型（LLM）在机器人技能学习和任务规划中的应用。研究表明，LLM结合深度强化学习和社交机器人规划器，能够在复杂环境中高效执行任务，尤其在路径规划和人机交互方面表现出色，提升了用户满意度和实用性。

🎯

❓

大型语言模型通过结合深度强化学习和社交机器人规划器，能够在复杂环境中高效执行任务，提升机器人自主决策和任务规划能力。

LLM-Planner方法在ALFRED数据集上的实验结果显示，其性能与全数据训练的基线模型相当。

LLM A *框架利用常识和效用最优的A *算法实现少样本近最优路径规划，具有更高的搜索效率。

社交机器人规划器（SRLM）结合大型语言模型和深度强化学习，通过实时人类指令推断全局规划，并将社交信息编码到导航模型中进行运动执行。

通过逻辑推理，将高层语言命令转化为可执行的运动函数序列，从而提高机器人自主决策能力。

研究表明，大型语言模型在社交机器人规划中的应用性能与定制模型相当，提供了一种新的建模方法。

🏷️