小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种层次化强化学习方法，通过专家提供的抽象动态规划生成子目标，以提高复杂多任务环境中的决策效率。实验证明，该方法在样本效率、任务完成率和新场景泛化能力上优于现有方法，具有重要影响。

Learning with Expert Abstractions for Efficient Multi-Task Continuous Control

BriefGPT - AI 论文速递 ·

本研究提出了一种基于领导-追随策略的层次化强化学习框架，旨在提升多无人机空战中的协作性能。该框架通过优化角色分配和三层结构设计，有效应对高维动作空间的挑战，并在模拟实验中验证了其效果。

A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Based on Leader-Follower Strategy

BriefGPT - AI 论文速递 ·

该研究提出了基于大型语言模型（LLMs）的LI3D系统，集成了3D布局生成与验证功能。用户可以通过多模态大语言模型灵活生成3D场景，研究还展示了LLMs在布局理解和生成中的应用，提升了视觉问答系统的效率，并通过层次化强化学习优化了室内家具布局。

Chat2Layout: 交互式三维家具布局与多模态 LLM

BriefGPT - AI 论文速递 ·