小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种具身代理的分层框架，用于异构多机器人控制，旨在解决幻觉问题。该方法通过预测下一步动作和结构化记忆，将任务分解为可执行的机器人技能，并动态验证行动的环境适应性。实验结果表明，具身代理在现实场景中有效协调异构机器人，评估得分达到71.85%，展现了其长远目标的潜力。

具身代理：一种可扩展的分层方法以克服多机器人控制中的实际挑战

BriefGPT - AI 论文速递 ·

本研究提出组合约束概念，以提升具身代理系统的协作与训练数据生成效率，并开发了RoboFactory基准来评估模仿学习方法，推动多代理系统的安全高效发展。

RoboFactory: Exploring Collaboration and Compositional Constraints of Embodied Agents

BriefGPT - AI 论文速递 ·

本研究提出了EmbodiedBench基准，用于评估多模态大型语言模型（MLLM）在具身代理中的表现。结果显示，尽管MLLM在高层任务中表现良好，但在低层操控任务上存在显著不足，最佳模型GPT-4o的平均分仅为28.9%。

EmbodiedBench: A Comprehensive Benchmark for Multi-modal Large Language Models in Vision-driven Embodied Agents

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，将大型视频模型与连续动作结合，解决了缺乏具身代理的问题。结果表明，该框架在无外部监督下能有效完成复杂任务，优于专家演示的行为克隆基线，具有重要应用潜力。

Connecting Video Models with Actions through Goal-Conditioned Exploration

BriefGPT - AI 论文速递 ·