小红花·文摘 - 小红花技术领袖俱乐部

清华大学研发了全球最大的双臂机器人扩散大模型RDT 2.1，旨在通过多机器人数据集进行预训练，并在特定双臂机器人上微调，以应对双手操作中的多模态性和数据异构性挑战。该模型结合了扩散建模和Transformer架构，整合视觉与语言输入，提升机器人在复杂任务中的表现。

RDT——清华开源的双臂机器人“扩散动作大模型”(基于DiT改造而成)：先预训练后微调，支持语言、图像、动作多种输入

结构之法算法之道 ·

清华开源全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶HF具身热榜

清华开源全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶HF具身热榜

机器之心 ·

该研究提出了多种机器人操作学习方法，如ROSIE数据扩充、RoboAgent多任务智能体和ManiCM实时操作模型，旨在提升机器人在新场景中的性能和鲁棒性。通过引入一致性约束和多模态数据，研究在双手灵巧操控和任务完成率方面取得了显著进展。

RDT-1B：用于双手操作的扩散基础模型

BriefGPT - AI 论文速递 ·