小红花·文摘

英伟达发布的GR00T N1模型结合视觉与语言指令，通过双系统架构实现机器人动作生成。该模型利用真实与合成数据进行训练，采用Eagle-2 VLM作为推理模块，DiT模块用于高频动作输出。团队计划在上海建立具身算法开发团队，招聘经验丰富的开发者和实习生。

结构之法算法之道 ·

GR00T N1是一种通用人形机器人基础模型，结合视觉、语言和动作模块，能够理解环境并执行流畅动作。研究表明，该模型在多项测试中优于现有方法，并在实际应用中表现出色。

BriefGPT - AI 论文速递 ·