英伟达发布的GR00T N1模型结合视觉与语言指令,通过双系统架构实现机器人动作生成。该模型利用真实与合成数据进行训练,采用Eagle-2 VLM作为推理模块,DiT模块用于高频动作输出。团队计划在上海建立具身算法开发团队,招聘经验丰富的开发者和实习生。
GR00T N1是一种通用人形机器人基础模型,结合视觉、语言和动作模块,能够理解环境并执行流畅动作。研究表明,该模型在多项测试中优于现有方法,并在实际应用中表现出色。
完成下面两步后,将自动完成登录并继续当前操作。