本研究提出了一种新的任务:在实时3D场景中进行语言指导的物体放置。建立了基准和评估协议,并提供了训练数据集,首次提出了基线方法,以评估通用3D大语言模型的性能。
6-DoFusion是一个生成模型,可以在杂乱环境中生成物体的稳定配置,并进行物体放置和堆叠任务的评估。该模型的核心能力是机器人操控,能够推理出物体的稳定放置。
完成下面两步后,将自动完成登录并继续当前操作。