DEF-oriCORN:无演示的鲁棒性语言引导操控的高效三维场景理解
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
DEF-oriCORN是一个面向语言引导的操控任务的框架,通过利用新颖的场景表示和状态估计算法,实现高效且稳健的操控规划。DEF-oriCORN在稀疏的RGB图像上表现出优越的估计和运动规划性能,并能够零样本推广到现实场景。
🎯
关键要点
- DEF-oriCORN是一个面向语言引导的操控任务的框架。
- 该框架利用新颖的基于对象的场景表示和扩散模型的状态估计算法。
- DEF-oriCORN能够在回应口头指令时实现高效且稳健的操控规划。
- 框架在稀疏的RGB图像上表现出优越的估计和运动规划性能。
- 能够零样本推广到包括透明和反射物体在内的现实场景。
- 数据生成、训练、推理和预训练权重的代码完全开源。
🏷️
标签
➡️