本研究提出了一种零样本目标位姿估计方法,利用评分函数实现对未见物体的泛化,实验结果显示该方法在复杂场景中优于传统方法。同时,研究探讨了开放词汇的物体姿态估计,结合视觉语言模型和大型语言模型,提升了对新对象的理解和导航能力。
完成下面两步后,将自动完成登录并继续当前操作。