本研究提出了一种结合视觉语言推理与无监督领域适应的方法,解决了现有分割模型在训练时的类别限制。通过多尺度数据和增强文本嵌入,构建了首个无需共享类别的UDA-FROVSS框架,有效提升了细粒度分割能力。
本文提出了一种名为Reasoning3D的基于零样本推理的3D分割新任务,旨在搜索和定位物体部件。该方法结合了预训练的二维分割网络和大型语言模型,能够理解复杂命令并进行细粒度分割,适用于机器人、AR/VR和医疗等多个领域。
完成下面两步后,将自动完成登录并继续当前操作。