本文介绍了针对参考图像分割(RIS)的创新方法,包括两阶段视觉提示增强网络(TV-Net)和双向掩蔽自编码器(BTMAE)。这些方法通过增强视觉信息、跨模态对齐和细粒度对应关系,显著提升了多个基准数据集上的分割性能,解决了视觉线索不足的问题。
完成下面两步后,将自动完成登录并继续当前操作。