本文介绍了一种名为三维对象领域适应的语言基础(DA4LG)的新方法,通过视觉适配器模块实现视觉-语言对齐。实验结果表明,DA4LG 在视觉和非视觉语言描述方面具有竞争力的性能,并在语言基础基准 SNARE 中达到了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。