本文评估了视觉语言投射方法,并提出了认知视觉语言映射器(CVLM),通过视觉语言知识对齐改进多模态模型。实验证明,CVLM在知识型视觉问题回答上性能显著提升。
完成下面两步后,将自动完成登录并继续当前操作。