鹦鹉:多语言视觉指令调整
📝
内容提要
Parrot 是一种新方法,利用文本指导在语言级别驱动视觉令牌对齐,以增强多语言大型语言模型的多模态能力,并提供了一个大规模多语言多模态基准测试数据集(MMMB)。
🏷️
标签
➡️
Parrot 是一种新方法,利用文本指导在语言级别驱动视觉令牌对齐,以增强多语言大型语言模型的多模态能力,并提供了一个大规模多语言多模态基准测试数据集(MMMB)。