UC2是首个利用机器翻译增强的框架,用于跨语言跨模态表示学习。通过扩展英语数据集,引入多语言图像标题,实现语言对齐。提出了两种任务,加速图像与多语言嵌入学习。评估显示,该框架在多语言图像文本检索和视觉问答上表现出色,并在英语任务中保持优异性能。
UC2是一种跨语言跨模态表示学习框架,通过机器翻译引入其他语言的图像标题,提出了两个新的预训练任务,实现了新的最先进状态。
UC2是一个跨语言跨模态表示学习框架,通过引入其他语言的图像标题扩充数据集,提出两个新的预训练任务,实现了新的最先进状态。在多语言图像文本检索和多语言视觉问答基准上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。