本文提出了一种新型多模态机器翻译框架,利用视觉上下文和对象掩模技术提升翻译效果。研究表明,该模型在多个数据集上优于现有方法,强调视觉信息在翻译中的重要性,并探讨多语言共享语义空间的构建。
完成下面两步后,将自动完成登录并继续当前操作。