小红花·文摘

本文提出了一种新型多模态机器翻译框架，利用视觉上下文和对象掩模技术提升翻译效果。研究表明，该模型在多个数据集上优于现有方法，强调视觉信息在翻译中的重要性，并探讨多语言共享语义空间的构建。