小红花·文摘

该文介绍了一种新颖的多模式机器翻译模型，利用平行的视觉和文本信息，通过视觉注意力锚定机制链接视觉和文本语义，并在多个数据集上取得了有竞争力的结果。作者还收集了一个新的多语言多模态产品描述数据集，用于模拟真实的国际在线购物场景，该模型在该数据集上表现出了显著优于其他方法的效果。