本文提出了多种新方法和数据集,以提高多模态机器翻译的质量,解决数据不足的问题。研究表明,基于数据扩充的语音翻译方法M^3ST在MuST-C基准上表现优异,BLEU得分达到29.9。此外,Tri-Modal Translation模型在语音、图像和文本之间的翻译中表现出色,显示出统一任务的实用性和性能优势。
完成下面两步后,将自动完成登录并继续当前操作。