小红花·文摘 - 小红花技术领袖俱乐部

云栖发布：从级联到端到端语音翻译大模型Gummy

云栖发布：从级联到端到端语音翻译大模型Gummy

实时互动网 ·

本文介绍了一种改进的多任务学习方法，通过缓解长度和表征的差异来弥合模态间的差距，已在端到端语音翻译中取得显著改进。实验证明该方法达到了最先进的结果，并在使用额外数据时取得了新的最先进结果。

重思和改进端到端语音翻译的多任务学习

BriefGPT - AI 论文速递 ·

该研究介绍了如何在端到端语音翻译中引入目标语言上下文，以增强连贯性并克服扩展音频片段的内存限制。同时，提出了上下文丢弃以确保对上下文缺失的鲁棒性，并通过添加说话者信息进一步提高性能。研究表明，上下文信息主要有助于捕捉上下文风格，并解决指代和命名实体问题。

通过利用目标语言上下文提升端到端会话语音翻译

BriefGPT - AI 论文速递 ·