端到端语音到文本翻译中一致性正则化的实证研究
原文中文,约300字,阅读约需1分钟。发表于: 。通过经验研究,本文针对端到端语音转文本翻译提出了两种训练策略:SimRegCR 和 SimZeroCR,以实现一致性正则化的最新性能。在 MuST-C 基准测试中,在大多数翻译方向上,我们的方法取得了最先进的性能。分析证明,由内部一致性带来的正则化对于常规的端到端语音转文本翻译至关重要,而跨模态一致性可消除模态差异并提升零 - shot 端到端语音转文本翻译性能。
本文介绍了两种训练策略:SimRegCR和SimZeroCR,用于实现一致性正则化的最新性能。在MuST-C基准测试中,我们的方法取得了最先进的性能。分析证明,一致性正则化对于端到端语音转文本翻译至关重要,跨模态一致性可提升零-shot翻译性能。