本文介绍了两种训练策略:SimRegCR和SimZeroCR,用于实现一致性正则化的最新性能。在MuST-C基准测试中,我们的方法取得了最先进的性能。分析证明,一致性正则化对于端到端语音转文本翻译至关重要,跨模态一致性可提升零-shot翻译性能。
完成下面两步后,将自动完成登录并继续当前操作。