端到端语音翻译的模态空间软对齐
原文约400字/词,阅读约需1分钟。发表于: 。使用软对齐方法进行端到端语音翻译,通过对抗训练对齐语音和文本之间的表示空间,提高翻译性能。
最近的研究提出了一种具有硬参数共享的ST/MT多任务框架,通过预处理阶段将语音和文本输入转换为离散令牌序列,减少了语音-文本模态差异。实验证明,该框架在MuST-C上提高了关注编码器-解码器、CTC、转录器和联合CTC/关注模型的BLEU分数。融入外部MT数据可以进一步提高性能。
使用软对齐方法进行端到端语音翻译,通过对抗训练对齐语音和文本之间的表示空间,提高翻译性能。
最近的研究提出了一种具有硬参数共享的ST/MT多任务框架,通过预处理阶段将语音和文本输入转换为离散令牌序列,减少了语音-文本模态差异。实验证明,该框架在MuST-C上提高了关注编码器-解码器、CTC、转录器和联合CTC/关注模型的BLEU分数。融入外部MT数据可以进一步提高性能。