插入、播放和融合:通过词级重排序实现零样本联合解码跨多样词汇
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种新的零样本跨模态翻译方法,通过将多语言语音和文本编码到联合的固定大小的表示空间中,然后比较不同的解码方法以实现跨语言和模态的零样本翻译。该方法在多个文本和语音翻译任务中取得了非常好的结果,特别是在Must-C上零样本语音翻译部分显著改善了最新技术的表现。
🎯
关键要点
- 提出了一种新的零样本跨模态翻译方法。
- 将多语言语音和文本编码到联合的固定大小的表示空间中。
- 比较不同的解码方法以实现跨语言和模态的零样本翻译。
- 在多个文本和语音翻译任务中取得了非常好的结果。
- 在Must-C上零样本语音翻译部分显著改善了最新技术的表现。
- 引入了一个语音解码器,实现了零样本直接语音到语音和文本到语音的翻译。
➡️