翻译动态 ·

语音对语音翻译：DeepMind部署新方法训练 Translatotron 3

💡 原文中文，约900字，阅读约需2分钟。

📝

内容提要

谷歌研究人员宣布了Translatotron 3，一种直接语音到语音翻译的模型。它提高了翻译准确性并保留了副语言和非语言信息。Translatotron 3可以捕获停顿、语速、语调等非语言信息，可能在该领域建立新标准。

🎯

关键要点

谷歌研究人员宣布了Translatotron 3，直接语音到语音翻译的模型。
Translatotron 3是Translatotron 2的增强版，实现了完全无监督的端对端模型。
传统S2ST方法依赖于级联技术，而Translatotron 3采用新颖的端对端架构。
Translatotron 3在性能上优于级联同类产品，改进了18.14 BLEU点。
该模型有效保留副语言和非语言信息，成功传输输入语音的固有特征。
Translatotron 3能够捕获停顿、语速、语调等非语言信息，可能在该领域建立新标准。
无监督训练的发展可能影响未来S2ST模型的训练方式。

🏷️

标签

Translatotron 3 deepmind 副语言信息翻译准确性语音翻译非语言信息

➡️

继续阅读

AI 时代的真正竞争力：一个语音按钮与一套可进化的 Harness
XMOS推出搭载先进AI语音处理的VocalFusion XVF3620
XMOS 发布了新一代语音处理器 VocalFusion XVF3620，它将 AI 降噪技术与完整的片上语音处理流程相结合，即使在嘈杂、混响和动态环境中...
物理AI的闭环，终于有人跑通了：日冕+远图万台级部署计划官宣
按照规划，日冕和远图将首先在服务器制造场景验证超级工站能力，随后向更多生产环节扩展。2027年完成百台级部署，未来实现万台级具身智能产品部署。
法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
Q2 2026 earnings call: Remarks from our CEO
Read an edited transcript of Sundar Pichai’s remarks from the Q2 2026 Alphabe...
Django 6.1 release candidate 1 released
Django 6.1 release candidate 1 is now available. It represents the final oppo...