本文报告了第21届IWSLT会议的共享任务,涵盖口语翻译的七个科学挑战,包括同步和离线翻译、自动字幕和配音、语音到语音翻译、方言及低资源语言翻译等。共有18个团队参与,提交了26篇系统论文,显示出对口语翻译的日益关注。
本研究提出了一种小型连接模块(Q-Former),有效对齐预训练的自动语音识别(ASR)和机器翻译(MT)模型,显著提升翻译效果,具备良好的可扩展性和实用性。
评估口译服务的表现是一项复杂的任务,尤其是在应用自动评估方法时,本研究旨在通过分析自动度量与人工评估之间的相关性来评估同传口译的可靠性,结果表明 GPT 模型,特别是 GPT-3.5 具有最强的语义相似性相关性,即使在评估短文本片段时也是如此。
介绍了首次推出的 Fongbe 到法语语音翻译语料库 (FFSTC),该语料库包含约 31 小时的 Fongbe 语言内容,包括法语转录和相应的 Fongbe 语音录音,并通过使用 Fairseq 的 transformer_s 和 conformer 模型进行基线实验来评估数据质量和有效性,结果表明 transformer_s 模型得分 8.96,conformer 模型得分...
介绍了Spoken2Sign系统,将口语翻译成手语。系统包括创建手语视频字典、估计3D手语和训练Spoken2Sign模型。作者还证明了该方法的两个附带产品的辅助作用。
本文介绍了端到端的同时语音翻译(SST)系统,旨在提供实时的口语翻译。本文提出了一种在长篇设定中不进行预分割的端到端SST系统,并提出了应对这些挑战的方法。
完成下面两步后,将自动完成登录并继续当前操作。