本文报告了第21届IWSLT会议的共享任务,涵盖七个口语翻译的科学挑战,包括实时翻译、离线翻译、自动字幕和配音等。共有18个团队提交了26篇论文,反映出对口语翻译的关注日益增加。
本研究提出了一种小型连接模块(Q-Former),有效对齐预训练的自动语音识别(ASR)和机器翻译(MT)模型,显著提升翻译效果,具备良好的可扩展性和实用性。
通过两阶段训练方法,我们验证了在并行数据上预训练大型语言模型并进行微调的有效性。研究表明,交替使用源句和目标句对LLM翻译模型在口语翻译中的稳健性和准确性有重要影响,尤其是在数据量较少时。
评估口译服务的表现是一项复杂的任务,尤其是在应用自动评估方法时,本研究旨在通过分析自动度量与人工评估之间的相关性来评估同传口译的可靠性,结果表明 GPT 模型,特别是 GPT-3.5 具有最强的语义相似性相关性,即使在评估短文本片段时也是如此。
介绍了首次推出的 Fongbe 到法语语音翻译语料库 (FFSTC),该语料库包含约 31 小时的 Fongbe 语言内容,包括法语转录和相应的 Fongbe 语音录音,并通过使用 Fairseq 的 transformer_s 和 conformer 模型进行基线实验来评估数据质量和有效性,结果表明 transformer_s 模型得分 8.96,conformer 模型得分...
介绍了Spoken2Sign系统,将口语翻译成手语。系统包括创建手语视频字典、估计3D手语和训练Spoken2Sign模型。作者还证明了该方法的两个附带产品的辅助作用。
本文介绍了端到端的同时语音翻译(SST)系统,旨在提供实时的口语翻译。本文提出了一种在长篇设定中不进行预分割的端到端SST系统,并提出了应对这些挑战的方法。
完成下面两步后,将自动完成登录并继续当前操作。