小红花·文摘

本研究提出了一种新的自监督微调方法，旨在从发音单元中分离说话者信息。该方法通过数据增强和帧级训练，在音节分段和质量度量上超越了现有技术，展示了无文本模型在音节组织中的有效性。

BriefGPT - AI 论文速递 ·

该研究介绍了如何在端到端语音翻译中引入目标语言上下文，以增强连贯性并克服扩展音频片段的内存限制。同时，提出了上下文丢弃以确保对上下文缺失的鲁棒性，并通过添加说话者信息进一步提高性能。研究表明，上下文信息主要有助于捕捉上下文风格，并解决指代和命名实体问题。

BriefGPT - AI 论文速递 ·