大语言模型的语音翻译:一个工业实践
原文中文,约300字,阅读约需1分钟。发表于: 。我们介绍了一种新颖有效的语音翻译模型 LLM-ST,它基于预训练的大型语言模型(LLM),通过将 LLM 与语音编码器集成并使用多任务指导调优,LLM-ST 能够准确地生成带时间戳的转录和翻译,甚至可以处理长时间的音频输入。此外,我们的研究结果表明,在 LLM-ST 的环境下使用 CoT 提示可以带来优势。通过对英语和中文数据集的严格实验,我们展示了 LLM-ST...
介绍了一种新的语音翻译模型LLM-ST,能够准确生成带时间戳的转录和翻译,并处理长时间的音频输入。实验结果显示,LLM-ST在语音翻译领域表现出卓越性能,使用CoT提示可以带来优势。