通过大型语言模型和有限状态解码约束改善长篇演讲翻译
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究使用LLM将长ASR转录分割成可独立翻译的片段,以提高翻译质量。LLM可适应包含ASR错误的转录,最佳的LLM在9个测试集中将平均BLEU提高了2.9个点。
🎯
关键要点
- 该研究使用大型语言模型(LLM)将长ASR转录分割成可独立翻译的片段。
- 通过有限状态约束进行解码,以消除无效输出,最大化整体翻译质量。
- 采用提示调整或微调的方法,使LLM能够适应包含ASR错误的转录。
- 与现有自动标点基线相比,最佳的LLM在9个测试集的翻译中平均提高了2.9个BLEU点。
- 测试语言包括英语-德语、英语-西班牙语和英语-阿拉伯语的TED演讲翻译。
➡️