使用任务适配器混合来提升小型语言模型的多任务学习能力
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了机器翻译中适配器的组成方法,提出了新的组合方式以解决缺失语言问题,实现跨语言转移,提高翻译效果。
🎯
关键要点
- 研究机器翻译中适配器的组成方法。
- 旨在实现多领域和多语言的参数效率适配。
- 解决缺失语言问题,实现跨语言转移。
- 适配器通常由语言特定和领域特定的适配器组成。
- 简单组合适配器可能导致灾难性遗忘。
- 提出新的适配器组合方式以减轻遗忘问题。
- 最佳适配器组合方式在无场内数据的源语言上提高3-4BLEU。
- 在无场内数据的目标语言上结合反向翻译也有类似改进。
➡️