利用大型预训练模型与适配器混合进行领域泛化

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种适配器方法,可在多个不同领域中提高性能,同时提供了推理时间算法来推出新领域的泛化性能,成本较低。

🎯

关键要点

  • 提出了一种适配器方法,旨在提高多个不同领域的性能。
  • 该方法通过冻结预先训练的语言模型并与适配器权重组合,实现参数共享。
  • 实验结果表明,该方法在GPT-2和C4中表现出色,能够全面提高领域内性能。
  • 提供了一种推理时间算法,用于推测新领域的泛化性能。
  • 该方法在增加成本的情况下,仍能有效提升性能。
➡️

继续阅读