LoRA-Ensemble: 自注意力网络的高效不确定性建模
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们引入了一种基于低秩调整的参数高效深度集成方法,即LoRA-Ensemble。通过在预训练的自注意力网络中共享权重并训练成员特定的低秩矩阵,我们的方法在校准方面表现出优越性,并在各种预测任务和数据集上实现了相似或更好的准确性。
🎯
关键要点
- 引入了一种基于低秩调整的参数高效深度集成方法,称为LoRA-Ensemble。
- 该方法用于自注意力网络,通过共享预训练网络中的权重。
- 训练成员特定的低秩矩阵以提高模型的校准性能。
- 在多种预测任务和数据集上,LoRA-Ensemble实现了相似或更好的准确性。
➡️