LED合并:通过位置-选举-不相交方法缓解模型合并中的安全-效用冲突
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种LED合并框架,旨在解决大型语言模型微调中的安全性与效用之间的冲突。该框架通过识别关键神经元和隔离冲突更新,降低有害响应率,同时保持高效能,提供轻量级的多任务模型解决方案。
🎯
关键要点
- 本研究提出了一种LED合并框架,旨在解决大型语言模型微调中的安全性与效用之间的冲突。
- 该框架通过识别关键神经元和隔离冲突更新,降低有害响应率。
- LED合并框架在保持高效能的同时,提供轻量级的多任务模型解决方案。
- 实验表明,该方法有效降低了有害响应率,并在构建多任务大型语言模型方面无需训练。
➡️