大规模变形器的功能不变性水印
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种新的水印策略,通过在大型语言模型的量化过程中植入水印来保护模型权重,避免恶意使用违反开源大型语言模型的许可证。该方法已成功应用于GPT-Neo和LLaMA等开源大型语言模型。
🎯
关键要点
- 该论文提出了一种新颖的水印策略。
- 水印通过在大型语言模型的量化过程中植入,以保护模型权重。
- 该方法旨在避免恶意使用违反开源大型语言模型的许可证。
- 水印仅在使用 fp32 模式的模型中起作用。
- 在将模型量化为 int8 时,水印保持隐藏。
- 用户只能推理模型,无法进行监督微调。
- 成功将水印嵌入开源大型语言模型的权重中,包括 GPT-Neo 和 LLaMA。
- 希望该方法为保护大型语言模型权重提供潜在方向。
➡️