LoRA-Guard:大型语言模型内容审核的参数高效护栏适应
原文中文,约400字,阅读约需1分钟。发表于: 。LoRA-Guard 是一种参数高效的防护栏适应方法,它通过 LLMs 和防护模型之间的知识共享提取语言特征,并使用低秩适配器适应内容调节任务,双路径设计防止生成任务性能降低。它在保持准确性的同时,有效降低参数开销,实现了设备上的内容调节。
该研究提出了一种新的LLM服务范例,通过在边缘设备上进行隐私敏感计算并在云端共享计算,实现了数据本地性。核心创新PrivateLoRA通过利用低秩性质实现了高效的通信减少。在5G网络下,PrivateLoRA在7B模型上的吞吐量达到了设备独立解决方案的300%以上。同时,PrivateLoRA还提供了与LoRA相媲美的调优性能,为边缘设备提供先进的生成式人工智能和个性化的LLM体验。这是文献中第一个高效且保护隐私的LLM解决方案。