小红花·文摘 - 小红花技术领袖俱乐部

本文提出了一种优化大型语言模型微调性能的方法，结合高效适配器和中央处理器的内存优势，减少计算和通信负担。通过语言专家混合体架构，提升了参数高效微调（PEFT）的效果，尤其在资源有限的情况下，优于传统方法。研究还探讨了多任务迁移学习和自动配置框架的应用，强调了在不同任务中的有效性和性能优化。

专家坚持自己的领域：面向稀疏架构的专家专用微调技术

BriefGPT - AI 论文速递 ·

本文提出了一种参数高效微调（PEFT）框架，通过多任务迁移学习和适配器技术，显著提升了模型在新情境下的分割性能。研究表明，该方法在仅使用约1K额外参数的情况下，能够有效利用多任务知识，优化模型性能，尤其在医学图像分析和多模态任务中表现优异。

MoPEFT: 用于分割任何模型的 PEFT 混合模型

BriefGPT - AI 论文速递 ·

提出了一种新型参数高效调参方法（PEFT）框架，用于多模态、多任务迁移学习。通过LoRA、BitFit和IA3等技术，在几乎不需要可训练参数和GPU内存的情况下，展示了与预训练模型完全微调相当的性能。提出了Context-PEFT，根据令牌的领域学习不同的适配器参数组，实现类似LoRA的权重注入，无需额外的架构修改。在COCO字幕任务上评估，优于完全微调，并提供更高的参数效率和计算经济性的解决方案。

精调预训练大型语言模型中的稀疏是足够的

BriefGPT - AI 论文速递 ·