结构之法算法之道 ·

LLM高效参数微调方法：从Prefix Tuning、Prompt Tuning、P-Tuning V1/V2到LoRA、QLoRA(含对模型量化的解释)

💡 原文中文，约5500字，阅读约需14分钟。

📝

内容提要

LoRA是一种通过低秩方式调整参数矩阵的方法，用于适应特定任务。它的步骤包括选择目标层、初始化映射矩阵和逆映射矩阵、进行参数变换和模型微调。微软的DeepSpeed-Chat中也使用了LoRA方法。Huggingface的PEFT库封装了LoRA方法，可以高效适应下游任务并降低计算和存储成本。

🎯

关键要点

LoRA是一种通过低秩方式调整参数矩阵的方法，用于适应特定任务。
LoRA的步骤包括选择目标层、初始化映射矩阵和逆映射矩阵、进行参数变换和模型微调。
在LoRA中，映射矩阵A和逆映射矩阵B分别用于降维和升维。
在微调过程中，原始参数矩阵保持不变，只训练降维矩阵A与升维矩阵B。
微软的DeepSpeed-Chat中实现了LoRA方法，通过修改线性层为LoRA层来优化模型。
Huggingface的PEFT库封装了LoRA方法，使预训练语言模型高效适应下游任务，降低计算和存储成本。

🏷️

继续阅读

使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
将全球需求转化为收入的新方法
Stripe推出新产品，帮助企业应对跨境支付和合规挑战，提升客户体验和支付转化率。通过本地化支付方式和定价，企业可增加收入，并利用税务合规和反欺诈工具简化全球扩展。
LLM网关模式：每个基于Kubernetes的AI应用为何都需要它
LLM网关模式是一种架构方法，通过集中代理服务管理所有LLM API流量，解决了安全、成本和可见性问题。它简化了API密钥管理、请求路由和故障处理，提升了...
国家科学基金会续资麻省理工学院主导的人工智能与物理学研究所，扩展新的发现模式
麻省理工学院主导的人工智能与基础相互作用研究所（IAIFI）获得国家科学基金会续资，年资助额从400万美元增至498万美元。IAIFI致力于将人工智能与物...
Kaggle 使 AI 基准创建变得轻而易举
Kaggle Benchmarks推出本地开发功能，允许开发者在本地环境中创建和验证评估任务。该功能支持使用AI编码代理通过自然语言构建任务，旨在加速AI...
帮助出版商和创作者在搜索中突出展示他们的作品的新个人资料
谷歌推出搜索个人资料功能，帮助出版商和创作者展示内容，用户可通过移动设备关注创作者以获取更新。符合条件的出版商和创作者可以自定义个人资料，并可能触发知识面...

LLM高效参数微调方法：从Prefix Tuning、Prompt Tuning、P-Tuning V1/V2到LoRA、QLoRA(含对模型量化的解释)

内容提要

关键要点

标签

继续阅读