华为云官方博客 ·

大模型高效开发的秘密武器：大模型低参微调套件MindSpore PET

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

华为云推出MindSpore PET套件，提供6种算法，包括5种低参微调算法和1种用于下游任务精度提升的微调算法。LoRA算法通过秩分解矩阵注入Transformer全连接层，节约计算和存储内存，提高训练性能。Prefix-Tuning算法通过注入可训练的prefix向量k、v，提升生成类任务的性能。R-Drop算法用于提升精度，防止过拟合。MindSpore PET套件提供API调用接口及使用案例，开箱即用。

🎯

关键要点

华为云推出MindSpore PET套件，提供6种算法，包括5种低参微调算法和1种精度提升算法。
LoRA算法通过秩分解矩阵注入Transformer全连接层，节约计算和存储内存，提高训练性能。
Prefix-Tuning算法通过注入可训练的prefix向量k、v，提升生成类任务的性能。
R-Drop算法用于提升精度，防止过拟合。
MindSpore PET套件提供API调用接口及使用案例，开箱即用。
MindSpore PET是基于昇思MindSpore AI融合框架开发的大模型低参微调套件。
低参微调算法只需微调极少量的参数，节约计算和存储内存，减少训练时间。
LoRA算法在悟空画画模型中应用效果显著，训练时间节约近50%。
Prefix-Tuning在GPT-2和盘古Alpha大模型上表现良好，节约65%以上的计算内存。
R-Drop通过“两次Dropout”构造正样本进行对比学习，提升模型正确率。

🏷️

继续阅读

AI数智时代：股票智能预测系统功能实战
本案例介绍了基于华为云码道的股票智能预测系统，利用Transformer算法和Tushare获取A股历史数据，预测未来5日价格。用户可通过可视化图表查看预...
保护每一次 AI 调用的隐私安全 — 面向企业和个人的大模型安全接入网关
智链 AI 网关在统一代理转发大模型 API 的基础上，内置**数据脱敏、隐私保护、全链路审计**三大安全能力，确保敏感信息不泄露、每次调用可追溯。支持 ...
国产大模型编码能力实测(GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro)
本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，...
石榴中尿石素A预防心脏病：抗动脉硬化，斑块变小更稳定！
尿石素A是一种由肠道细菌利用石榴来源的营养物质产生的化合物，它可能通过减少斑块积聚、减轻炎症和降低斑块破裂的可能性来帮助保护动脉。尿石素A似乎并非简单地...
Beacon Biosignals正在绘制睡眠中的大脑图谱
Founded by Jake Donoghue PhD ’19 and former MIT researcher Jarrett Revels, th...
通过语言提升理解力
麻省理工学院的学生Olivia Honeycutt研究语言对人类思维和社会互动的影响。她的研究结合计算机科学、语言学和神经科学，关注语言学习、教育政策和情...

大模型高效开发的秘密武器：大模型低参微调套件MindSpore PET

内容提要

关键要点

标签

继续阅读