开源生态再扩容！LLaMA-Factory正式支持ERNIE-4.5全系列，实战单卡微调宝可梦图鉴

百度大脑 ·

开源生态再扩容！LLaMA-Factory正式支持ERNIE-4.5全系列，实战单卡微调宝可梦图鉴

💡 原文中文，约4700字，阅读约需12分钟。

📝

内容提要

文心大模型与LLaMA-Factory合作，支持ERNIE-4.5模型的微调。用户可通过简化流程和4-bit量化训练快速完成微调。案例展示了宝可梦角色识别任务，训练效果显著提升，模型适应性增强。

🎯

关键要点

文心大模型与LLaMA-Factory达成生态合作，支持ERNIE-4.5模型微调。
LLaMA-Factory是一个高效、易用的大型语言模型训练与微调框架。
用户可通过简化流程和4-bit量化训练快速完成微调。
案例展示了宝可梦角色识别任务，训练效果显著提升。
微调过程中，GPU显存占用被压缩至约20GB，前50个宝可梦数据集全流程微调耗时约40分钟。
用户需准备数据并组织成JSON文件，注册到LLaMA-Factory中。
通过yaml配置文件启动LoRA微调，关键参数包括模型路径和训练参数。
训练完成后需合并LoRA适配器权重与基础模型权重，以便部署。
训练损失函数下降，证明了模型在特定领域数据上的高效适配能力。
微调后模型表现出显著的领域适应性，生成的描述更贴近训练数据集中的详尽描述模式。
提供了完整的环境构建、数据处理及微调代码，便于开发者快速复用。

❓

延伸问答

LLaMA-Factory支持哪些模型的微调？

LLaMA-Factory支持ERNIE-4.5全系列开源模型的微调。

如何准备数据以进行微调？

用户需将数据组织成JSON文件，并注册到LLaMA-Factory的data目录下。

微调过程中显存占用是多少？

微调过程中，显存占用被压缩至约20GB。

微调后模型的表现如何？

微调后模型表现出显著的领域适应性，生成的描述更贴近训练数据集中的详尽描述模式。

如何启动LoRA微调？

用户只需一个yaml配置文件即可启动LoRA微调，包含模型路径和训练参数等关键配置。

微调的训练损失函数变化如何？

训练损失函数从初始的4.6迅速下降并收敛至2.5以下，证明了模型的高效适配能力。

🏷️

继续阅读

乐高的智能玩具宝可梦可以训练和战斗，但却无法实现我希望它们能做到的那件事
乐高推出第二代智能玩具“智能砖”，包含12个新的宝可梦套装，增强了互动性和战斗功能。尽管有新特性，但缺乏官方音效，无法发出宝可梦的名字。套装将于8月1日发...
Go 生态17年大浪淘沙：2026年最值得引入的10个“神仙级”QoL工具包
2026年，Go语言生态发生重大变革，推荐10个提升开发体验的工具包，包括sqlc（类型安全数据库编译器）、chi（轻量级路由器）、pgx（Postgre...
国际认可 | 绿盟科技入选2026《中国云AI原生安全生态导航》，定义智能时代数字安全底座
绿盟科技在Forrester发布的《云AI原生安全生态导航》报告中被推荐，展示了其在AI安全领域的技术优势。公司通过AI安全一体机提升了运营商的安全防护效...
在线教程丨英伟达开源LocateAnything，3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能
NVIDIA 最近推出了视觉语言定位模型LocateAnything-3B，拥有30亿参数，支持多种视觉定位任务。其核心创新为并行框解码（PBD），显著提...
字节开源统一框架Bernini：给DiT配个“大模型军师”，AI视频编辑先理解再动手
字节推出了开源视频生成与编辑框架Bernini，强调“先理解再生成”。该框架利用多模态大模型进行语义理解，并通过扩散模型实现高质量渲染，解决视频编辑中的一...
机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑
清华大学智能产业研究院推出了全新的机器人强化学习训练架构UniLab，打破了传统依赖GPU的训练模式。UniLab通过将仿真解耦到CPU侧，实现了更高的训...