Anjhon’s Blog ·

LLaMAFactory 微调实战

💡 原文中文，约16500字，阅读约需40分钟。

📝

内容提要

LLaMA Factory 是一个高效的语言模型训练与微调平台，支持无代码操作，用户可通过命令行或网页界面进行模型训练、评估和推理，兼容多种微调方法和量化技术，便于优化和部署模型。

🎯

❓

LLaMA Factory 是一个高效的语言模型训练与微调平台，支持无代码操作。

数据需要按照 LLaMAFactory 官方要求格式准备 json 或 jsonl 文件，并放置在指定路径下。

LLaMA Factory 兼容多种微调方法，包括 LoRA 和 qLoRA 等。

评估阶段需要观察损失曲线和最终损失，并通过预测/对话等方式测试效果。

推理可以通过命令行或网页进行，支持 Huggingface 和 vllm 推理引擎。

使用合并指令并配置合并参数，将 LoRA 权重与原始模型权重融合生成完整模型。

🏷️

开源社区“内战”爆发：Bun 创始人预言“未来将禁止人类贡献”，硅谷大佬纷纷站队！
本文永久链接 – https://tonybai.com/2026/05/01/open-source-civil-war-bun-founder-pre...
在Kubernetes中管理Valkey集群
Over the last several years, Percona has introduced several rock-star Kuberne...
马斯克与奥特曼的案件中，陪审团离开房间时发生了最疯狂的事情
在马斯克与奥特曼的法庭斗争中，马斯克的财务经理比查尔提到，奥特曼在谈判中可能低估了OpenAI的非营利资产。马斯克领导的联盟曾提出974亿美元的收购报价，...
网友吐槽：OpenClaw又触发了Claude Code当场翻脸还扣钱！
有趣的是，如果你最近的提交中在 JSON 数据块里提到了 OpenClaw，Claude Code 要么会拒绝你的请求，要么会额外收费。一句“openc...
Christophe Pettus: On pgvectorscale, and Hybrid Search Without an Elasticsearch Sidecar
pgvector is excellent. It is also, at large scale, expensive — because the HN...
保罗·梅尔基奥雷：Posette 2026
Posette 2026是一个免费的虚拟开发者活动，专注于PostgreSQL生成列的应用与演变。活动将通过实际案例探讨生成列的性能、存储和查询行为，并结...