cli-trainer Skill 上线,在 AI Agent 里一键微调大模型

cli-trainer Skill 上线,在 AI Agent 里一键微调大模型

💡 原文中文,约5800字,阅读约需14分钟。
📝

内容提要

星河社区推出cli-trainer,简化大模型微调流程。用户在AI IDE中输入需求后,系统自动完成环境检测、数据上传和训练提交,无需编写代码。支持多种模型和数据格式,训练后可通过API调用模型,旨在提升用户体验,减少操作步骤。

🎯

关键要点

  • 星河社区推出cli-trainer,简化大模型微调流程。

  • 用户在AI IDE中输入需求后,系统自动完成环境检测、数据上传和训练提交,无需编写代码。

  • cli-trainer支持多种模型和数据格式,训练后可通过API调用模型。

  • 用户需注册星河社区账号并获取Access Token,确保有训练所需的写权限。

  • 支持的模型包括ERNIE系列、DeepSeek系列、Qwen2.5系列等,后续将持续扩充。

  • 数据格式要求严格,文心系列需使用特定的JSONL格式,开源模型支持Alpaca和ShareGPT格式。

  • 整个微调流程包括环境自检、Token验证、选模型、验数据、准备数据集、推荐超参、提交训练和监控进度。

  • 训练成功后,Skill会输出训练报告并提供模型仓库地址,用户可直接调用训练好的模型。

延伸问答

cli-trainer的主要功能是什么?

cli-trainer简化了大模型的微调流程,用户只需在AI IDE中输入需求,系统会自动完成环境检测、数据上传和训练提交,无需编写代码。

使用cli-trainer需要哪些准备工作?

用户需要注册星河社区账号,获取Access Token,并准备训练数据集,数据集可以来自内置公开数据集或用户自定义上传。

cli-trainer支持哪些模型?

cli-trainer目前支持ERNIE系列、DeepSeek系列、Qwen2.5系列等主流模型,后续将持续扩充支持的模型列表。

如何确保训练数据格式正确?

训练数据格式要求严格,文心系列需使用特定的JSONL格式,开源模型支持Alpaca和ShareGPT格式,格式不对会导致训练失败。

cli-trainer的微调流程是怎样的?

微调流程包括环境自检、Token验证、选模型、验数据、准备数据集、推荐超参、提交训练和监控进度等步骤。

训练成功后用户能获得什么?

训练成功后,cli-trainer会输出训练报告并提供模型仓库地址,用户可以直接调用训练好的模型。

➡️

继续阅读