结构之法算法之道 ·

P-Tuning微调、6B源码解读到ChatGLM2的微调与实现

💡 原文中文，约47300字，阅读约需113分钟。

📝

内容提要

Dolly 2.0是EleutherAI pythia模型系列的语言模型，参数为120亿。Databricks发布了名为databricks-dolly-15k的Dolly 2.0微调数据集，包含1.5万条记录，涵盖公开问答、封闭式问答、维基百科信息提取等7个任务。RedPajama是1.2万亿token的开源数据集，包含维基百科、GitHub等来源。COIG是首个大规模可商用的中文开源指令数据集。StableLM是开源语言模型，有3B和7B参数版本，应用于自然语言处理任务。还有其他可商用的模型。

🎯

关键要点

Dolly 2.0是EleutherAI pythia模型系列的语言模型，参数为120亿。
Databricks发布了名为databricks-dolly-15k的Dolly 2.0微调数据集，包含1.5万条记录，涵盖7个任务。
RedPajama是1.2万亿token的开源数据集，包含维基百科、GitHub等来源。
COIG是首个大规模可商用的中文开源指令数据集。
StableLM是开源语言模型，有3B和7B参数版本，应用于自然语言处理任务。
随着GPT4等多模态技术的推出，技术产品服务将被革新。
国内外推出了多种类ChatGPT开源项目，如LLaMA、BLOOM等。
GLM框架结合了自回归、自动编码和编码-解码模型的优点。
GLM的训练目标是自回归空格填充，兼容多种预训练目标。
GLM-130B是国内为数不多的可比肩GPT3的大模型之一，拥有1300亿参数。
ChatGLM-6B是基于GLM架构的对话语言模型，支持中英双语。
ChatGLM-6B的训练框架和部署步骤相对简单，支持多种量化方式。
通过Stanford Alpaca的52K数据集微调ChatGLM-6B，提升模型性能。
MOSS是复旦大学推出的支持中英双语的开源对话语言模型。
baichuan-7B是百川智能开发的开源可商用大规模预训练语言模型。
医疗类ChatGPT项目如ChatDoctor通过微调提升医疗领域的问答能力。
法律模型LawGPT_zh基于ChatGLM-6B微调，提升法律领域的表现。
可商用的数据集和模型如Dolly 2.0、RedPajama、COIG等，支持商业应用。

🏷️

继续阅读

在数据与人工智能峰会上亲身体验代理、氛围编码等更多内容
Databricks将在2026年6月14日至18日于旧金山举办数据与人工智能峰会，提供新培训课程和认证。提前注册可享受50%折扣，现场认证考试费用为10...
谷歌照片图像编辑器中的新修饰工具让您快速进行细微调整。
谷歌照片推出新的修饰工具，帮助用户快速改善照片效果，包括细化肤质、去除瑕疵、提亮眼睛和美白牙齿。用户只需选择面部并调整效果强度。这些工具正在全球范围内逐步...
《堡垒之夜》开发者现在可以创建AI角色——但请不要试图与他们约会
Epic Games在Fortnite中推出新的“对话”工具，允许开发者创建可与玩家互动的AI角色。该工具使用Google的Gemini 3.1模型处理音...
纪念克里斯托弗·亚历山大：1. 生命中心对自我导向教育的重要性
该文章内容为空，仅包含评论和网站功能提示，没有实质性信息。
Git 2.54 版本亮点
在人工智能时代，开源项目的维护者需要重新思考指导策略。3Cs框架帮助维护者更有效地进行指导，避免疲惫。GitHub正在投资开源安全，支持维护者并与Alph...
宣布丹尼尔·鲁格里为Apache软件基金会执行副总裁
Apache软件基金会任命丹尼尔·鲁格里为新任执行副总裁。他在社区中逐渐成长，曾担任ASF董事会成员，目标是通过服务型领导和运营卓越，确保组织顺利运作，并...

ChatGLM两代的部署/微调/实现：从基座GLM、ChatGLM的LoRA/P-Tuning微调、6B源码解读到ChatGLM2的微调与实现

内容提要

关键要点

标签

继续阅读