小红花·文摘 - 小红花技术领袖俱乐部

如何构建专属语言的大语言模型 [完整手册]

如何构建专属语言的大语言模型 [完整手册]

freeCodeCamp.org ·

大模型训练应视为流水线，分为数据工程、预训练、中训、微调和对齐等阶段。每个环节有不同的算力需求和挑战，数据质量至关重要。预训练需处理大量干净数据以确保模型稳定性，中训通过调整数据配比提升能力，微调教会模型理解指令，对齐阶段则使用多种算法优化模型表现。整体训练过程复杂，需关注数据、算力和工程细节。

【大模型基础设施工程】05：训练全景：Pre-train、SFT、RLHF、DPO、蒸馏

土法炼钢兴趣小组的博客 ·

大语言模型微调实用指南

大语言模型微调实用指南

Databricks ·

人工智能基础

人工智能基础

OpenAI ·

LaCy：小型语言模型可以和应该学习的内容不仅仅是损失问题

LaCy：小型语言模型可以和应该学习的内容不仅仅是损失问题

Apple Machine Learning Research ·

你不知道的大模型训练：原理、路径与新实践

你不知道的大模型训练：原理、路径与新实践

Tw93 的博客 ·

从混合到专业领域的语言模型优化分割

从混合到专业领域的语言模型优化分割

Apple Machine Learning Research ·

$EgoScale——第一视角的2万小时人类标注数据扩展灵巧操作能力(提出人类数据下的缩放定律)：先大规模人类预训练，再人机对齐，最后单条示范微调$

EgoScale——第一视角的2万小时人类标注数据扩展灵巧操作能力(提出人类数据下的缩放定律)：先大规模人类预训练，再人机对齐，最后单条示范微调

结构之法算法之道 ·

何恺明团队新作GeoPT，全新预训练范式让模型自学真实物理规律

何恺明团队新作GeoPT，全新预训练范式让模型自学真实物理规律

量子位 ·

英伟达的Jim Fan认为，世界建模将成为新的预训练范式，预计在2026年对机器人和多模态AI领域产生重要影响。通过预测合理的世界状态，世界建模推动物理AI的发展，强调视觉推理的重要性，可能会改变机器人技术的基础。

英伟达Jim Fan：「世界建模」是新一代预训练范式

量子位 ·

你可能错过的五种时间序列基础模型

你可能错过的五种时间序列基础模型

KDnuggets ·

2026年时间序列工具包：5个基础模型实现自主预测

2026年时间序列工具包：5个基础模型实现自主预测

MachineLearningMastery.com ·

大语言模型的训练包括三个阶段：预训练、监督微调和强化学习。预训练通过大量文本学习语言规律，监督微调利用高质量问答对提升回答能力，强化学习则帮助模型建立符合人类期望的价值观。

用通俗的方式介绍大语言模型训练过程

安志合的学习博客 ·

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

云原生 ·

基于层次记忆的预训练：区分长尾知识与常识

基于层次记忆的预训练：区分长尾知识与常识

Apple Machine Learning Research ·

$PI发布的Human to Robot数采工作——头戴iPhone且手戴两相机采集数据：混合数据中像“用机器人数据一样”用人类数据，而无需显式对齐$

PI发布的Human to Robot数采工作——头戴iPhone且手戴两相机采集数据：混合数据中像“用机器人数据一样”用人类数据，而无需显式对齐

结构之法算法之道 ·

在本地GPU上预训练Llama模型

在本地GPU上预训练Llama模型

MachineLearningMastery.com ·

P5是一个统一的推荐系统框架，通过将用户交互、描述和评论等数据转化为自然语言序列，实现个性化推荐。它在预训练阶段学习多种任务，具备良好的零样本泛化能力，有效提升推荐系统性能。

[译][论文] P5 paper | 用语言模型做推荐：一种统一的预训练、个性化提示和预测范式（2022）

ARTHURCHIAO'S BLOG ·

以数据为中心的教训：改进语音语言预训练

以数据为中心的教训：改进语音语言预训练

Apple Machine Learning Research ·

构建Llama或GPT模型进行下一个标记预测

构建Llama或GPT模型进行下一个标记预测

MachineLearningMastery.com ·