极道 ·

ChatGPT大概工作原理 - by Alex Xu

💡 原文中文，约700字，阅读约需2分钟。

📝

内容提要

OpenAI没有提供所有细节，我们试图解释它的工作原理，分为训练和回答问题两部分。训练分为预训练和微调，微调包括收集训练数据、收集更多数据、使用强化学习微调模型。回答问题分为7步，包括内容审核、chatGPT模型、内容审核、模板响应生成等。OpenAI试图让ChatGPT模型能够准确回答问题。

🎯

🏷️

一分钟读论文：Lean4Agent——用依赖类型语言验证 Agent 工作流
本文提出了一种使用Lean4语言对LLM Agent工作流进行形式化建模与验证的方法，克服了传统经验性测试的不足。主要贡献包括FormalAgentLib...
语言模型中的全局工作空间：Anthropic最新可解释性发现
Anthropic的研究揭示了Claude语言模型中的“J空间”，这是一个激活少量概念以进行推理的小型工作区。研究发现Claude能够在心中记住概念而不影...
Q1 2026 Innovation Graph update: Open source collaboration is accelerating worldwide
New Innovation Graph data shows global developer communities growing faster t...
Discord accidentally banned over 8,000 people for posting grids and other ‘benign’ images
Discord says a bug affecting its safety system caused it to mistakenly ban mo...
安克的噪音阻隔睡眠耳塞几乎打对折
You might have a great bed and a good sleepy time routine, but if you’re stil...
分布式 OLAP 查询引擎 — 系列规划
> 本文是写作规划，不是可发布正文。拆解对象分两层：查询优化与执行框架（Calcite / 规则与代价模型）与分布式 OLAP 引擎（Trino 主...