ChatGPT大概工作原理 - by Alex Xu

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

OpenAI没有提供所有细节,我们试图解释它的工作原理,分为训练和回答问题两部分。训练分为预训练和微调,微调包括收集训练数据、收集更多数据、使用强化学习微调模型。回答问题分为7步,包括内容审核、chatGPT模型、内容审核、模板响应生成等。OpenAI试图让ChatGPT模型能够准确回答问题。

🎯

关键要点

  • OpenAI没有提供所有细节,工作原理分为训练和回答问题两部分。
  • 训练分为预训练和微调两个阶段。
  • 预训练阶段使用互联网数据训练GPT模型,目的是预测句子的未来单词。
  • 微调阶段包括收集训练数据、收集更多数据和使用强化学习微调模型。
  • 回答问题的过程分为7步,包括用户输入、内容审核、模型生成响应和再次审核。
  • 内容审核确保问题和响应不违反安全准则。
  • 如果输入通过审核,响应将显示给用户;否则,显示模板答案。
🏷️

标签

➡️

继续阅读