[译][论文] InstructGPT:基于人类反馈训练语言模型遵从指令的能力(OpenAI,2022)
📝
内容提要
译者序 本文翻译自 2022 年 OpenAI 的论文: Training language models to follow instructions with human feedback, 整理翻译了其中感兴趣的部分。 大模型进化树,可以看到 InstructGPT 所处的年代和位置。来自 大语言模型(LLM)综述与实用指南(Amazon,2023)。 GPT ->...
🏷️
标签
➡️