ARTHURCHIAO'S BLOG ·

[译][论文] InstructGPT：基于人类反馈训练语言模型遵从指令的能力（OpenAI，2022）

📝

内容提要

译者序本文翻译自 2022 年 OpenAI 的论文： Training language models to follow instructions with human feedback，整理翻译了其中感兴趣的部分。大模型进化树，可以看到 InstructGPT 所处的年代和位置。来自大语言模型（LLM）综述与实用指南（Amazon，2023）。 GPT ->...

🏷️

继续阅读

LWiAI播客第238期 - GPT 5.4迷你版、OpenAI转型、Mamba 3、注意力残差
本期节目讨论了最新的AI新闻，包括OpenAI的GPT-5.4发布、Mistral新模型、Meta与Nvidia的AI代理竞争，以及各大公司的业务与安全动态。
Sora走了，PixVerse V6来了！AI视频空间时间处理能力大增，延时拍摄、慢动作都能搞
PixVerse V6发布，提升AI视频沉浸感，支持延时拍摄和慢动作，具备电影级视听效果和真实音效。新功能包括团队计划和一键成片，旨在简化AI视频技术的使...
华为2025年全球销售收入8809亿元；360智能体发现OpenClaw高危漏洞；OpenAI完成1220亿美元融资
华为预计2025年全球销售收入达到8809.41亿元；字节跳动启动大模型人才招聘；360发现OpenClaw高危漏洞；巴菲特表示苹果股票卖得太早；Open...
1220亿美元！OpenAI创下史上最大单笔融资纪录
OpenAI完成1220亿美元融资，创下历史纪录，估值达8520亿美元。投资方包括亚马逊、英伟达和软银等，并首次向个人投资者开放，筹集超30亿美元。Ope...
早报｜Claude Code 50万行代码「被开源」/OpenAI最大融资落地，估值接近万亿/招行董事长：员工很少准点下班，企业文化是最大护城河
Claude Code源码泄露，包含未发布的「赛博宠物」和「永远在线」AI助手功能。苹果因软件问题短暂上线AI选项，现已修复。微信推出压缩包预览功能，用户...
派早报：Claude Code 源码意外泄露、OpenAI 获 1220 亿美元融资等
3月31日，Anthropic因发布Claude Code时错误包含源映射文件，导致近2000个TypeScript文件和51.2万行代码泄露。安全研究员...

[译][论文] InstructGPT：基于人类反馈训练语言模型遵从指令的能力（OpenAI，2022）

内容提要

标签

继续阅读