胡涂说 ·

周刊第16期: Andrej Karpathy 讲 AI

💡 原文中文，约11300字，阅读约需27分钟。

📝

内容提要

本期周刊介绍Andrej Karpathy的演讲，探讨软件3.0的概念及其与前两代软件的区别，分析ChatGPT的训练过程和能力边界，强调大模型如同操作系统，未来将通过人类语言重写代码。

🎯

关键要点

本期周刊介绍Andrej Karpathy的演讲，探讨软件3.0的概念及其与前两代软件的区别。
软件1.0是程序员为计算机编写的代码，软件2.0是基于神经网络的模型，而软件3.0则是通过提示词编程。
大模型被比作操作系统，具有基础设施的特征，用户按使用量计费。
大模型的部署成本高，当前阶段类似于1960年代的大型机时代。
Andrej Karpathy在YouTube上发布了关于大模型的深入讲解，涵盖预训练、微调和强化学习的过程。
预训练阶段包括数据收集、token化和神经网络训练，推理过程则是生成内容的过程。
监督微调（SFT）通过人工标注数据使基础模型能够进行对话，解决幻觉问题的方法包括使用工具调用和不确定性问题的数据集。
强化学习（RL）阶段让模型通过自我优化提升能力，RLHF则结合人类反馈来改进模型表现。
大模型未来可能发展为多模态、持续任务能力、工具深度集成和测试时学习等方向。
Andrej Karpathy分享了使用大模型的技巧，包括互联网搜索、深度研究、文件上传、Python解释器集成等。
大模型应用更新迭代迅速，各工具在不同领域竞争，用户需注意其能力边界。

❓

延伸问答

什么是软件3.0，它与前两代软件有什么区别？

软件3.0是通过提示词编程的新时代，区别于软件1.0的代码编写和软件2.0的神经网络模型。

Andrej Karpathy在演讲中提到大模型的部署成本高，为什么？

大模型的部署成本高，类似于1960年代的大型机时代，资源集中在云端，用户通过API调用。

大模型的训练过程包括哪些阶段？

大模型的训练过程包括预训练、监督微调和强化学习三个阶段。

如何缓解大模型的幻觉问题？

缓解幻觉问题的方法包括使用工具调用进行联网检索和在训练中增加不确定性问题的数据集。

Andrej Karpathy分享了哪些使用大模型的技巧？

他分享了互联网搜索、深度研究、文件上传和Python解释器集成等技巧。

大模型未来可能的发展方向是什么？

未来可能发展为多模态、持续任务能力、工具深度集成和测试时学习等方向。

🏷️

继续阅读

OpenAI合并ChatGPT和Codex，AI超级App路线浮出水面！
OpenAI合并了ChatGPT和Codex，推出了AI超级App，Codex用户已超过500万，其中20%为非开发者。新功能包括角色插件、网站和批注，旨...
使用本地大型语言模型进行自主编程
本文讨论了如何使用本地大型语言模型（LLM）进行编程，特别是在GitHub转向基于使用量计费后。作者分享了运行本地模型的步骤、配置代理的方法以及推荐的模型...
梦境：为更有帮助的ChatGPT提供更好的记忆
OpenAI推出了更强大的记忆系统，通过“梦境”功能自动更新用户信息，提高ChatGPT在互动中的时效性和准确性。该更新已向美国的Plus和Pro用户推出...
真重置！Codex因昨日连续发生的多次故障重置本周额度继续向后顺延7天
OpenAI的Codex于早上8点半完成了本周的额度重置，以补偿前一天的故障，这些故障影响了ChatGPT的登录和API调用。重置仅限于付费用户，下一次重...
[折扣代码] ChatGPT商业版向8个国家用户提供买1送1优惠至少开通2个席位
OpenAI推出ChatGPT商业版促销活动，用户开通两个席位可享买一送一优惠。该服务支持八个国家，价格从18英镑到25美元不等，印度区价格最低，约134...
早报｜曝苹果Vision Pro系列被砍/多地高考将查验智能眼镜/DeepSeek首轮融资规模约500亿元
苹果智能眼镜产品线调整，仅剩两款，Vision Pro系列被取消。DeepSeek计划融资500亿元，腾讯和宁德时代为主要投资者。高考将查验智能眼镜，考生...