➡️
继续阅读
-
architect-loop:把Claude当建筑师 GPT当工人 仓库即记忆
architect-loop是一个协作框架,将AI模型分为建筑师(Claude Fable)和工人(GPT-5.5 Codex)。通过规格说明、验收标准和...
-
《GPT 图解》笔记:微调与RLHF、总结
本文讨论了微调和人类反馈强化学习(RLHF)在GPT模型训练中的应用。微调通过特定对话数据优化模型,RLHF则通过监督学习和人类偏好评分提升回答质量。作者...
-
为什么谷歌Gemma 12B写东西比GPT-5更像真人?小模型的逆袭
谷歌的Gemma模型通过使用Gmail等私有数据进行训练,展现出更自然的对话能力。相比于大型模型,Gemma因参数较少,保留了人类的语言本能,更贴近真实对...
-
Claude Fable在一次编码测试中花费9美元,而GPT-5.5则花费1.50美元。模型筛选是新的AI技能。
文章讨论了人工智能(AI)模型的选择和使用策略,强调掌握AI技能的重要性。Anthropic公司因遵循美国政府的出口控制指令,暂时禁用了Fable 5和M...
-
《GPT 图解》笔记:GPT-从 Decoder 到自回归文本生成
本文讨论了GPT模型的结构及其自回归文本生成过程。GPT基于Decoder架构,采用贪婪解码和集束搜索策略生成文本。通过右移输入实现自回归,模型将输入和输...
-
AI 博客问题挑战
文章讨论了作者对人工智能(AI)模型的看法,特别是深度学习和语言模型的演变。作者认为AI在提升生产力方面具有潜力,但也对其对人类福祉的影响表示担忧。尽管存...