高策 ·

从 vibe coding agent 到后训练，从零开始的实验科学

💡 原文中文，约6800字，阅读约需17分钟。

📝

内容提要

与做Agent的朋友交流后，发现主Agent需维护状态机以追踪环境和行为，但常遇到指令遵从和状态记忆丢失的问题。考虑通过后训练让模型学习状态机描述，以提升决策效率。在开发辅助A股投资的Agent时，发现多轮交互难以处理，需要更好的调试工具。最终通过后训练提升了模型表现，体验了后训练的过程。

🎯

🏷️

懂人性更懂执行，蚂蚁这个万亿开源模型把情商和Agent战斗力都给拉满了
蚂蚁推出的Ling-2.5-1T模型拥有万亿参数，具备高效执行力和情商，支持复杂推理和长文本处理，优化设计提升了Token效率，适用于多种Agent任务，...
New in Agent Builder: all new agent chat, file uploads + tool registry
LangSmith Agent Builder 更新了，新增中央“聊天”代理，支持文件上传并简化工具管理，用户可通过对话创建可重复使用的代理，提高工作效率。
Superpower Agent Skills in Gemini
我将 Claude Code 的 superpowers 技能迁移到 Gemini CLI，创建了 gemini-superpowers 项目，使 Gem...
苹果春季发布会前瞻：新 iPhone 三千块，新 MacBook 也是三千块？
买新不买旧。#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。爱范儿 | 原文链接 · 查看评论 · 新浪微博
从舞台秀到真干活，北京卫视春晚演绎机器人走向日常好用
霍尔曼亮相北京卫视
豆包 seedance 2.0 生成视频太惊艳了，除了水印比较难去除，其他堪称完美
春节前就听闻豆包的 seedance 2.0 模型生成视频完全可以假乱真。今天测试了一下，效果确实惊艳。起因是昨天初二从老家返程，高速上连续遇到三起在应急...