高策 ·

从 vibe coding agent 到后训练，从零开始的实验科学

💡 原文中文，约6800字，阅读约需17分钟。

📝

内容提要

与做Agent的朋友交流后，发现主Agent需维护状态机以追踪环境状态，但常遇到指令遵循和状态记忆丢失的问题。考虑通过后训练让模型学习状态机描述，以提升决策效率。在开发辅助A股投资的Agent时，发现多轮交互处理困难，需要更好的调试工具。最终通过后训练提升了模型表现，获得了完整的训练体验。

🎯

🏷️

工程工具的构建
Birgitta在Thoughtworks担任工程师，探讨OpenAI的“Harness engineering”文章，描述团队如何利用AI构建大型应用的...
Laurie Spiegel谈算法音乐与‘人工智能’的区别
1986年，电子音乐先锋Laurie Spiegel创造了Music Mouse，用户可通过鼠标在XY网格上创作算法音乐。尽管简单，它能生成复杂旋律。经过...
草莓满月仪式和生产纪实短片
草莓满月仪式因春节提前至13号举行，记录了家庭生活的照片和视频。摄影师轩轩制作了精彩的纪实视频，成为满月礼物。
有了折叠手机，谁还需要笔记本电脑？
在使用手提电脑时，检查包内物品很重要。作者尝试将折叠手机与轻便键盘结合，发现这种组合比传统笔记本更轻便，适合短时间工作，方便携带，尽管存在应用兼容性问题。
Leapwork研究显示，软件测试中的AI仍然依赖于可靠性，而不仅仅是创新
Leapwork的研究显示，尽管对AI驱动的软件测试信心上升，准确性和稳定性仍是关键。调查中，88%的受访者认为AI是测试策略的优先事项，但仅12.6%在...
当几百万封爱泼斯坦案邮件接入 AI：你终于可以自己查了
爱泼斯坦案引发广泛关注，Jmail World网站允许用户以“杰弗里·爱泼斯坦”的身份浏览数百万封公开邮件，并通过AI查询，便于验证信息和传闻。