Harness Cheatsheet

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

Harness 是一个确保模型按预期运行的框架,分为产品侧和用户侧。产品侧关注 Agent 产品设计,用户侧则关注开发者在复杂项目中的应用。随着模型能力的变化,Harness 也需进行调整,用户侧的实践包括 SDD 和 TDD,以确保项目结构、文档同步和状态控制,降低任务难度并确保输出符合标准。

🎯

关键要点

  • Harness 是一个确保模型按预期行为运行的框架,分为产品侧和用户侧。
  • 产品侧关注 Agent 产品设计,用户侧关注开发者在复杂项目中的应用。
  • 随着模型能力的变化,Harness 也需进行调整。
  • 用户侧的实践包括 SDD(规格驱动)和 TDD(测试驱动),以确保项目结构和文档同步。
  • 状态控制包括进度状态记录和会话交接文档,确保新 session 无缝衔接。
  • 采用原子性原则,一次一任务和频繁 git 提交,降低任务难度,方便回滚与审计。
  • 通过独立 reviewer 和自动测试,确保 Agent 输出符合验收标准。
➡️

继续阅读