鸟窝 ·

Harness Engineering：AI Agent 的工程实践

💡 原文中文，约18200字，阅读约需44分钟。

📝

内容提要

Harness Engineering 关注安全有效地构建 AI Agent，通过设计控制系统（如编排循环、工具系统和安全护栏）确保模型在执行任务时的安全性和可控性。Claude Code 是目前最完整的 Agent 产品，具备多层次的安全机制和灵活的配置管理。不同平台（如 Codex 和 Pi）在设计上各有侧重，适应不同应用场景。

🎯

关键要点

Harness Engineering 关注安全有效地构建 AI Agent，通过设计控制系统确保模型在执行任务时的安全性和可控性。
Claude Code 是目前最完整的 Agent 产品，具备多层次的安全机制和灵活的配置管理。
不同平台（如 Codex 和 Pi）在设计上各有侧重，适应不同应用场景。
Harness 的原意是马具，指的是控制基础设施，确保模型推理能力以外的所有约束和引导系统代码。
Claude Code 的 Harness 已演化成一套完整系统，包含31个生命周期事件、5种 hook 类型、4层配置继承、3种权限模式、bash 沙箱。
生产级 Agent 需要处理的十二个维度包括编排循环、工具系统、记忆管理、上下文管理、输出解析、状态管理、错误处理、安全护栏、验证循环、子 Agent 编排、安全机制。
Codex CLI 在 Harness 设计上走了不同的路，主要使用 Rust 代码，安全约束编译进二进制文件。
Pi Coding Agent 是一个最小化的终端编码 Agent，核心设计上刻意做小，依赖 TypeScript 扩展系统。
DeepSeek 正在组建全新的 Harness 团队，目标直指 Claude Code，表明 Harness 已成为 Agent 产品的核心基础设施。
构建 Agent 时需要逐个考虑十二个维度，确保安全性和可观测性。

🔎

延伸解读

Harness 的重要性

Harness 在 AI Agent 的构建中扮演着至关重要的角色。它不仅是控制系统的基础设施，还确保了模型在执行任务时的安全性和可控性。通过设计多层次的安全机制，Harness 能有效防止模型在操作中出现意外行为，降低潜在风险。

不同平台的设计差异

Claude Code、Codex 和 Pi 各自采用了不同的 Harness 设计理念。Claude Code 强调可编程性和灵活性，Codex 则注重安全性，采用 Rust 编译时约束，而 Pi 则选择最小化设计以便于嵌入现有应用。了解这些差异有助于选择适合特定应用场景的 Agent 平台。

构建 Agent 的关键维度

在构建 AI Agent 时，需要逐个考虑十二个维度，包括编排循环、工具系统和安全护栏等。这些维度不仅影响 Agent 的功能实现，还直接关系到其安全性和可观测性。开发者应在设计初期就明确每个维度的策略，以降低后续调整的复杂性。

❓

延伸问答

Harness Engineering 的主要目标是什么？

Harness Engineering 旨在安全有效地构建 AI Agent，通过设计控制系统确保模型在执行任务时的安全性和可控性。

Claude Code 有哪些安全机制？

Claude Code 具备多层次的安全机制，包括权限模型、Bash 沙箱和 hooks 策略拦截。

在构建 AI Agent 时需要考虑哪些维度？

构建 AI Agent 时需要考虑编排循环、工具系统、记忆管理、上下文管理、输出解析、状态管理、错误处理、安全护栏、验证循环、子 Agent 编排、安全机制等十二个维度。

Codex CLI 与 Claude Code 的设计有什么不同？

Codex CLI 主要使用 Rust 代码，安全约束编译进二进制文件，而 Claude Code 采用可编程的 hooks 和 JSON 配置实现灵活性。

Pi Coding Agent 的特点是什么？

Pi Coding Agent 是一个最小化的终端编码 Agent，核心设计上刻意做小，依赖 TypeScript 扩展系统。

如何确保 AI Agent 的可观测性？

可观测性可以通过记录工具调用频率、token 消耗曲线、Skill 激活链路、Hook 执行耗时等维度来实现。

🏷️