dotNET跨平台 ·

如何实现 Claude Code 和 Codex 等 Agent CLI 的自动重试

💡 原文中文，约7800字，阅读约需19分钟。

📝

内容提要

本文探讨了Claude Code和Codex等Agent CLI的自动重试机制，强调重试不仅是简单的请求重发，还需考虑上下文的连续性和错误的可重试性。HagiCode提出了一种分层设计方案，通过共享协调器管理重试流程，确保在合适的上下文中进行重试，避免无效重复。关键在于设定重试边界、统一续跑提示，并进行镜像测试，以提高系统的稳定性和可维护性。

🎯

关键要点

自动重试不仅仅是简单的请求重发，还需考虑上下文的连续性和错误的可重试性。
HagiCode提出了一种分层设计方案，通过共享协调器管理重试流程，确保在合适的上下文中进行重试。
自动重试的难点在于如何在原上下文中继续，而不是简单的隔几秒再试一次。
重试策略需要有边界，系统必须知道最多尝试几次、每次间隔多久。
HagiCode的实现将重试从Provider中提取出来，统一管理重试流程，降低了接入成本。
重试预算必须有边界，避免自动重试变成事故放大器。
使用固定的continuation prompt，确保后续尝试明确走“继续当前上下文”的路径。
共享库和适配层都需要进行镜像测试，以确保系统的稳定性和可靠性。

❓

延伸问答

自动重试在Agent CLI中面临哪些挑战？

自动重试的挑战包括如何在原上下文中继续、识别可重试的错误、设定重试的边界，以及处理流式输出的复杂性。

HagiCode是如何管理自动重试流程的？

HagiCode通过共享协调器统一管理重试流程，确保在合适的上下文中进行重试，并降低接入成本。

为什么重试策略需要设定边界？

设定重试边界是为了避免自动重试变成事故放大器，确保系统在失败时能够合理地停止尝试。

如何确保后续尝试能够继续当前上下文？

使用固定的continuation prompt可以确保后续尝试明确走“继续当前上下文”的路径，而不是重新发起请求。

HagiCode的自动重试方案有哪些核心结构？

HagiCode的方案包括共享协调器、策略快照、上下文判定和镜像测试等核心结构。

在实现自动重试时，如何避免错误重试？

避免错误重试的关键在于识别可恢复的终态，并将其交给共享协调器处理，而不是盲目重试所有错误。

🏷️

继续阅读

Claude Code难度等级Low/Medium/High/Max完整对比与使用指南
Claude Code的难度等级分为Low、Medium、High、xhigh和Max。实际使用中，良好的上下文比高难度更重要。提高难度不一定能提升模型表...
Hermes Agent 使用指南
Hermes Agent是Nous Research开发的自我改进AI助手，具备持久记忆和自动技能进化能力，支持多种工具和平台，能够执行命令和浏览器操作。...
awesome-claude-design：68套Claude Design提示词一键生成完整UI界面
Awesome Claude Design是一个开源项目，提供68套预置设计系统文件。用户只需上传DESIGN.md文件，Claude即可自动生成完整的U...
Claude 在这个周末帮我翻新了博客
Claude 帮助作者翻新博客，更新了极简设计的主题 stuhouse，提升了用户体验，并整合了仓库，解决了技术债务问题。通过 OpenSpec 提案明确...
开发速度提升3倍：谷歌推出Android CLI 为AI智能体量身打造的命令行工具
谷歌推出了Android CLI命令行工具，旨在提升安卓应用开发效率，速度可提高约3倍。该工具为AI智能体提供标准化接口，简化开发流程，支持项目管理、虚拟...
Google 发布 Android CLI：官方 AI 开发工具，开发速度提升约 3 倍
谷歌发布了新的Android CLI工具，允许AI代理通过命令行进行安卓应用开发，提升开发效率。该工具简化了环境设置、项目创建和设备管理，速度比传统方法快...