在 Amazon Bedrock 上为 Claude 应用设计稳健的 Prompt Cache 策略

亚马逊AWS官方博客 ·

在 Amazon Bedrock 上为 Claude 应用设计稳健的 Prompt Cache 策略

💡 原文中文，约10700字，阅读约需26分钟。

📝

内容提要

本文介绍了在 Amazon Bedrock 上为 Claude 应用设计的 Prompt Cache 策略，旨在降低输入成本和响应延迟，适用于长上下文应用。讨论了 cache checkpoint 的放置、内容块的定义及其限制，并提出了单个尾部 checkpoint 和三 CP 布局两种策略。建议监控使用情况，以优化性能和降低成本。

🎯

关键要点

在 Amazon Bedrock 上为 Claude 应用设计的 Prompt Cache 策略可以降低输入成本和响应延迟，适用于长上下文应用。
Prompt cache 缓存的是 prompt prefix，命中判断基于历史已缓存 checkpoint 的最长 prefix。
content block 是 Bedrock Converse API 中的基本元素，20-block 回看限制影响 cache 命中率。
推荐的布局策略包括单个尾部 checkpoint 和三 CP 布局，适用于不同复杂度的场景。
Claude 模型支持 extended thinking，建议保留完整 reasoningContent 和 signature，避免在 reasoningContent 后插入 cachePoint。
Prompt caching 的成本模型分为普通 input、cache write 和 cache read token，建议监控这些字段以优化性能。
上线后应记录使用情况，监控 cache hit rate 和各类 token 的使用，以便及时排障和优化策略。

❓

延伸问答

什么是 Prompt Cache 策略，它的主要目的是什么？

Prompt Cache 策略旨在降低长上下文应用的输入成本和响应延迟，特别适用于包含长系统提示和多轮历史的 Claude 应用。

在设计 Prompt Cache 时，推荐的布局策略有哪些？

推荐的布局策略包括单个尾部 checkpoint 和三 CP 布局，适用于不同复杂度的场景。

如何监控 Prompt Cache 的使用情况以优化性能？

建议监控 cache hit rate、inputTokens、cacheWriteInputTokens 和 cacheReadInputTokens，以便及时排障和优化策略。

什么是 content block，它在 Prompt Cache 中的作用是什么？

Content block 是 Bedrock Converse API 中的基本元素，影响 cache 命中率，20-block 回看限制约束当前 checkpoint 与最近可命中 checkpoint 的距离。

Prompt Cache 的成本模型是如何划分的？

Prompt Cache 的成本模型分为普通 input、cache write 和 cache read token，三者互不重叠。

在使用 Claude 模型时，如何处理 reasoningContent 和 cache checkpoint 的关系？

建议保留完整的 reasoningContent 和 signature，不要在 reasoningContent 后插入 cachePoint，以避免模型拒绝该位置。

🏷️

继续阅读

视频技术领域的静默革命
视频监控行业的压缩技术正在变化，AV1编解码器逐渐取代H.264，成为新标准。AV1在高分辨率视频压缩效率上提高了30%至50%，降低了带宽需求，提升了图...
RackNerd将在5月22日将DC02服务器物理迁移到DC03 迁移后IP地址会发生变更
云计算服务商RackNerd计划于5月22日晚进行服务器迁移，所有使用DC02机房的用户需提前备份数据。迁移将把服务器转移至洛杉矶DC03机房，预计停机时...
YoooClaw C·ONE 体验：为 AI Agent 而生的硬件，怎样构筑了数字化的「我」？
YooClaw推出的C·ONE智能卡片旨在提升AI交互体验，通过物理按钮和灯条简化通知管理，帮助用户专注工作。用户可通过自然语言设定通知优先级，避免手机干...
PolyAI 开放其智能对话平台，使数百家企业复杂对话背后的技术能够惠及所有开发者
PolyAI推出了一个智能对话平台，现向所有开发者开放，前两个月免费。该平台支持75种语言，适用于复杂企业对话，已被多家知名公司使用。开发者可以快速构建和...
索尼宣布自5月20日起提高PS Plus订阅会员价格影响按月或按季度订阅用户
索尼宣布自2026年5月20日起，PS Plus订阅价格将上涨。按月订阅价格从9.99美元涨至10.99美元，季度订阅从24.99美元涨至27.99美元。...
为视频制定 XR 战略
XR技术日益成熟，公众兴趣增加，但商业化应用仍需探索。分析机构预测未来二十年XR设备销量将大幅增长，视频服务提供商应尽早制定XR战略，以避免错失机会。不同...