暗无天日 ·

读 — Prompt Caching 省钱指南

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

本文探讨了LLM提示词缓存的重要性，强调其在降低API调用成本中的作用。通过分析Claude Code的案例，指出静态前缀与动态后缀的区别，缓存的有效性依赖于前缀的稳定性。总结了三条规则以保持缓存命中率，并展示了高达92%的命中率和81%的成本节省，强调了缓存设计的重要性。

🎯

❓

提示词缓存是降低API调用成本的基础设施特性，通过存储计算结果，避免重复计算，从而节省费用。

静态前缀是系统指令和工具定义等不变部分，而动态后缀是用户消息和助手回复等变化部分。

保持前缀不变，不修改工具定义和不切换模型是提高缓存命中率的三条规则。

Claude Code实现了92%的缓存命中率和81%的成本节省，展示了有效的缓存设计的重要性。

哈希敏感性指的是任何顺序变化都会导致缓存未命中，因此设计时需谨慎。

通过检查API响应中的写入和读取token数，可以计算缓存效率并验证其正常工作。

🏷️

2026年广告合规实战指南：市场监管总局半年整治行动下，投手的自查清单与合规出价策略
市场监管总局启动互联网广告整治行动，提出“互联网广告生态治理”概念，重点监管AI广告和直播电商。广告需标注AI生成，严禁伪造名人形象。投放前需自查素材合规...
API设计中的异步模式指南
本文讨论了API设计中的异步模式，指出传统请求-响应模型的局限性。介绍了短轮询、长轮询、服务器推送事件和WebSockets等异步API模式，适用于处理长...
How World Bank Group uses databricks to eradicate poverty through shared knowledge
The World Bank Group's mission is to improve shared prosperity across the...
特朗普手机尚未到货
Where's the Trump phone? We're going to keep talking about it every w...
文学界尚未为人工智能做好准备
Since 2012, the British literary magazine Granta has published the regional w...
面瘫恢复报告
距离被诊断面瘫（贝尔麻痹）刚好一个月，所幸这一个月以来恢复得挺不错，目前已经基本恢复正常。现就治疗和恢复过程作一个简单的记录。