小红花·文摘

我们需要多少KV缓存预算来支持LLM服务？

Home | KVCache.ai ·

KV缓存命中率模拟器

Home | KVCache.ai ·

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

量子位 ·

DeepSeek-Reasonix：缓存命中率90%的AI编程助手

极道 ·

SpecMD：关于推测性专家预取的综合研究

Apple Machine Learning Research ·

本文探讨了LLM提示词缓存的重要性，强调其在降低API调用成本中的作用。通过分析Claude Code的案例，指出静态前缀与动态后缀的区别，缓存的有效性依赖于前缀的稳定性。总结了三条规则以保持缓存命中率，并展示了高达92%的命中率和81%的成本节省，强调了缓存设计的重要性。

读 — Prompt Caching 省钱指南

暗无天日 ·

Claude提示词缓存完全指南：92%命中率案例与成本优化秘籍

极道 ·

WordPress 6.9 版本优化了查询结果缓存机制，取消将「最后修改时间戳」作为盐值，改为存储在缓存值内部，从而减少了无效缓存的生成，提高了缓存命中率。

WordPress 6.9 缓存优化：缓存查询结果的键不再使用最后修改时间作为盐值！

WordPress 果酱 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

广大、清华等开发EdgeAIGC，让边缘缓存命中率飙升41%，AIGC延迟与成本双降

机器之心 ·

视觉语言模型（VLMs）正在推动多模态理解与推理的发展。智谱AI与清华大学推出的GLM-4.1V-Thinking模型在STEM问题和视频理解等任务中表现出色，尤其在长文档理解和STEM推理方面与GPT-4o相当或更优，展现了强大的多功能性，推动了智能系统的进步。

AI 论文周报 | Chai-2刷新抗体设计效率，命中率提高100倍；多篇ICML入围论文一键速览

HyperAI超神经 ·

为什么你的缓存命中率策略需要更新

Redis Blog ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

命中率比前SOTA高100倍，Chai-2可在24孔板中实现零样本抗体发现

机器之心 ·

本文探讨了C++20协程的设计与优化，提出通过channel模型简化promise与awaitable的交互，减少atomic操作带来的性能损耗。实现了strong_rc_ptr和weak_rc_ptr智能指针，提升性能。压测结果显示，关闭atomic操作可提高20%-30%的性能，优化已发布。

协程(libcopp)的Channel功能和CPU命中率优化

I'm OWenT ·

揭开缓存内存的神秘面纱：技术深度解析

DEV Community ·

本文介绍了服务端缓存的设计和解决问题的方法，包括命中率、吞吐量、分布式支持和扩展功能等指标。缓存可以分为本地缓存和分布式缓存，也可以同时使用。缓存设计时需要考虑一致性和缓存穿透、击穿、雪崩等问题，并提出了相应的解决方案。缓存预热也是一种有效的方法。

缓存：高并发读的救世主

CodeSky ·

硬盘读取速度比RAM慢100,000倍，应尽量避免。数据库使用复杂技术提高性能和缓存数据。扫描整个表时，读取超过实际数据大小的数据会使过程变慢。数据库引擎有多种方法来提高性能。优化缓存命中率的关键是减少读取数据的量。

调试低缓存命中率

DEV Community ·

【Rust日报】2024-04-19 Egui 能够用于生产了吗？

Rust.cc ·

Caffeine使用自适应窗口技术，提高命中率。与其他策略相比，Caffeine在性能和可扩展性方面表现出竞争力。幽灵队列大小限制在主队列范围内效果较差。S3-FIFO在命中率上优于W-TinyLFU，但在lfu友好的轨迹上表现不佳。

缓存Caffeine与Sieve比较

极道 ·

本文介绍了如何通过监控不同指标来优化Memcached的使用效率和命中率，包括监控存储状态和使用情况，提供了Memcached Overview大盘和告警规则，以及针对命中率低和内存使用率高的排查方法和解决方案。同时，介绍了自建Prometheus监控Memcached的痛点。

统一观测丨使用 Prometheus 监控 Memcached 最佳实践

阿里云云栖号 ·

Kinsta使用Cloudflare Workers和Workers KV来提供缓存规则。他们定制了缓存键以解决不一致的响应，并实现了自己的Workers KV缓存逻辑。缓存TTL设置为30秒，减少了约80%的读取操作。

Kinsta如何利用Workers和Workers KV将缓存命中率提高56%

The Cloudflare Blog ·