小红花·文摘 - 小红花技术领袖俱乐部

在 Amazon Bedrock 上为 Claude 应用设计稳健的 Prompt Cache 策略

在 Amazon Bedrock 上为 Claude 应用设计稳健的 Prompt Cache 策略

亚马逊AWS官方博客 ·

Two recent Linux kernel vulnerabilities have been disclosed: Copy Fail (CVE-2026-31431) on April 29, 2026, and Dirty Frag (CVE-2026-43284 and CVE-2026-43500) on May 7, 2026. Both allow local users...

Copy Fail and Dirty Frag: Linux Page-Cache Exploits Target Every Major Distribution

InfoQ ·

Netflix improves Apache Druid performance with interval aware caching, serving 84% of analytics results from cache and reducing query load by 33%. The system decomposes rolling window queries into...

Netflix Serves 84% of Query Results from Cache with Interval-Aware Caching in Apache Druid

InfoQ ·

理解 KV Cache：Attention、P/D 分离与 vLLM 的页式显存管理

理解 KV Cache：Attention、P/D 分离与 vLLM 的页式显存管理

Steins;Lab ·

Cloudflare recently introduced its Gen 13 servers, marking a shift in how its network handles traffic. Instead of relying on large CPU caches for speed, the company redesigned its software to...

Cloudflare Optimizes Edge Stack for High-Core CPUs instead of Large Cache

InfoQ ·

Cloudflare and ETH Zurich highlight how AI-driven crawler traffic challenges traditional caching in CDNs and databases. They propose AI-aware strategies including separate cache tiers, adaptive...

Cloudflare and ETH Zurich Outline Approaches for AI-Driven Cache Optimization

InfoQ ·

Claude Code的fork子agent通过共享缓存机制优化并行任务成本，确保99%以上的字节一致性，显著降低输入费用。使用Anthropic API的Prompt Cache机制，缓存命中可享受90%折扣，减少并行调用成本。设计强调字节级一致性，确保多个请求共享相同前缀，避免不必要费用。

子Agent省90%费用的Prompt Cache共享机制

Finisky Garden ·

$Fast-WAM——训练时保留视频联合训练(虽同时生成但动作token不看视频token)，在推理时则移除显式的未来视频生成，直接在单次前向中，依托得到的潜在世界表征KV Cache预测动作$

Fast-WAM——训练时保留视频联合训练(虽同时生成但动作token不看视频token)，在推理时则移除显式的未来视频生成，直接在单次前向中，依托得到的潜在世界表征KV Cache预测动作

结构之法算法之道 ·

PostgreSQL的查询规划器在执行预处理语句时，前五次使用自定义计划，第六次可能切换到通用计划。这种切换可能导致性能下降，特别是在数据分布不均时。用户应注意这一行为，并在必要时强制使用自定义计划以优化性能。

理查德·燕：plan_cache_mode的隐秘行为

Planet PostgreSQL ·

谷歌新论文把内存股价干崩了！KV cache压缩6倍，网友：硅谷成真了 profile-avatar

量子位 ·

穆罕默德·阿基尔：生产环境中的pg_semantic_cache：标签、驱逐、监控与Python集成

穆罕默德·阿基尔：生产环境中的pg_semantic_cache：标签、驱逐、监控与Python集成

Planet PostgreSQL ·

穆罕默德·阿基尔：PostgreSQL中的语义缓存：pg_semantic_cache实用指南

穆罕默德·阿基尔：PostgreSQL中的语义缓存：pg_semantic_cache实用指南

Planet PostgreSQL ·

华为升级了MindScale算法架构，提升开发效率，解决工作流维护和知识复用等挑战。新算法支持自动生成工作流和优化提示词，显著提高推理效率，并适配国产硬件，推动行业智能化应用。

华为升级行业Agent算法架构！MindScale自己写prompt和工作流，KV Cache减少5.7倍token

量子位 ·

小米MiMo团队推出HySparse混合稀疏注意力架构，显著降低KV Cache的存储和计算开销，提升超长上下文建模效率。通过将“选择”和“缓存”交给Full Attention层，HySparse实现了高效的长距离信息访问，实验结果显示其在多项任务中表现优异。

小米给KV Cache减负80%！MiMo团队推出混合稀疏注意力架构

量子位 ·

新旗舰处理器AMD 9950X3D2出现在测试数据库中采用双3D V-Cache L3缓存达到192MB

新旗舰处理器AMD 9950X3D2出现在测试数据库中采用双3D V-Cache L3缓存达到192MB

蓝点网 ·

patrickmn/go-cache 是一个轻量级、线程安全的内存缓存库，支持过期时间和后台清理，适合缓存临时数据。使用指针存储大型结构体可显著提高性能，指针操作比值操作快约16.6倍。

go 库之 patrickmn/go-cache

LukaChen Blog ·

从KV Cache到Prompt Cache的应用

从KV Cache到Prompt Cache的应用

Shadow Walker 松烟阁 ·

深入了解Azure Managed Redis：Azure的两种Redis服务指南

深入了解Azure Managed Redis：Azure的两种Redis服务指南

Redis Blog ·

团结 Accelerator （Cache Server）新功能上线，让团队协作更高效

团结 Accelerator （Cache Server）新功能上线，让团队协作更高效

实时互动网 ·

本文探讨了如何在云原生构建中利用缓存加速开发，介绍了基于Volumes和Docker Cache的缓存机制。通过案例强调选择小基础镜像和使用软链接的最佳实践，以提高依赖安装效率，并提到复用构建缓存的配置方法。

CNB开发与构建基于docker-cache缓存复用的配置实践心得

二丫讲梵 ·