小红花·文摘 - 小红花技术领袖俱乐部

本文讨论了 C++ 中内存池管理的一个 bug，特别是 KeyEvictInfo.iter_ 的迭代器失效问题。作者指出，虽然代码表面上看似安全，但由于使用 std::make_pair 导致的拷贝操作，实际上破坏了迭代器的有效性。这种隐蔽的语义差异使得问题难以察觉，强调了 C++ 语言的复杂性和潜在风险。

Mooncake Evict: 一次 std::make_pair 让 iter_ 悄悄失效

学习让我快乐 ·

本文讨论了Mooncake统一内存池中的驱逐策略，强调在处理softpin对象时，驱逐应以迁移为主，而非删除。借鉴Linux内存回收机制，提出分层的驱逐逻辑，以优化内存管理，确保在线操作的高效性和稳定性。

Mooncake 统一内存池：从默认 Evict 到 Linux Reclaim

学习让我快乐 ·

本文讨论了在 Mooncake 接入 RL 中的 local master 和统一内存池设计，通过整合数据平面减少数据拷贝，提高效率。提出了统一的内存分配、元数据管理和生命周期管理，确保数据高效访问和管理。强调 AI 在代码实现中的辅助作用，认为 Rust 语言更适合此类开发。

Mooncake 统一内存池:AI Vibe Coding 与 Rust

学习让我快乐 ·

Mooncake为Databricks带来了丰富的事务处理能力

Mooncake为Databricks带来了丰富的事务处理能力

The New Stack ·

Mooncake Labs加入Databricks，加速Lakebase愿景

Mooncake Labs加入Databricks，加速Lakebase愿景

Databricks ·

Kimi与清华大学等机构联合开源了大模型推理架构Mooncake，旨在提升推理性能和用户体验。该架构采用分离式设计，优化资源利用，已在GitHub获得1.2k星。Mooncake通过预测负载和早期拒绝策略处理高并发请求，显著提高吞吐量，支持Kimi线上80%以上的流量。

刚刚，Kimi开源底层推理框架，1小时GitHub揽星1.2k

量子位 ·

官宣开源阿里云与清华大学共建AI大模型推理项目Mooncake

官宣开源阿里云与清华大学共建AI大模型推理项目Mooncake

机器之心 ·

Kimi 联合清华大学等机构，开源共建大模型推理架构 Mooncake

Kimi 联合清华大学等机构，开源共建大模型推理架构 Mooncake

实时互动网 ·