土法炼钢兴趣小组的博客 ·

【eBPF 内核实现深度拆解】Map 内核实现（上）：hash / array / per-CPU 的数据结构与并发模型

💡 原文中文，约22100字，阅读约需53分钟。

📝

内容提要

BPF程序在内核中执行时无法访问全局变量和调用内核函数，唯一的持久化机制是BPF map。本文分析了BPF map的内核实现，包括hash表和数组的结构、并发模型及适用场景。hash map使用分桶链表和预分配策略，而array map则采用连续内存布局，支持零拷贝。per-CPU变体允许每个CPU独立操作，避免缓存行竞争。理解这些并发模型对优化BPF程序性能至关重要。

🎯

关键要点

BPF程序在内核中执行时无法访问全局变量和调用内核函数，唯一的持久化机制是BPF map。
BPF map的实现包括hash表和数组的结构、并发模型及适用场景。
hash map使用分桶链表和预分配策略，而array map则采用连续内存布局，支持零拷贝。
per-CPU变体允许每个CPU独立操作，避免缓存行竞争。
理解这些并发模型对优化BPF程序性能至关重要。

🔎

延伸解读

BPF Map 的重要性

BPF Map 是 BPF 程序在内核中持久化状态的唯一机制。理解不同类型的 BPF Map（如 hash 和 array）及其实现细节，对于优化 BPF 程序性能至关重要。错误选择 Map 类型可能导致性能显著下降，因此开发者需根据具体需求谨慎选择。

并发模型的设计考量

BPF Map 的并发模型设计旨在最大化读写操作的并行性。hash map 采用 per-bucket 自旋锁，允许不同 bucket 的并发写入，而 array map 则利用连续内存布局实现无锁读写。这种设计减少了锁竞争，提高了性能，尤其在多核环境下表现尤为明显。

Per-CPU Map 的优势

Per-CPU Map 通过为每个 CPU 提供独立的值拷贝，消除了缓存行竞争，显著提升了性能。在多核环境中，使用 Per-CPU Map 可以避免因多个 CPU 同时访问同一数据而导致的延迟，适合高并发场景下的计数器和临时缓冲区等应用。

❓

延伸问答

BPF map 的主要作用是什么？

BPF map 是 BPF 程序在内核中唯一的持久化机制，用于存储状态和与用户态交换数据。

hash map 和 array map 的主要区别是什么？

hash map 使用哈希表结构，支持任意键的查找，而 array map 使用连续内存布局，通过索引访问，查找速度更快。

per-CPU map 的优势是什么？

per-CPU map 允许每个 CPU 独立操作其数据副本，避免了缓存行竞争，提高了并发性能。

BPF map 的并发模型是怎样的？

BPF map 的并发模型包括无锁读、per-bucket 锁的写操作，以及针对 per-CPU map 的独立数据访问，优化了并发性能。

如何选择使用 hash map 还是 array map？

如果键是固定范围的整数，使用 array map；如果键是稀疏空间的值，如 IP 地址，使用 hash map。

BPF map 的预分配策略有什么特点？

预分配策略在创建时一次性分配所有元素，适用于对延迟敏感的场景，而非预分配则按需分配，适合内存紧张的情况。

🏷️