8张图讲清楚mmap实现原理

💡 原文中文,约3200字,阅读约需8分钟。
📝

内容提要

本文介绍了Linux内核中mmap内存映射的实现原理,通过页表机制将虚拟地址映射到物理地址,包括文件映射和匿名映射。

🎯

关键要点

  • mmap内存映射在Linux内核和系统编程中至关重要。
  • 虚拟地址映射到物理地址通过页表机制实现,64位CPU采用4级页表。
  • 64位CPU的虚拟地址长度为64位,但实际使用48位满足映射需求。
  • pgd、pud、pmd、ptl表偏移均为9位,物理页偏移为12位。
  • 虚拟地址映射物理地址的过程包括查询pgd、pud、pmd、ptl表,最终定位到物理地址。
  • Linux内核通过动态分配方式创建页表,避免一次性占用过多内存。
  • mmap函数用于将文件或设备映射到进程地址空间,分为文件映射和匿名映射。
  • VMA(虚拟内存区域)是管理进程虚拟内存的数据结构,包含起始地址、结束地址及属性信息。
  • 缺页中断在访问未建立映射关系的虚拟内存时触发,负责分配物理页面并建立映射关系。
  • 文件映射将文件内容映射到进程内存,需指定文件fd、偏移量和映射长度。
  • 匿名映射通过申请物理内存页并转换为pte完成,过程相对简单。
➡️

继续阅读