💡
原文中文,约1200字,阅读约需3分钟。
📝
内容提要
roofline模型描述计算性能与运算强度和每秒浮点运算次数的关系。优化手段可分为提高算力和提高带宽两类。Memory-bound任务应优化内存带宽,Compute-bound任务应优化算力。
🎯
关键要点
- roofline模型描述计算性能与运算强度和每秒浮点运算次数的关系。
- 运算强度定义为运算量与访存量的比值。
- 算力决定屋顶的高度,带宽决定屋檐的斜率。
- 红色部分为带宽瓶颈区域,性能由带宽和模型计算能力决定。
- 绿色部分为计算瓶颈区域,性能受限于算力平台。
- 优化手段分为提高算力和提高带宽两类。
- Memory-bound任务应优化内存带宽,Compute-bound任务应优化算力。
➡️