ICS Lab4 常用优化方法
📝
内容提要
几个基本的优化: 用iaddl代替irmovl, opl,效果显著 删去不必要的andl,效果显著 改变判断分支(大多数是正数),效果显著 实现Load Forwarding,效果显著 函数结束时使用自己的epilogue,效果一般 Unrolling相关: 通过合并相邻两个循环,把mrmovl和rmmovl拆开,效果显著 32, 16, 8, 4,...
➡️