土法炼钢兴趣小组的博客 ·

【编译器工程与 MLIR】Pass 管理与分析

💡 原文中文，约6400字，阅读约需16分钟。

📝

内容提要

本文介绍了MLIR的Pass管理与分析，重点阐述了MLIR Pass与LLVM Pass的区别，包括统一的Pass模型、局部作用域和嵌套的AnalysisManager。通过示例展示了如何编写和注册一个简单的OperationPass，统计arith::AddIOp的数量，并讨论了Pass的依赖管理、流水线、多线程执行及IR修改通知机制。最后提到调试和统计工具，以及Pass的注册与发现。

🎯

关键要点

MLIR的Pass基础设施复用了LLVM的经验，但针对多方言和Region嵌套进行了扩展。
MLIR Pass与LLVM Pass的主要区别在于没有多级继承、局部作用域和嵌套的AnalysisManager。
MLIR统一使用OperationPass<OpT>，简化了Pass的类型分类。
OperationPass只能访问和修改其内部的IR，保证了并行执行的可能性。
每个Pass运行时获得一个与其作用域对应的AnalysisManager，支持不同层次的分析。
示例中展示了如何编写和注册一个简单的OperationPass来统计arith::AddIOp的数量。
Pass可以声明依赖某个分析，确保在修改IR时正确管理分析的有效性。
MLIR的PassManager支持多线程执行，允许在不同线程上并行运行独立的func.func。
当Pass修改IR时，需要显式标记哪些分析仍然有效，以避免不必要的失效。
提供了调试工具，如IR打印、Pass计时和崩溃调试，帮助开发者分析Pass流水线。
在CMake中注册Pass库后，mlir-opt可以自动发现并注册Pass选项。

🔎

延伸解读

MLIR与LLVM的核心差异

MLIR的Pass模型与LLVM的显著不同在于其统一性和局部性。MLIR不再使用多级继承，而是通过OperationPass<OpT>简化了Pass的类型分类。这种设计使得每个Pass只能访问其内部的IR，确保了并行执行的可能性，降低了不同Pass之间的耦合度。

Pass的依赖管理机制

在MLIR中，Pass可以声明对某个分析的依赖，确保在修改IR时分析的有效性。通过AnalysisManager，MLIR能够缓存分析结果并在需要时自动更新，这种机制提高了Pass的执行效率和准确性，尤其在复杂的编译流水线中尤为重要。

多线程执行的优势

MLIR的PassManager支持多线程执行，这意味着多个独立的func.func可以在不同线程上并行处理。由于每个Pass实例的作用域是隔离的，这种设计不仅提高了性能，还避免了全局锁的使用，适合处理大规模的IR变换任务。

❓

延伸问答

MLIR的Pass与LLVM的Pass有什么主要区别？

MLIR的Pass没有多级继承，采用统一的OperationPass模型，并且具有局部作用域和嵌套的AnalysisManager。

如何编写一个简单的OperationPass来统计arith::AddIOp的数量？

可以通过继承PassWrapper并实现runOnOperation方法，使用func.walk遍历并统计arith::AddIOp的数量。

MLIR的PassManager如何支持多线程执行？

MLIR的PassManager允许在不同线程上并行运行独立的func.func，因为每个Pass实例只能访问自己的func::FuncOp。

在MLIR中，如何管理Pass的依赖关系？

Pass可以声明依赖某个分析，AnalysisManager会确保在Pass请求分析时，如果尚未计算则创建并缓存它。

如何在CMake中注册MLIR的Pass库？

可以使用add_mlir_library命令注册Pass库，并链接所需的MLIR库，以便mlir-opt自动发现并注册Pass选项。

MLIR提供了哪些调试工具来分析Pass流水线？

MLIR提供了IR打印、Pass计时和崩溃调试等工具，帮助开发者分析Pass流水线的执行情况。

🏷️