土法炼钢兴趣小组的博客 ·

【编译器工程与 MLIR】张量中端：Tensor 与 Linalg 方言

💡 原文中文，约8100字，阅读约需20分钟。

📝

内容提要

本文介绍了MLIR中的张量和线性代数方言，强调它们在AI编译中的重要性。张量方言表示不可变的多维数组，支持创建、读取和修改等核心操作。线性代数方言用于表达结构化数值计算，包含命名操作和通用操作，并支持分块、融合和向量化等优化策略。最终，Linalg操作需降阶为实际循环，以实现高效计算。

🎯

🔎

张量方言强调不可变性和无副作用的设计理念，这使得数据流分析更加精确。通过这种设计，编译器能够更好地判断操作之间的依赖关系，从而优化并行执行。这种纯函数式的特性在处理复杂计算时尤为重要，能够有效减少潜在的错误和副作用。

Linalg方言的设计为分块、融合和向量化等优化策略提供了清晰的接口。这些优化策略能够显著提高计算效率，尤其是在处理大规模数据时。理解这些策略的实现方式，可以帮助开发者在实际应用中更好地利用MLIR进行性能优化。

Linalg的结构化操作最终需要降阶为实际的循环，这一过程在bufferization之后进行。理解这一降阶过程对于开发高效的计算程序至关重要，因为它直接影响到内存管理和计算性能。开发者应关注如何有效地将Linalg操作转化为可调度的循环结构。

❓

张量方言表示不可变的多维数组，支持创建、读取和修改等核心操作，设计意图是纯函数式、无副作用。

Linalg方言用于表达结构化数值计算，包含命名操作和通用操作，并支持分块、融合和向量化等优化策略。

Linalg操作需通过转换为嵌套的scf.for循环来降阶，确保在bufferization后进行。

通过bufferization将张量方言的IR转换为memref方言，管理内存的可变性和地址。

Linalg方言的优化策略包括分块、融合和向量化，以提高计算效率。

张量方言的核心操作包括tensor.empty、tensor.insert、tensor.extract等，用于创建和操作张量。

🏷️