机器之心 ·

告别CUDA无需Triton！Mirage零门槛生成PyTorch算子，人均GPU编程大师？

💡 原文中文，约6400字，阅读约需16分钟。

📝

内容提要

CMU的Catalyst Group发布了Mirage，一个PyTorch算子编译器。用户无需编写CUDA或Triton代码即可生成高效GPU内核。Mirage通过SuperOptimization技术自动优化内核，性能提升1.2至2.5倍，降低GPU编程门槛，提高AI开发效率。

🎯

🔎

Mirage通过SuperOptimization技术，能够自动生成高效的GPU内核，显著提升性能。与传统的CUDA或Triton编程相比，Mirage不仅简化了编程流程，还能在多个基准测试中实现1.2至2.5倍的性能提升。这使得AI开发者能够更专注于算法本身，而非底层实现细节。

Mirage的推出标志着GPU编程门槛的显著降低，尤其对于非专业开发者而言。通过仅用几行Python代码描述计算过程，用户可以轻松生成高效的GPU内核。这一变化将推动更多开发者参与到AI模型的开发中，促进技术的普及与应用。

Mirage项目的长期目标是让未来的AI开发者无需掌握复杂的GPU编程语言。通过自动化生成优化的GPU实现，Mirage希望能够加速AI模型的开发与部署，满足日益增长的计算需求。这一愿景将对AI领域的创新与发展产生深远影响。

❓

Mirage是CMU的Catalyst Group发布的一个PyTorch算子编译器，用户无需编写CUDA或Triton代码即可自动生成高效的GPU内核。

Mirage提供更高的生产力、更好的性能和更强的正确性，用户只需在PyTorch层面描述计算，Mirage会自动生成高性能的GPU实现。

Mirage通过SuperOptimization技术自动搜索与输入程序功能等价的GPU实现，探索并发现性能最优的内核，通常比手动编写的内核快1.2至2.5倍。

Mirage利用形式化验证技术自动验证生成的GPU内核的正确性，确保内核与所需程序等价。

Mirage的长期目标是让AI开发者无需学习复杂的GPU编程语言，只需指定数学操作即可在GPU上实现AI模型。

与传统GPU编程需要手动编写复杂代码不同，Mirage允许用户仅用几行Python代码描述计算过程，自动生成高效的GPU内核。

🏷️