小红花·文摘 - 小红花技术领袖俱乐部

本文讨论了面向异构硬件的代码生成，重点介绍了MLIR的GPU方言及其与传统GPU编程模型的区别。MLIR通过显式表示GPU编程概念，优化了内存层次和并行模型，涵盖了GPU的核心操作、内存映射、tiling策略及SPIR-V出口路径，强调了MLIR在AI编译链中的重要性，并与Triton和IREE进行了对比。

【编译器工程与 MLIR】面向异构硬件的代码生成

土法炼钢兴趣小组的博客 ·

打破单一数据中心的束缚：基于k0smos平台的实用地理分布式AI操作

打破单一数据中心的束缚：基于k0smos平台的实用地理分布式AI操作

Cloud Native Computing Foundation ·

Modular：来自MLSys 2026的三大趋势

Modular：来自MLSys 2026的三大趋势

Modular Blog ·

TornadoVM 2.0为Java带来自动GPU加速和LLM支持

InfoQ ·

AXLearn：异构基础设施上的模块化大规模模型训练

AXLearn：异构基础设施上的模块化大规模模型训练

Apple Machine Learning Research ·