完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

💡 原文中文,约3000字,阅读约需7分钟。
📝

内容提要

2025年12月27日,Meet AI Compiler第八期技术沙龙在上海创智学院成功举办。活动邀请五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化,促进了与会者的深入讨论与交流。

🎯

关键要点

  • 2025年12月27日,Meet AI Compiler第八期技术沙龙在上海创智学院成功举办。
  • 活动邀请了五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化。
  • 讲师们展示了不同技术路线在真实场景中的实现方式与取舍思路。
  • 活动中,参与者积极提问和互动,形成了围绕AI编译器的长期对话。
  • 冯思远分享了TVM FFI,旨在解决机器学习系统生态割裂与互操作性难题。
  • 薛继龙介绍了TileRT项目,关注低延迟大模型推理的软硬件探索。
  • 汪超分享了PyPTO框架,基于白盒编译的融合算子开发。
  • 李嘉楠讲解了Triton编译器的优化实践,涵盖多架构的关键优化技巧。
  • 施琦介绍了AutoTriton,探讨强化学习驱动的大模型Triton算子优化技术。
  • HyperAI超神经致力于为全球数据科学及人工智能行业提供学习与实践支持。

延伸问答

Meet AI Compiler第八期技术沙龙的主要内容是什么?

本次沙龙邀请了五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化等主题。

冯思远在沙龙中分享了什么主题?

冯思远分享了TVM FFI,旨在解决机器学习系统生态割裂与互操作性难题。

TileRT项目的主要关注点是什么?

TileRT项目关注低延迟大模型推理的软硬件探索,旨在提高计算速度。

PyPTO框架的设计理念是什么?

PyPTO框架基于白盒编译,通过聚焦核内SRAM管理和跨平台指令集,实现高性能与易用性的统一。

Triton编译器的优化实践包括哪些内容?

Triton编译器的优化实践涵盖多架构的关键优化技巧,展示构建高性能统一算子体系的路径。

AutoTriton项目的探索重点是什么?

AutoTriton项目探讨强化学习驱动的大模型Triton算子优化技术,关注内核可编程性和性能可移植性。

➡️

继续阅读