💡
原文中文,约3000字,阅读约需7分钟。
📝
内容提要
2025年12月27日,Meet AI Compiler第八期技术沙龙在上海创智学院成功举办。活动邀请五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化,促进了与会者的深入讨论与交流。
🎯
关键要点
- 2025年12月27日,Meet AI Compiler第八期技术沙龙在上海创智学院成功举办。
- 活动邀请了五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化。
- 讲师们展示了不同技术路线在真实场景中的实现方式与取舍思路。
- 活动中,参与者积极提问和互动,形成了围绕AI编译器的长期对话。
- 冯思远分享了TVM FFI,旨在解决机器学习系统生态割裂与互操作性难题。
- 薛继龙介绍了TileRT项目,关注低延迟大模型推理的软硬件探索。
- 汪超分享了PyPTO框架,基于白盒编译的融合算子开发。
- 李嘉楠讲解了Triton编译器的优化实践,涵盖多架构的关键优化技巧。
- 施琦介绍了AutoTriton,探讨强化学习驱动的大模型Triton算子优化技术。
- HyperAI超神经致力于为全球数据科学及人工智能行业提供学习与实践支持。
❓
延伸问答
Meet AI Compiler第八期技术沙龙的主要内容是什么?
本次沙龙邀请了五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化等主题。
冯思远在沙龙中分享了什么主题?
冯思远分享了TVM FFI,旨在解决机器学习系统生态割裂与互操作性难题。
TileRT项目的主要关注点是什么?
TileRT项目关注低延迟大模型推理的软硬件探索,旨在提高计算速度。
PyPTO框架的设计理念是什么?
PyPTO框架基于白盒编译,通过聚焦核内SRAM管理和跨平台指令集,实现高性能与易用性的统一。
Triton编译器的优化实践包括哪些内容?
Triton编译器的优化实践涵盖多架构的关键优化技巧,展示构建高性能统一算子体系的路径。
AutoTriton项目的探索重点是什么?
AutoTriton项目探讨强化学习驱动的大模型Triton算子优化技术,关注内核可编程性和性能可移植性。
➡️