完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

在AI编译器技术背景下,Meet AI Compiler第八期活动于12月27日举行,邀请多位专家分享软件栈设计、算子开发和性能优化等主题,促进与会者互动与讨论,形成围绕AI编译器的长期对话。

🎯

关键要点

  • Meet AI Compiler 第八期活动于12月27日举行,聚焦AI编译器技术的最新进展。
  • 邀请了来自多个机构的专家,分享软件栈设计、算子开发和性能优化等主题。
  • 活动促进了与会者之间的互动与讨论,形成了围绕AI编译器的长期对话。
  • TVM FFI项目旨在解决机器学习系统的生态割裂与互操作性问题,支持跨语言高效调用。
  • TileRT项目关注低延迟大模型推理,探讨如何构建针对极低延迟的大模型计算软件栈。
  • PyPTO是华为推出的融合算子开发框架,基于白盒编译实现高性能与易用性的统一。
  • Triton编译器的优化实践介绍了多架构上的关键优化技术,展示构建高性能统一算子体系的路径。
  • AutoTriton项目探索了强化学习驱动的大模型Triton算子优化技术,展望了算子优化的潜力。
  • 活动由HyperAI超神经、OpenBayes贝式计算和MLC.AI社区等机构主办与支持,推动AI领域的发展。
  • 上海创智学院致力于培养AI领域的领军人才,探索中国特色的人才培养方案。

延伸问答

Meet AI Compiler 第八期活动的主要内容是什么?

活动聚焦AI编译器技术的最新进展,邀请专家分享软件栈设计、算子开发和性能优化等主题。

TVM FFI项目的目标是什么?

TVM FFI旨在解决机器学习系统的生态割裂与互操作性问题,支持跨语言高效调用。

TileRT项目关注哪些技术挑战?

TileRT项目关注如何构建针对极低延迟的大模型计算软件栈,解决大模型推理的技术挑战。

PyPTO框架的核心理念是什么?

PyPTO框架基于白盒编译,通过聚焦用户经验和Human-In-The-Loop调优,实现高性能与易用性的统一。

Triton编译器的优化实践涉及哪些架构?

Triton编译器的优化实践覆盖CPU、GPU和NPU等多架构的关键优化技术。

AutoTriton项目探索了什么技术?

AutoTriton项目探索了强化学习驱动的大模型Triton算子优化技术,展望算子优化的潜力。

➡️

继续阅读