模块化:AI引擎与Mojo有何不同?

模块化:AI引擎与Mojo有何不同?

💡 原文英文,约600词,阅读约需2分钟。
📝

内容提要

AI Engine是一个高性能的推理引擎,支持导入来自TensorFlow、PyTorch和ONNX的训练模型,并提供高吞吐量。它有四个关键组件:导入器、优化器、内核生成器和运行时。用户可以使用Python和C/C++ API,并集成到流行的服务框架中。AI Engine目前处于封闭预览阶段。

🎯

关键要点

  • AI Engine是一个高性能的推理引擎,支持导入TensorFlow、PyTorch和ONNX的训练模型。

  • AI Engine提供高达7.5倍的吞吐量,相比于原生框架运行时。

  • AI Engine有四个关键组件:导入器、优化器、内核生成器和运行时。

  • 用户可以使用Python和C/C++ API,并集成到流行的服务框架中。

  • AI Engine目前处于封闭预览阶段,用户可以申请早期访问。

  • 内核生成器负责从优化图生成融合内核,并包含优化的线性代数和融合操作符的库。

  • Mojo语言用于编写AI Engine的优化内核,提供Python般的可用性和系统编程语言的安全性。

  • Mojo可以提高AI研究人员和开发者在创建自定义内核时的生产力,缩短模型部署时间。

➡️

继续阅读