💡
原文英文,约600词,阅读约需2分钟。
📝
内容提要
AI Engine是一个高性能的推理引擎,支持导入来自TensorFlow、PyTorch和ONNX的训练模型,并提供高吞吐量。它有四个关键组件:导入器、优化器、内核生成器和运行时。用户可以使用Python和C/C++ API,并集成到流行的服务框架中。AI Engine目前处于封闭预览阶段。
🎯
关键要点
-
AI Engine是一个高性能的推理引擎,支持导入TensorFlow、PyTorch和ONNX的训练模型。
-
AI Engine提供高达7.5倍的吞吐量,相比于原生框架运行时。
-
AI Engine有四个关键组件:导入器、优化器、内核生成器和运行时。
-
用户可以使用Python和C/C++ API,并集成到流行的服务框架中。
-
AI Engine目前处于封闭预览阶段,用户可以申请早期访问。
-
内核生成器负责从优化图生成融合内核,并包含优化的线性代数和融合操作符的库。
-
Mojo语言用于编写AI Engine的优化内核,提供Python般的可用性和系统编程语言的安全性。
-
Mojo可以提高AI研究人员和开发者在创建自定义内核时的生产力,缩短模型部署时间。
➡️