本文介绍了PyTorch-XLA、TensorFlow图执行和PyTorch 2图执行等混合方法,Modular AI引擎支持动态形状,执行模型更快。使用桶和填充策略进行缓解时,XLA的编译时间显著降低,但Modular AI引擎在各种平台上的模型执行时间仍然比TensorFlow+XLA快2倍至4倍。
完成下面两步后,将自动完成登录并继续当前操作。