Modular Blog ·

模块化：模块化本地支持AI工作负载的动态形状

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

本文介绍了PyTorch-XLA、TensorFlow图执行和PyTorch 2图执行等混合方法，Modular AI引擎支持动态形状，执行模型更快。使用桶和填充策略进行缓解时，XLA的编译时间显著降低，但Modular AI引擎在各种平台上的模型执行时间仍然比TensorFlow+XLA快2倍至4倍。

🎯

关键要点

介绍了混合方法，包括PyTorch-XLA、TensorFlow图执行和PyTorch 2图执行。
Torch-XLA在PyTorch的即时执行中添加了JIT编译器，但无法达到最佳性能。
TensorFlow图执行是目前生产中最常用的基础设施，支持动态形状。
PyTorch 2提供了图编程范式，但目前仅限于简单用例，尚处于测试阶段。
Modular AI引擎的动态编译器在动态形状支持方面优于现有基础设施。
使用BERT-base模型进行比较，Modular AI引擎在编译时间上比XLA快5-7倍。
Modular AI引擎在BERT模型执行时间上比TensorFlow快3-9倍，比XLA快2-4倍。
使用桶和填充策略可以显著降低XLA的编译时间，但Modular AI引擎仍然更快。

🏷️

继续阅读

在AI工作负载时代如何确保Kubernetes的安全性
Kubernetes的安全性因AI工作负载而变得复杂，传统的集群安全措施已无法应对动态流量。Azure Kubernetes Service（AKS）通过...
Asana称其新的AI“首席助理”将您的Slack混乱转化为可追踪的工作
Asana在伦敦的工作创新峰会上推出了名为Dash的AI助手，旨在提升工作管理平台的效率。Dash能够从会议、Slack和邮件中捕捉待办事项，并将其转化为...
早报｜苹果App Store四成头部应用已支持AI/千问上线肯德基skill/奈雪擦边LABUBU被判赔32万
腾讯客服表示，微信与华为、小米等厂商合作推出A2A助手，用户可通过AI助手发起微信通话或发送消息。荣耀部分机型已支持此功能，确保数据安全与隐私。
三大AI大佬联名要求强制筛查DNA订单：超级病毒即将进入车库实验室
三位AI专家呼吁立法，要求强制筛查合成DNA订单，因AI技术降低了生物武器制造的门槛，邮购病毒已成为现实。合成DNA过程简单，已有案例显示危险技术被滥用，...
Anthropic：AI递归式自我改进RSI正在加速！
Anthropic报告指出，人工智能（AI）正在迅速自我改进，能够独立编写代码和修复bug，效率显著提升。预计到2026年，AI的代码产出将相当于八名工程...
Kaggle 使 AI 基准创建变得轻而易举
Kaggle Benchmarks推出本地开发功能，允许开发者在本地环境中创建和验证评估任务。该功能支持使用AI编码代理通过自然语言构建任务，旨在加速AI...

模块化：模块化本地支持AI工作负载的动态形状

内容提要

关键要点

标签

继续阅读