小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了面向异构硬件的代码生成,重点介绍了MLIR的GPU方言及其与传统GPU编程模型的区别。MLIR通过显式表示GPU编程概念,优化了内存层次和并行模型,涵盖了GPU的核心操作、内存映射、tiling策略及SPIR-V出口路径,强调了MLIR在AI编译链中的重要性,并与Triton和IREE进行了对比。

【编译器工程与 MLIR】面向异构硬件的代码生成

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-06-09T00:00:00Z
打破单一数据中心的束缚:基于k0smos平台的实用地理分布式AI操作

现代人工智能架构面临分散计算资源的挑战,Kubernetes成为管理地理分布式AI基础设施的关键。k0smos堆栈通过三个技术层次简化跨站点网络和异构硬件管理。与德国创新局合作的项目展示了如何整合不同GPU资源,实现高效的分布式训练,证明了在动态环境中运行AI工作负载的可行性。

打破单一数据中心的束缚:基于k0smos平台的实用地理分布式AI操作

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-06-08T11:00:00Z
Modular:来自MLSys 2026的三大趋势

Modular在MLSys 2026大会上讨论了推理技术的最新进展,强调AI代理在低级代码生成中的重要性。会议展示了多种优化技术,如高效的KV缓存管理和异构硬件应用,以提升推理性能。Modular的架构支持跨组件优化,以适应行业需求的变化。

Modular:来自MLSys 2026的三大趋势

Modular Blog
Modular Blog · 2026-05-29T00:00:00Z
TornadoVM 2.0为Java带来自动GPU加速和LLM支持

TornadoVM项目最近发布了2.0版本,旨在为Java提供异构硬件运行时,自动加速Java程序,支持多核CPU、GPU和FPGA,适合机器学习和深度学习应用。新版本还推出了LLM推理库,提升了性能和易用性。该项目由曼彻斯特大学的Beehive实验室领导。

TornadoVM 2.0为Java带来自动GPU加速和LLM支持

InfoQ
InfoQ · 2025-12-17T06:00:00Z
AXLearn:异构基础设施上的模块化大规模模型训练

AXLearn是一个专注于模块化和异构硬件支持的深度学习系统,便于大规模模型训练。其内部接口严格封装,支持快速开发和实验。通过量化代码行复杂度,AXLearn在扩展时保持恒定复杂度,集成新特性如旋转位置嵌入仅需10行代码,性能与先进系统相当。

AXLearn:异构基础设施上的模块化大规模模型训练

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码