小红花·文摘 - 小红花技术领袖俱乐部

HAMi成为CNCF孵化项目

HAMi成为CNCF孵化项目

Cloud Native Computing Foundation ·

Rust社区正在构建全球适应性强的AI推理基础设施，支持未来模型和异构加速器，确保低延迟和无厂商锁定，推动AI基础设施的创新与发展。

[商汤/大装置] 诚邀 Rust 系统工程师共建下一代 AI 推理基础设施

Rust.cc ·

本文介绍了异构加速器工具包（HAT），一个支持Java开发者将代码卸载到现代硬件加速器（如GPU）的并行编程框架。通过矩阵乘法示例，展示了如何优化GPU工作负载，实现接近原生cuBLAS的性能，从CPU的7 GFLOP/s提升至NVIDIA A10 GPU的14 TFLOP/s。

使用Babylon和HAT优化Java中的GPU程序

insidejava ·

本研究提出了KAITIAN，一个新的分布式通信框架，旨在解决嵌入式人工智能系统中异构加速器的互操作性问题。KAITIAN通过统一抽象层和优化的通信库，提高了资源利用率和系统性能，实验表明训练时间缩短42%，同时保持模型准确性，增强了嵌入式AI应用的计算能力。

KAITIAN: A Unified Communication Framework for Enabling Efficient Collaboration Across Heterogeneous Accelerators in Embedded AI Systems

BriefGPT - AI 论文速递 ·

本研究提出了一种硬件无关的控制循环，旨在满足生成性AI工作负载的可扩展推断需求。该系统能够根据实时成本和容量信号，在异构加速器之间自适应分配请求，动态切换优化模式，以有效利用计算资源，确保低延迟和高吞吐量。

Adaptive Scheduling for Large-Scale Inference on Heterogeneous Accelerator Systems: Balancing Cost, Performance, and Resilience

BriefGPT - AI 论文速递 ·