小红花·文摘 - 小红花技术领袖俱乐部

Supermicro推出一系列搭载Arm AGI CPU的AI解决方案

Supermicro推出一系列搭载Arm AGI CPU的AI解决方案

全球TMT-美通国际 ·

本地 NVMe 存储高达 22.8TB 的 Amazon EC2 C8id、M8id 和 R8id 实例正式发布

本地 NVMe 存储高达 22.8TB 的 Amazon EC2 C8id、M8id 和 R8id 实例正式发布

亚马逊AWS官方博客 ·

Trainium3 UltraServers正式可用，由亚马逊云科技首款3nm AI芯片驱动

Trainium3 UltraServers正式可用，由亚马逊云科技首款3nm AI芯片驱动

全球TMT-美通国际 ·

活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海，TVM/TileRT/PyPTO/Triton各显神通

活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海，TVM/TileRT/PyPTO/Triton各显神通

HyperAI超神经 ·

元脑SD200超节点AI服务器助力DeepSeek R1创造国内大模型最快token生成速度

元脑SD200超节点AI服务器助力DeepSeek R1创造国内大模型最快token生成速度

全球TMT-美通国际 ·

时隔 9 年，黄仁勋再次给马斯克送货上门，跳票大半年的 AI 个人超算终于来了

时隔 9 年，黄仁勋再次给马斯克送货上门，跳票大半年的 AI 个人超算终于来了

爱范儿 ·

使用Rust加速Python：实用指南

使用Rust加速Python：实用指南

DEV Community ·

谷歌云推出搭载NVIDIA Blackwell GPU的A4虚拟机，专为人工智能工作负载设计

谷歌云推出搭载NVIDIA Blackwell GPU的A4虚拟机，专为人工智能工作负载设计

InfoQ ·

英伟达在人工智能领域领先，推出了升级版AI芯片架构Blackwell Ultra，提升了推理能力。新架构Vera Rubin实现了CPU与GPU的深度整合，显著增强了计算性能，推动了AI工厂概念的发展。

股价止跌失败，黄仁勋透露Blackwell Ultra和Vera Rubin上市时间，推理能力成重点

HyperAI超神经 ·

并行处理的GPU计算创新替代方案

并行处理的GPU计算创新替代方案

DEV Community ·

本研究推出ABCI 3.0，整合6128个NVIDIA H200 GPU及全闪存存储，解决日本AI基础设施的处理和存储不足，提升计算性能，助力生成式AI研发与人才培养。

ABCI 3.0: The Evolution of Japan's Leading Artificial Intelligence Infrastructure

BriefGPT - AI 论文速递 ·

本文介绍了一种基于一次训练（OFA）网络的方法，提出了动态可整合网络DS-Net，通过动态调整卷积滤波器数量提高硬件效率。实验结果显示，DS-Net在计算性能上优于ResNet-50和MobileNet。此外，提出了“网络瘦身”方案，通过通道级稀疏性简化深度卷积神经网络，降低计算成本而不影响准确度。

DεpS: 延迟 ε-收缩以加速全面训练

BriefGPT - AI 论文速递 ·

适用于大型内存数据库的 Amazon EC2 大内存 U7i 实例

适用于大型内存数据库的 Amazon EC2 大内存 U7i 实例

亚马逊AWS官方博客 ·

AWS Graviton3 加速 Flink 作业执行：Benchmark

AWS Graviton3 加速 Flink 作业执行：Benchmark

亚马逊AWS官方博客 ·

roofline model

roofline model

plus studio ·

新产品 — 第七代内存优化型 Amazon EC2 实例（R7i）

新产品 — 第七代内存优化型 Amazon EC2 实例（R7i）

亚马逊AWS官方博客 ·

TensorRT中的int8量化

TensorRT中的int8量化

李文举 ·