AI Infra Brief|千亿级合作与推理加速(2026.03.06)

💡 原文中文,约3700字,阅读约需9分钟。
📝

内容提要

2026年3月6日,AI基础设施迎来多项合作:AMD与Meta签署1000亿美元算力协议,推理成本降低86%;CoreWeave部署NVIDIA GB200集群;Together AI发布多项优化工具;红帽与Telenor在挪威建设主权AI工厂,显示出AI领域的快速发展与合作趋势。

🎯

关键要点

  • AMD与Meta达成1000亿美元算力合作,目标部署6GW AI算力。
  • CoreWeave为Perplexity部署NVIDIA GB200集群,提供推理服务。
  • Akamai声称推理成本降低86%,验证分布式推理的经济性。
  • Together AI发布FlashAttention-4和ThunderAgent,提升推理性能。
  • 华为推出AI数据平台,集成知识库和KV缓存,支持智能推理。
  • 红帽与Telenor在挪威建设主权AI工厂,支持本地化AI部署。
  • Elasticsearch搜索速度提升8倍,支持bfloat16向量。
  • 多个开源项目发布,推动AI生态发展和工具优化。
  • 主权AI项目在欧洲加速落地,构建独立的AI基础设施生态。

延伸问答

AMD与Meta的合作协议内容是什么?

AMD与Meta签署了1000亿美元的算力合作协议,目标是部署6GW的AI算力。

Akamai在推理成本方面取得了什么进展?

Akamai声称推理成本降低了86%,并且在多个地点部署了数千块NVIDIA Blackwell GPU。

Together AI发布了哪些新工具?

Together AI发布了FlashAttention-4和ThunderAgent等多项优化工具,以提升推理性能。

红帽与Telenor的合作项目有什么意义?

红帽与Telenor在挪威建设主权AI工厂,支持本地化AI部署,显示出主权AI项目在欧洲的加速落地。

CoreWeave为Perplexity提供了什么服务?

CoreWeave为Perplexity部署了基于NVIDIA GB200集群的推理服务。

华为的新AI数据平台有哪些功能?

华为的AI数据平台集成了知识库、KV缓存和内存库,支持智能推理,报告检索准确率超过95%。

➡️

继续阅读