AI Infra Brief|千亿级合作与推理加速(2026.03.06)

💡 原文中文,约3700字,阅读约需9分钟。
📝

内容提要

2026年3月6日,AI基础设施迎来多项合作:AMD与Meta签署1000亿美元算力协议,推理成本降低86%;CoreWeave部署NVIDIA GB200集群;Together AI发布多项优化工具;红帽与Telenor在挪威建设主权AI工厂,显示出AI领域的快速发展与合作趋势。

🎯

关键要点

  • AMD与Meta达成1000亿美元算力合作,目标部署6GW AI算力。
  • CoreWeave为Perplexity部署NVIDIA GB200集群,提供推理服务。
  • Akamai声称推理成本降低86%,验证分布式推理的经济性。
  • Together AI发布FlashAttention-4和ThunderAgent,提升推理性能。
  • 华为推出AI数据平台,集成知识库和KV缓存,支持智能推理。
  • 红帽与Telenor在挪威建设主权AI工厂,支持本地化AI部署。
  • Elasticsearch搜索速度提升8倍,支持bfloat16向量。
  • 多个开源项目发布,推动AI生态发展和工具优化。
  • 主权AI项目在欧洲加速落地,构建独立的AI基础设施生态。
➡️

继续阅读