AI Infra Brief|千亿级合作与推理加速(2026.03.06)
💡
原文中文,约3700字,阅读约需9分钟。
📝
内容提要
2026年3月6日,AI基础设施迎来多项合作:AMD与Meta签署1000亿美元算力协议,推理成本降低86%;CoreWeave部署NVIDIA GB200集群;Together AI发布多项优化工具;红帽与Telenor在挪威建设主权AI工厂,显示出AI领域的快速发展与合作趋势。
🎯
关键要点
- AMD与Meta达成1000亿美元算力合作,目标部署6GW AI算力。
- CoreWeave为Perplexity部署NVIDIA GB200集群,提供推理服务。
- Akamai声称推理成本降低86%,验证分布式推理的经济性。
- Together AI发布FlashAttention-4和ThunderAgent,提升推理性能。
- 华为推出AI数据平台,集成知识库和KV缓存,支持智能推理。
- 红帽与Telenor在挪威建设主权AI工厂,支持本地化AI部署。
- Elasticsearch搜索速度提升8倍,支持bfloat16向量。
- 多个开源项目发布,推动AI生态发展和工具优化。
- 主权AI项目在欧洲加速落地,构建独立的AI基础设施生态。
❓
延伸问答
AMD与Meta的合作协议内容是什么?
AMD与Meta签署了1000亿美元的算力合作协议,目标是部署6GW的AI算力。
Akamai在推理成本方面取得了什么进展?
Akamai声称推理成本降低了86%,并且在多个地点部署了数千块NVIDIA Blackwell GPU。
Together AI发布了哪些新工具?
Together AI发布了FlashAttention-4和ThunderAgent等多项优化工具,以提升推理性能。
红帽与Telenor的合作项目有什么意义?
红帽与Telenor在挪威建设主权AI工厂,支持本地化AI部署,显示出主权AI项目在欧洲的加速落地。
CoreWeave为Perplexity提供了什么服务?
CoreWeave为Perplexity部署了基于NVIDIA GB200集群的推理服务。
华为的新AI数据平台有哪些功能?
华为的AI数据平台集成了知识库、KV缓存和内存库,支持智能推理,报告检索准确率超过95%。
➡️