英伟达将在GTC大会上推出新推理芯片,首位客户为OpenAI。该芯片基于Groq团队的LPU架构,旨在提升推理效率,以应对市场需求变化。推理市场正在重塑,英伟达面临竞争压力,需迅速响应。
AI推理将成为主要计算负载,企业希望优化AI堆栈。d-Matrix开发的新型推理芯片采用异构架构,解决内存瓶颈,通过数字内存计算技术在内存单元内直接进行矩阵乘法,提高效率。d-Matrix计划与Nvidia Triton推理服务器集成,简化开发者使用,未来将实现GPU与其他加速器的混合部署。
马斯克的xAI正在研发代号为X1的推理芯片,采用台积电3纳米工艺,预计2026年量产。xAI计划在五年内实现5000万块H100算力,面临激烈竞争。同时,特斯拉也在推进AI5和AI6芯片设计,专注于性能和效率提升。
完成下面两步后,将自动完成登录并继续当前操作。