💡 原文英文,约1400词,阅读约需5分钟。
📝

内容提要

AI推理将成为主要计算负载,企业希望优化AI堆栈。d-Matrix开发的新型推理芯片采用异构架构,解决内存瓶颈,通过数字内存计算技术在内存单元内直接进行矩阵乘法,提高效率。d-Matrix计划与Nvidia Triton推理服务器集成,简化开发者使用,未来将实现GPU与其他加速器的混合部署。

🎯

关键要点

  • AI推理将成为主要计算负载,企业希望优化AI堆栈。
  • d-Matrix开发的新型推理芯片采用异构架构,解决内存瓶颈。
  • 通过数字内存计算技术在内存单元内直接进行矩阵乘法,提高效率。
  • d-Matrix计划与Nvidia Triton推理服务器集成,简化开发者使用。
  • 未来将实现GPU与其他加速器的混合部署。
  • d-Matrix的Corsair平台专注于打破内存瓶颈,而非仅仅竞争计算能力。
  • d-Matrix的解决方案将计算和内存结合在一起,提高了效率。
  • d-Matrix采用芯片组方法,能够根据客户需求扩展DIMC单元。
  • d-Matrix目前专注于销售其硬件,而非提供推理服务。
  • d-Matrix计划通过与Nvidia Triton的集成,简化开发者的使用体验。
  • 未来将看到GPU与其他加速器的真正异构部署。
  • 推理将不仅在数据中心运行,还将在用户的手机或个人电脑上运行。