AI推理将成为主要计算负载,企业希望优化AI堆栈。d-Matrix开发的新型推理芯片采用异构架构,解决内存瓶颈,通过数字内存计算技术在内存单元内直接进行矩阵乘法,提高效率。d-Matrix计划与Nvidia Triton推理服务器集成,简化开发者使用,未来将实现GPU与其他加速器的混合部署。
完成下面两步后,将自动完成登录并继续当前操作。