The New Stack ·

为什么d-Matrix押注于内存计算以打破AI推理瓶颈

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

AI推理将成为主要计算负载，企业希望优化AI堆栈。d-Matrix开发的新型推理芯片采用异构架构，解决内存瓶颈，通过数字内存计算技术在内存单元内直接进行矩阵乘法，提高效率。d-Matrix计划与Nvidia Triton推理服务器集成，简化开发者使用，未来将实现GPU与其他加速器的混合部署。

🎯

🔎

d-Matrix的数字内存计算技术（DIMC）通过在内存单元内直接进行矩阵乘法，显著提高了AI推理的效率。这种方法减少了计算与内存之间的延迟，解决了传统架构中的带宽瓶颈，为处理大型语言模型提供了更快的响应速度。

d-Matrix计划与Nvidia Triton推理服务器集成，这将简化开发者的使用体验。通过这种集成，开发者可以更方便地在其平台上运行多种AI模型，降低了技术门槛，促进了AI应用的普及。

AI硬件市场竞争激烈，d-Matrix通过独特的异构架构和内存计算技术寻求差异化。与其他公司如Cerebras不同，d-Matrix专注于将计算与内存结合，可能在未来的AI推理应用中占据一席之地。

❓

d-Matrix的推理芯片采用异构架构，专注于打破内存瓶颈，通过数字内存计算技术在内存单元内直接进行矩阵乘法，提高计算效率。

d-Matrix通过其数字内存计算技术（DIMC），在内存单元内直接进行矩阵乘法，从而减少了计算与内存之间的延迟和带宽瓶颈。

与Nvidia Triton推理服务器的集成将简化开发者的使用体验，使其更容易在d-Matrix平台上运行不同的AI模型。

d-Matrix的Corsair平台主要关注打破内存瓶颈，而不仅仅是提升计算能力。

d-Matrix的芯片组方法允许根据客户需求扩展DIMC单元，能够快速响应工作负载的变化。

未来将实现GPU与其他加速器的真正异构部署，推理将不仅在数据中心运行，还将在用户的手机或个人电脑上运行。

🏷️