极道 ·

Etched集群规模内存CSM解析：铜缆如何解决AI芯片延迟死穴

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

Etched公司通过创新的铜缆架构解决了AI芯片的延迟问题，创建了共享低延迟内存池，提升了MoE模型的性能。尽管面临制造和散热挑战，该方案在成本和效率上具有优势，可能改变AI基础设施的未来。

🎯

🔎

Etched公司采用铜缆架构来解决AI芯片的延迟问题，显示出铜缆在短距离内的成本效益和低延迟优势。然而，制造和散热挑战依然存在，尤其是在大规模部署时，如何确保电缆的信号完整性和散热管理将是关键。

混合专家模型（MoE）在AI推理中具有重要作用，但其复杂的路由过程导致高延迟。Etched的共享低延迟内存池通过简化数据访问路径，显著提升了模型性能。理解这一点对于评估AI基础设施的未来至关重要。

Etched的创新方案虽然在理论上解决了延迟和吞吐量问题，但其成功依赖于市场对低延迟的强烈需求。公司需要在制造复杂性和市场接受度之间找到平衡，以确保其技术能够在竞争激烈的AI领域中立足。

❓

Etched公司通过创建共享低延迟内存池，将多个芯片的内存融合，减少了数据传输的延迟。

MoE模型的专家路由需要跨越多个芯片和内存层，经过多层交换和转发，增加了延迟。

CSM架构通过低延迟共享池提升性能，避免了传统内存架构的延迟和成本问题。

铜缆不需要光电转换，延迟更低，功耗可控，且制造工艺成熟，成本低于光学器件。

Etched需要处理大量精密电缆的制造和散热问题，确保信号完整性和空气流通。

低压推理技术使芯片在略低于标准电压下运行，降低功耗和散热压力，提高整体性价比。

🏷️