一个机柜吞下一百万瓦:两相冷却实战改装

一个机柜吞下一百万瓦:两相冷却实战改装

💡 原文中文,约6100字,阅读约需15分钟。
📝

内容提要

本文讨论了如何通过两相冷却技术改装机柜,以满足超过一百万瓦的AI计算需求。该技术利用冷媒的沸腾和冷凝循环,提高了散热效率。文章详细介绍了管路设计、冷媒分配和电源管理等关键步骤,强调了均流的重要性和定制零件的挑战,最终实现了高效散热,节省了电费,提升了计算能力。

🎯

关键要点

  • 两相冷却技术可以让一个机柜承载超过一百万瓦的功耗,显著提高散热效率。
  • 冷媒通过沸腾和冷凝循环带走热量,沸腾过程的热量搬运能力是单相水循环的五到十倍。
  • 每个托盘可以容纳八张显卡,每张显卡的功率为2.5千瓦,五十层托盘总功率可达一百万瓦。
  • 冷媒分配系统设计类似于食堂打菜,确保每层托盘获得均匀的冷媒流量。
  • 供液管和回气管的粗细设计至关重要,确保液体和蒸汽的流动顺畅,避免过热。
  • 改装过程中需解决快插接头不足、供电复杂和网线高温等问题。
  • 使用平衡孔板和分配器来强制液体均匀分配,确保每张显卡的温度差异控制在合理范围内。
  • 尽管改装复杂且需要定制零件,但最终实现的高效散热系统能显著节省电费和空间。
  • 对于大型云厂商或超算中心,投资两相冷却系统是值得的,但需要专业团队进行维护。

延伸问答

两相冷却技术的主要原理是什么?

两相冷却技术利用冷媒的沸腾和冷凝循环,通过液体变成蒸汽带走大量热量,显著提高散热效率。

一个机柜如何实现超过一百万瓦的功耗?

通过将八张显卡放入一个托盘,每张显卡功率为2.5千瓦,五十层托盘总功率可达一百万瓦。

在改装过程中遇到的主要挑战有哪些?

主要挑战包括快插接头不足、供电复杂和网线高温等问题。

如何确保冷媒在每层托盘的均匀分配?

使用分配器和平衡孔板来强制液体均匀分配,确保每张显卡的温度差异控制在合理范围内。

投资两相冷却系统的主要好处是什么?

主要好处是节省电费和空间,允许在同样面积内容纳更多计算能力。

改装后的系统在运行时的表现如何?

系统在压力测试中稳定运行,总功率达到一百零二万瓦,冷媒循环泵耗电仅占总功率的百分之三。

➡️

继续阅读