人工智能投资正以每年1万亿美元的速度前进,这个趋势在可预见的未来不会停止。然而,行业面临着在其扩张中提供巨大基础设施的能力来降温的不断增加的约束。

主流芯片在几年的时间里逐渐增加功耗后,突然间,芯片产生的热量呈现出J型曲线。 Rubin 架构将在 2026 年下半年到来时,功率密度将比上一代的两倍。

目前使用最新GPU的数据中心使用单相直接到芯片液体冷却。然而,随着新型GPU的出现,功率超过200-300千瓦/架时,单相将遇到物理限制。

这意味着下一个十年的真正挑战仍然存在:在大规模和从环境角度来讲负责的效率的热量释放。这正是双相直接到芯片冷却的作用,因为它可以服务于高强度的GPU,相比于单相。

两种系统如何工作?

  • 单相液体冷却:通过加热液体来移除热量;
  • 双相液体冷却:通过液体到汽化的过渡作为冷却引擎的一部分来移除热量。水可以比单相液体更温暖。

更好的经济

冷却占据了数据中心总能耗的35%-40%,或美国总能耗的1.2%。减少这一开支对于每个超大规模计算机和新云计算服务都是至关重要的。双相冷却可以减少需要的降温机的数量,显著降低年度运营成本,因为所有数据中心的所有架子都可以在更温暖的水温度下运作。

降低保险成本

当前使用单相冷却的数据中心面临着泄漏风险。然而,使用双相冷却的方法,使用专门的非导电(绝缘)液体,它显著降低了由于泄漏导致设备损坏的风险。

我留下的问题是:谁更有优势去占领双相液体冷却市场,迫使超大规模计算机采用它,并将其包含在AMD和NvidiaGPU参考架构中?