高密度算力功率提升:液冷技术成为数据中心散热温控的核心驱动方案
发布时间:2026-05-14
分享到

随着智算中心芯片功耗持续攀升,单机柜热密度大幅提升,传统风冷技术已难以满足高密度算力场景的散热需求。液冷技术凭借其高效散热、节能降噪等优势,正逐步成为未来智算中心的核心散热技术。本文将深入分析液冷技术的系统架构、驱动因素及主流技术路线。

70984236_1778744841.jpg

一、液冷:未来智算中心的核心散热技术

液冷与风冷技术相比,具有显着优势:温度传递快、带走热量多、噪音低、节能且节省空间。英伟达最新商用GB200系列及后续产品均采用冷板液冷技术,实现100%全液冷架构,液冷覆盖CPU、GPU、内存等核心部件。


二、智算中心液冷系统架构

2.1 液冷系统通用架构

液冷系统通用架构可拆解为机房侧ICT设备侧两部分:

  • 机房侧:进一步分为一次侧和二次侧

    • 一次侧:包含冷却塔、一次侧管网、一次侧冷却液(通常为水)。室外侧为外部冷源,如冷水机组、冷却塔或干冷器,热量转移主要通过水温升降实现。

    • 二次侧:包含CDU(冷量分配单元)、液冷机柜、二次侧管网和二次侧冷却液。室内侧包括供液环路和服务器内部流道,热量转移主要通过冷却液温度升降实现。

两个部分通过CDU中的板式换热器发生间壁式换热。

  • ICT设备侧:浸没式采用Tank安装制冷工质,ICT设备浸没其中;冷板式主要采用冷板贴附于核心热源(CPU、GPU、内存等)上方。

2.2 制冷工质的选择

液冷类型 常用工质
冷板式 乙二醇/丙二醇溶液(基于防冻考虑)或去离子水
浸没式 氟化液、矿物油(如硅油)等

35147280_1778744877.jpg

三、液冷技术的主要驱动因素

3.1 驱动因素一:液冷相比风冷单位成本下降,散热能力更好

高散热:液冷系统常用介质(去离子水、醇基溶液、氟碳类工质、矿物油等)的载热能力、导热能力和强化对流换热系数均远大于空气。针对单芯片,液冷相比风冷具有更高的散热能力。

低TCO(总拥有成本):液冷散热技术虽会增加一定初期投资,但可通过降低运行成本快速回收。根据中兴通讯测算,以10MW数据中心为例,液冷方案(PUE1.15)相比冷冻水方案(PUE1.35),约2.2年可回收增加的基础设施初投资。施耐德数据显示,按每机架20kW和40kW部署液冷,投资成本比传统风冷分别节省10%和14%。

3.2 驱动因素二:算力功率密度提升,液冷逐步成为刚需

智算中心芯片功耗不断提升,单机柜热密度大幅快速提升。液冷将是高功率密度散热的主要方案:

  • 英伟达B200芯片TDP功耗已达1000W

  • GB200超级芯片(一颗Grace CPU + 两颗Blackwell GPU)功耗达2700W

  • 从Blackwell到Rubin Ultra架构演进,Vertiv数据显示,AI GPU机架峰值密度有望从2024年的130kW增长到2029年突破1MW

3.3 驱动因素三:全球数据中心能耗管控趋严,PUE考核趋严

碳中和背景下,主要国家和地区对数据中心PUE提出更严格要求。以我国为例,新建大型和超大型数据中心PUE需降至1.25以内。

目前,标准风冷数据中心中温控环节能耗占比达40%(主要为精密空调消耗)。PUE值越接近1,表明能耗主要集中于IT设备。通过液冷替代精密空调,有助于降低PUE,实现节约能耗。

3.4 驱动因素四:CSP云厂商均在设计和启用液冷方案

主流云服务提供商(CSP)已纷纷布局液冷技术,推动液冷方案在数据中心的大规模应用。

31280546_1778744896.jpg

四、液冷技术分类与详解

液冷散热技术主要分为冷板式、浸没式和喷淋式三大类。按照是否相变,冷板式可分为单相冷板式与两相冷板式;浸没式可分为单相浸没式与相变浸没式。

4.1 冷板式液冷(当前主流方案)

冷却液不直接接触电子器件,通过冷板间接传递热量。

特点

  • 兼容性强、易于维护、可靠性高(液体与设备不直接接触)

  • 存在问题:未实现100%液冷,节能收益可能不显着;液冷板设计需适配现有器件布局,标准化难度大

冷板式技术分类

  • L2A(Liquid to Air):空气辅助液体冷却,适用于传统空气冷却数据中心,无需额外液冷基础设施

  • L2L(Liquid to Liquid):通过CDU清除MW级IT热量,需要额外液冷基础设施

冷板式发展方向一:两相式
允许冷却液在冷却过程中发生相变(液态吸热沸腾为气态,冷凝端放热变回液态)。两相冷板式液冷系统有望实现2500W芯片散热。

冷板式发展方向二:微通道(MLCP)
MLCP(微通道水冷板)通过蚀刻工艺将传统毫米级流道缩小至微米级(30-150微米),并将均热板、水冷板、芯片封装盖板整合为单一单元,减少导热界面材料的使用,使冷却液更直接高效地带走热量。MLCP单价可达传统水冷板的3-5倍,毛利率较高。以GB300架构为例,一个机柜需要108+18个MLCP,报价约800-900美元/块。

前沿进展:微软已成功开发微流体冷却技术,通过细如发丝的微小通道将冷却液直接输送到芯片内部,散热效率比现有散热板高出三倍,能将芯片最高温升降低65%。

4.2 浸没式液冷

单相浸没式

  • 浸没机柜设计更简单,氟化液更易操作、维护

  • 材料兼容性和循环中污染物隐患更少

双相(相变)浸没式

  • 通过冷却液沸腾(液相→气相)实现更高传热效率

  • 功率密度可达250-500kW/浸没腔

  • 冷却基础设施较简单(如使用干式冷却器,无需冷却水塔等蒸发降温设施)


五、总结

在高密度算力功率持续提升的背景下,液冷技术凭借其优异的散热能力、更低的TCO、对PUE政策的良好响应以及云厂商的积极推动,已成为智算中心散热温控的主要技术方向。冷板式液冷当前占据主流,未来将向两相式、微通道等方向演进;浸没式液冷在超高热密度场景中亦具有广阔应用前景。液冷技术的持续创新将为AI算力的爆发式增长提供坚实的热管理基础。

相关新闻更多