随着智算中心芯片功耗持续攀升,单机柜热密度大幅提升,传统风冷技术已难以满足高密度算力场景的散热需求。液冷技术凭借其高效散热、节能降噪等优势,正逐步成为未来智算中心的核心散热技术。本文将深入分析液冷技术的系统架构、驱动因素及主流技术路线。

一、液冷:未来智算中心的核心散热技术
液冷与风冷技术相比,具有显着优势:温度传递快、带走热量多、噪音低、节能且节省空间。英伟达最新商用GB200系列及后续产品均采用冷板液冷技术,实现100%全液冷架构,液冷覆盖CPU、GPU、内存等核心部件。
二、智算中心液冷系统架构
2.1 液冷系统通用架构
液冷系统通用架构可拆解为机房侧和ICT设备侧两部分:
-
机房侧:进一步分为一次侧和二次侧
-
一次侧:包含冷却塔、一次侧管网、一次侧冷却液(通常为水)。室外侧为外部冷源,如冷水机组、冷却塔或干冷器,热量转移主要通过水温升降实现。
-
二次侧:包含CDU(冷量分配单元)、液冷机柜、二次侧管网和二次侧冷却液。室内侧包括供液环路和服务器内部流道,热量转移主要通过冷却液温度升降实现。
-
两个部分通过CDU中的板式换热器发生间壁式换热。
-
ICT设备侧:浸没式采用Tank安装制冷工质,ICT设备浸没其中;冷板式主要采用冷板贴附于核心热源(CPU、GPU、内存等)上方。
2.2 制冷工质的选择
| 液冷类型 | 常用工质 |
|---|---|
| 冷板式 | 乙二醇/丙二醇溶液(基于防冻考虑)或去离子水 |
| 浸没式 | 氟化液、矿物油(如硅油)等 |
三、液冷技术的主要驱动因素
3.1 驱动因素一:液冷相比风冷单位成本下降,散热能力更好
高散热:液冷系统常用介质(去离子水、醇基溶液、氟碳类工质、矿物油等)的载热能力、导热能力和强化对流换热系数均远大于空气。针对单芯片,液冷相比风冷具有更高的散热能力。
低TCO(总拥有成本):液冷散热技术虽会增加一定初期投资,但可通过降低运行成本快速回收。根据中兴通讯测算,以10MW数据中心为例,液冷方案(PUE1.15)相比冷冻水方案(PUE1.35),约2.2年可回收增加的基础设施初投资。施耐德数据显示,按每机架20kW和40kW部署液冷,投资成本比传统风冷分别节省10%和14%。
3.2 驱动因素二:算力功率密度提升,液冷逐步成为刚需
智算中心芯片功耗不断提升,单机柜热密度大幅快速提升。液冷将是高功率密度散热的主要方案:
-
英伟达B200芯片TDP功耗已达1000W
-
GB200超级芯片(一颗Grace CPU + 两颗Blackwell GPU)功耗达2700W
-
从Blackwell到Rubin Ultra架构演进,Vertiv数据显示,AI GPU机架峰值密度有望从2024年的130kW增长到2029年突破1MW
3.3 驱动因素三:全球数据中心能耗管控趋严,PUE考核趋严
碳中和背景下,主要国家和地区对数据中心PUE提出更严格要求。以我国为例,新建大型和超大型数据中心PUE需降至1.25以内。
目前,标准风冷数据中心中温控环节能耗占比达40%(主要为精密空调消耗)。PUE值越接近1,表明能耗主要集中于IT设备。通过液冷替代精密空调,有助于降低PUE,实现节约能耗。
3.4 驱动因素四:CSP云厂商均在设计和启用液冷方案
主流云服务提供商(CSP)已纷纷布局液冷技术,推动液冷方案在数据中心的大规模应用。

四、液冷技术分类与详解
液冷散热技术主要分为冷板式、浸没式和喷淋式三大类。按照是否相变,冷板式可分为单相冷板式与两相冷板式;浸没式可分为单相浸没式与相变浸没式。
4.1 冷板式液冷(当前主流方案)
冷却液不直接接触电子器件,通过冷板间接传递热量。
特点:
-
兼容性强、易于维护、可靠性高(液体与设备不直接接触)
-
存在问题:未实现100%液冷,节能收益可能不显着;液冷板设计需适配现有器件布局,标准化难度大
冷板式技术分类:
-
L2A(Liquid to Air):空气辅助液体冷却,适用于传统空气冷却数据中心,无需额外液冷基础设施
-
L2L(Liquid to Liquid):通过CDU清除MW级IT热量,需要额外液冷基础设施
冷板式发展方向一:两相式
允许冷却液在冷却过程中发生相变(液态吸热沸腾为气态,冷凝端放热变回液态)。两相冷板式液冷系统有望实现2500W芯片散热。
冷板式发展方向二:微通道(MLCP)
MLCP(微通道水冷板)通过蚀刻工艺将传统毫米级流道缩小至微米级(30-150微米),并将均热板、水冷板、芯片封装盖板整合为单一单元,减少导热界面材料的使用,使冷却液更直接高效地带走热量。MLCP单价可达传统水冷板的3-5倍,毛利率较高。以GB300架构为例,一个机柜需要108+18个MLCP,报价约800-900美元/块。
前沿进展:微软已成功开发微流体冷却技术,通过细如发丝的微小通道将冷却液直接输送到芯片内部,散热效率比现有散热板高出三倍,能将芯片最高温升降低65%。
4.2 浸没式液冷
单相浸没式:
-
浸没机柜设计更简单,氟化液更易操作、维护
-
材料兼容性和循环中污染物隐患更少
双相(相变)浸没式:
-
通过冷却液沸腾(液相→气相)实现更高传热效率
-
功率密度可达250-500kW/浸没腔
-
冷却基础设施较简单(如使用干式冷却器,无需冷却水塔等蒸发降温设施)
五、总结
在高密度算力功率持续提升的背景下,液冷技术凭借其优异的散热能力、更低的TCO、对PUE政策的良好响应以及云厂商的积极推动,已成为智算中心散热温控的主要技术方向。冷板式液冷当前占据主流,未来将向两相式、微通道等方向演进;浸没式液冷在超高热密度场景中亦具有广阔应用前景。液冷技术的持续创新将为AI算力的爆发式增长提供坚实的热管理基础。
