不管是天命打工人,还是投资人,都需要了解行业、技术方向等信息,才能更好的把握未来的命脉......
工作需要脚踏实地,人生需要仰望星空。
核心要点:AI算力发展与政策PUE等驱动下,芯片级散热将从热管/VC转向更高效的3DVC与液冷,芯片级散热有望打开成长空间。
电子设备发热的本质原因就是工作能量转化为热能的过程。散热是为解决高性能计算设备中的热管理问题而设计的,它们通过直接在芯片或处理器表面移除热量来优化设备性能并延长使用寿命。
随着芯片功耗的提升,散热技术从一维热管的线式均温,到二维VC的平面均温,发展到三维的一体式均温,即3D VC技术路径,最后发展到液冷技术。
主要散热技术:从风冷到液冷,冷板到浸没式
散热技术包括风冷与液冷两类。风冷技术中,热管与VC的散热能力较低,3D VC散热上限扩至1000W,均需搭配风扇进行散热,技术简单、便宜,适用于大多数设备。
液冷技术具备更高散热效率,包括冷板式与浸没式两类,其中冷板式为间接冷却,初始投资中等,运维成本较低,相对成熟,英伟达GB200 NVL72采用冷板式液冷解决方案;浸没式为直接冷却,技术要求较高,运营维护成本较高,曙光数创研发“1拖2”双相浸没液冷结构。
AI算力发展与政策PUE等驱动下,芯片级散热将从热管/VC转向更高效的3DVC与冷板,芯片级散热有望打开成长空间、迎量价齐升。
相关公司
1)芯片散热:曙光数创、飞荣达、中航光电、立讯精密、中石科技、思泉新材;
2)数据中心散热:英维克、高澜股份、申菱环境、佳力图、朗威股份、依米康、同飞股份、川润股份、润泽科技、科华数据、网宿科技;
3)服务器整机:浪潮信息、中科曙光、工业富联、华勤技术、紫光股份、中兴通讯、软通动力、神州数码、烽火通信、中国长城等。
据《电子芯片散热技术的研究现状及发展前景》,如对于稳定持续工作的电子芯片,最高温度不能超过85 ℃,温度过高会导致芯片损坏。
芯片散热革新:浸没式散热效果好,冷板式更为成熟
根据ODCC《冷板液冷服务器设计白皮书》,综合考量初始投资成本、可维护性、PUE 效果以及产业成熟度等因素,冷板式和单相浸没式相较其他液冷技术更有优势,是当前业界的主流解决方案。
热管:高效传热器件,适用大功率和空间小场景
热管,也称为Heat Pipe,是一种高效的传热器件。它能够通过内部工作流体的相变过程,快速地将热量从一端传递到另一端,其结构简单,由密闭容器、毛细结构、工作流体组成。
VC:相比热管,具备更高的导热效率与灵活性
VC均温板,全称为Vapor Chamber,即真空腔均热板散热技术,是一种比热管更先进、更高效的导热元件,尤其在处理高密度电子设备的热管理问题时表现出色。
相比热管,VC的导热效率与灵活度更强。铜的导热系数为401W/m.k,热管可以达到5000~8000 W/m‧k,而均热板则可以达到20000~10000W/m‧k,甚至更高。热管是一维导热,受其形状显示。
而均热板形状则不受限制,可以根据芯片的布局,设计任意形状,甚至可以兼容处于不同高度的多个热源的散热。
3D VC:具备高效散热、均匀温度分布、减少热点优势
3D VC基础知识与应用场景
3D VC(三维两相均温技术):是利用热管与均温板蒸汽腔体贯通的散热技术。
3D VC具有“高效散热、均匀温度分布、减少热点”等解热优势,可满足大功率器件解热、高热流密度区域均温的瓶颈需求,也可以保证获得更强的超频性能以及超频后的系统稳定性。
对比热管/均温板间导热,是把热量传递至二次组装的多根热管/均温板,存在接触热阻以及铜本身的热阻;而3D VC通过三维结构连通下,内部液体相变、热扩散,直接、高效地将芯片热量传递至齿片远端散热。
冷板式液冷:需改造服务器,渗透率逐渐提升
冷板式服务器需要对服务器进行管路、结构等改造:如浪潮信息基于2U四节点高密计算服务器i24,新增多块冷板与CPU、I/0、内存等发热单元接触,也设置多条管路在内与冷板连通、在外连接机柜级别的分歧管道,实现系统中95%左右热量通过冷板接触热源由液体直接带走,剩余5%左右热量经由PSU电源后置的风液式换热器里面的冷却水带走。
单相浸没:实现服务器全液冷,技术难度较高
单相浸没液冷机柜:是将液冷服务器内置于Tank内部,CDU与Tank之间由管道链接,下部管道输送低温冷却介质到t ank内,液冷介质吸收了液冷服务器的热量,温度上升后流回CDU,热量由CDU带走。此种结构可实现服务器的全液冷,无风扇的设计使功率密度更高,相比风冷PUE更低。但技术难度较高,渗透率相对较低。
阿里云布局浸没式液冷系统:2016年,阿里云发布首套浸没式液冷系统,于2017年完成浸没式液冷集群构建;2018年,建成首个互联网液冷数据中心;2020年,打造中国最大规模的单相浸没式液冷数据中心暨全国首座5A级绿色液冷数据中心。
双相浸没:技术要求较高,可大幅提升系统功率密度
1)“1拖2”单元结构:由中间CDM液冷柜和左右两侧计算机柜构成。两侧机柜内服务器产生的热量由中间CDM液冷机柜带走。
中间液冷柜内集成CDM、循环管路等系统。此种结构可以大幅度提升系统功率密度,降低数据中心建设难度。
2)刀片式相变浸没腔:独立可插拔设计,完全解耦节点与节点之间的热循环路径,使得每一个节点都可以进行独立的插拔,方便用户对单独的节点进行硬件升级或维护。
3)芯片强化沸腾散热设计:由于服务器内主芯片功率较高,芯片表面需要进行强化沸腾处理,以增加其表面的气化核心,增强相变换热效率。曙光数创的浸没相变液冷数据中心基础设施产品对芯片采用了强化沸腾封装的方式,换热区域采用高密翅片来强化沸腾界面的沸腾换热,最高可实现100W/cm²以上的散热密度。
最近,我也在研究2个新的方向,一个是氟利昂多相流fluent仿真分析、另一个是压电风扇的逆向建模与仿真分析。
目前进展顺利,第一个方向已基本搞清楚原理、注意事项还有相关参数设置等;第二个3D逆向建模已完成90%,后续研究几篇博士论文,开始进行压电风扇的流固耦合等分析,后续再和大家分享。