北京2024年1月24日 /美通社/ -- 業(yè)界首部《全液冷冷板系統(tǒng)參考設(shè)計及驗證白皮書》現(xiàn)已正式開放下載,該白皮書由浪潮信息、英特爾、OCTC開放計算標(biāo)準(zhǔn)工作委員會、全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會算力標(biāo)準(zhǔn)工作組、中國電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合撰寫,詳細(xì)解讀了液冷技術(shù)的背景、技術(shù)優(yōu)化方向以及全液冷冷板系統(tǒng)的設(shè)計、驗證和展望,為全液冷冷板服務(wù)器設(shè)計和規(guī)模應(yīng)用中面臨的主要難點提供了創(chuàng)新設(shè)計參考,對全液冷冷板技術(shù)在通用架構(gòu)上實現(xiàn)快速導(dǎo)入和推廣具有重要指導(dǎo)意義。
主流中的前沿——全液冷冷板技術(shù)
目前,冷板式液冷由于在產(chǎn)業(yè)鏈成熟度、改造成本、可維護(hù)性、兼容性等方面的優(yōu)勢,已經(jīng)成為液冷數(shù)據(jù)中心主流。IDC數(shù)據(jù)顯示,2023上半年中國液冷服務(wù)器市場中,冷板式占比高達(dá)90%。但現(xiàn)有的冷板式液冷技術(shù)依然有持續(xù)優(yōu)化的空間,最主要的問題在于冷板一般僅覆蓋CPU、GPU等高功耗發(fā)熱部件,數(shù)據(jù)中心需要配置CDU和空調(diào)兩套冷卻系統(tǒng),PUE值無法達(dá)到接近于1的理想狀態(tài)。同時,傳統(tǒng)冷板式服務(wù)器是高度定制化產(chǎn)品,冷板的材質(zhì)選擇、結(jié)構(gòu)設(shè)計、加工工藝以及部件規(guī)格等不一致,規(guī)模化應(yīng)用受限。因此,冷板式液冷需要從系統(tǒng)級解決方案出發(fā),以模塊化解耦設(shè)計思維,創(chuàng)新出一種高能效、易運維、使用更安全,兼容性更出色、液冷覆蓋率更高的全液冷冷板結(jié)構(gòu)設(shè)計。
作為目前液冷產(chǎn)業(yè)技術(shù)創(chuàng)新的前沿領(lǐng)域,全液冷冷板技術(shù)可實現(xiàn)"服務(wù)器內(nèi)去風(fēng)扇、數(shù)據(jù)中心去空調(diào)化"運行,更加高效節(jié)能與靜音,并以高集成度節(jié)省30%左右的數(shù)據(jù)中心空間,單機(jī)柜支持100KW的高密度部署。
浪潮信息基于自身在液冷技術(shù)創(chuàng)新、產(chǎn)業(yè)化推進(jìn)及國標(biāo)團(tuán)標(biāo)等產(chǎn)業(yè)標(biāo)準(zhǔn)化方面的長期實踐,與英特爾、OCTC開放計算標(biāo)準(zhǔn)工作委員會、全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會算力標(biāo)準(zhǔn)工作組、中國電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合編寫了《全液冷冷板系統(tǒng)參考設(shè)計及驗證白皮書》,旨在為全液冷冷板服務(wù)器設(shè)計和規(guī)模應(yīng)用中面臨的主要難點提供創(chuàng)新設(shè)計參考,以模塊化解耦的先進(jìn)設(shè)計理念,推動基于通用服務(wù)器架構(gòu)的全液冷冷板技術(shù)快速普及。
白皮書指出,冷板液冷服務(wù)器設(shè)計技術(shù)優(yōu)化方向主要圍繞通過技術(shù)創(chuàng)新進(jìn)一步提高能效,降低初期投資成本,減少漏液安全隱患及提高運維便利性展開,一是持續(xù)完善部件液冷方案,提高液冷覆蓋率;二是提高通用化及可維護(hù)性;三是拓展冷板液冷材料范圍,減輕重量,降低成本;四是提升液冷系統(tǒng)長期使用的安全性,降低漏液風(fēng)險。
創(chuàng)新實踐——全液冷冷板服務(wù)器,打通規(guī)模化應(yīng)用的"最后一公里"
白皮書詳細(xì)介紹了浪潮信息在全液冷冷板技術(shù)上的創(chuàng)新實踐成果——全液冷冷板服務(wù)器,實現(xiàn)了對CPU、高功耗內(nèi)存、NVMe硬盤、OCP網(wǎng)卡、電源、PCIe轉(zhuǎn)接卡和光模塊等服務(wù)器主要發(fā)熱部件的冷板全液冷覆蓋,并針對不同部件的結(jié)構(gòu)、材質(zhì)、工作溫度等差異化需求,創(chuàng)新設(shè)計了諸多系統(tǒng)部件級液冷解決方案,實現(xiàn)了液冷模塊解耦,為全球液冷產(chǎn)業(yè)鏈上下游提供極具價值的參考樣板,推動先進(jìn)全液冷冷板解決方案在全球數(shù)據(jù)中心的大規(guī)模部署應(yīng)用,實現(xiàn)數(shù)據(jù)中心更加綠色低碳可持續(xù)發(fā)展。
全液冷冷板服務(wù)器的CPU冷板模組基于英特爾第五代至強平臺可擴(kuò)展處理器冷板的設(shè)計要求,綜合考慮散熱,結(jié)構(gòu)性能,成品率,價格及不同材質(zhì)冷板設(shè)計兼容性等因素優(yōu)化而成的一款CPU冷板參考設(shè)計,主要由CPU冷板鋁支架,CPU冷板及冷板接頭等部件組成。
內(nèi)存液冷設(shè)計采用創(chuàng)新型的枕木散熱器液冷方案,因內(nèi)存插滿如鐵軌上的枕木而得名。它將傳統(tǒng)風(fēng)冷散熱和冷板散熱相結(jié)合,通過內(nèi)置熱管的散熱器(或純鋁/銅板、Vaper Chamber等)把內(nèi)存上的熱量傳遞至兩端,與冷板通過選定的導(dǎo)熱墊片接觸,最終通過冷板內(nèi)的冷卻液把熱量帶走實現(xiàn)內(nèi)存散熱。相比現(xiàn)有的管路(Tubing)內(nèi)存液冷方案,枕木散熱器液冷方案采用模塊化設(shè)計,具有易于組裝和維護(hù)、通用性好、性價比高等優(yōu)勢。
固態(tài)硬盤液冷方案同樣采用創(chuàng)新設(shè)計,通過內(nèi)置熱管的散熱器把硬盤區(qū)域的熱量導(dǎo)出與硬盤區(qū)域外的冷板通過導(dǎo)熱墊片垂直接觸實現(xiàn)換熱。此固態(tài)硬盤液冷方案主要由裝有散熱器的固態(tài)硬盤模組,固態(tài)硬盤冷板,硬盤模組鎖緊機(jī)構(gòu),及硬盤支架組成。硬盤模組鎖緊機(jī)構(gòu)固定在硬盤支架上提供合適的預(yù)緊力來保證固態(tài)硬盤模組和固態(tài)硬盤冷板的長期接觸可靠性。為了方便硬盤冷板環(huán)路在狹小空間內(nèi)的安裝,硬盤支架在服務(wù)器深度方向采用了抽屜式的安裝方式設(shè)計。相比業(yè)界已有的硬盤液冷嘗試,此方案可支持 30 次以上系統(tǒng)不斷電熱插拔,可靠性高,對加工工藝要求低,漏液風(fēng)險低,同時可靈活適配不同厚度和數(shù)量的固態(tài)硬盤系統(tǒng)。
此外,浪潮信息對PCIe卡、OCP網(wǎng)卡和電源等部件均進(jìn)行了創(chuàng)新的冷板設(shè)計,在冷板材質(zhì)方面也進(jìn)行了探索實踐,分別基于銅材質(zhì)和鋁合金材質(zhì)冷板,從換熱性能、可靠性、成本、重量等多方面進(jìn)行對比及優(yōu)化,同時對與鋁質(zhì)冷板液冷循環(huán)回路相匹配的液冷工質(zhì),進(jìn)行了選型和相應(yīng)的腐蝕性測試驗證,為進(jìn)一步降低冷板液冷成本提供了豐富的實踐數(shù)據(jù)支持。
在測試驗證部分,全液冷冷板服務(wù)器進(jìn)行了散熱性能測試、液冷熱捕獲效率(HCR)測試、流阻測試等多項測試。在散熱性能測試中,銅冷板系統(tǒng)(冷卻工質(zhì)PG25)在目標(biāo)最差邊界條件下所有的零部件溫度都滿足溫度要求,并且還有一定安全溫度裕量;在液冷熱捕獲效率(HCR)測試中,在典型的液冷系統(tǒng)工作邊界條件下—系統(tǒng)進(jìn)水溫度38?C(W32),空氣環(huán)境溫度35?C,全液冷冷板服務(wù)器液冷熱捕獲效率(HCR)在93%左右,整機(jī)柜測試HCR值更高,可接近98%;在流阻測試中,冷卻工質(zhì)PG25在相同溫度和流量下比純水流阻高20%左右,同一工質(zhì)溫度越高流阻越低,PG25的流阻相比純水對溫度更為敏感。在51?C進(jìn)水溫度1.3LPM流量條件下,采用冷卻工質(zhì)PG25和純水的系統(tǒng)流阻分別是118kPa和99.6kPa。
全面測試結(jié)果表明,浪潮信息全液冷冷板服務(wù)器可實現(xiàn)接近100%液冷散熱,系統(tǒng)無風(fēng)扇運行,可達(dá)到PUE接近于1的極限水平,并通過"去空調(diào)化"節(jié)省 30%以上的數(shù)據(jù)中心空間,充分滿足數(shù)據(jù)中心的高密度部署需求。