|
 【產(chǎn)通社,11月20日訊】近年來,數(shù)據(jù)中心機(jī)架密度迅速上升。運(yùn)營商正在將更多的計(jì)算能力塞進(jìn)每個(gè)服務(wù)器機(jī)架中,以滿足人工智能(AI)和其他高性能計(jì)算應(yīng)用的需求。這意味著每個(gè)機(jī)架需要更多千瓦的能量,并最終產(chǎn)生更多的熱量。不過,冷卻基礎(chǔ)設(shè)施一直難以跟上步伐。 戴爾技術(shù)公司全球行業(yè)首席技術(shù)官David Holmes表示:“機(jī)架密度已經(jīng)從八年前的平均每機(jī)架6千瓦,發(fā)展到現(xiàn)在的270千瓦。明年,480千瓦將準(zhǔn)備就緒,兆瓦機(jī)架將在兩年內(nèi)與我們一起使用! 瑞士公司Corintis正在開發(fā)一種名為微流道(microfluidic channels)的技術(shù),在這種技術(shù)中,水或其他冷卻液被直接引導(dǎo)到芯片的特定部分,以防止過熱。在最近與微軟的一項(xiàng)測試中,運(yùn)行該公司Teams視頻會議軟件的服務(wù)器記錄的散熱率是其他現(xiàn)有冷卻方法的三倍。與傳統(tǒng)的空氣冷卻相比,微流體將芯片溫度降低了80%以上。 利用微流道技術(shù)提升芯片性能 較低的芯片溫度使芯片能夠更快地執(zhí)行指令,從而提高其性能。在較低溫度下運(yùn)行的芯片也更節(jié)能,故障率更低。此外,可以提高用于冷卻的空氣溫度,通過減少對冷卻器的需求和降低液體消耗,使數(shù)據(jù)中心更節(jié)能。 通過將液體流定向到芯片上產(chǎn)生最多熱量的位置,可以大大降低冷卻芯片所需的水量。Van Erp指出,目前的行業(yè)標(biāo)準(zhǔn)約為每千瓦功率每分鐘1.5升。由于芯片的功率接近10千瓦,這很快意味著每分鐘冷卻一個(gè)芯片需要15升——這一數(shù)字將引起社區(qū)的憤怒,他們擔(dān)心為他們的地區(qū)計(jì)劃的任何超大規(guī)模的“人工智能工廠”的影響,這些工廠可能包含100萬個(gè)或更多的GPU。 Corintis的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Remco van Erp表示:“我們需要優(yōu)化芯片特定的液體冷卻,以確保每一滴液體都流向正確的位置! Corintis開發(fā)的模擬和優(yōu)化軟件用于設(shè)計(jì)冷板上的微觀小通道網(wǎng)絡(luò)。就像身體循環(huán)系統(tǒng)中的動脈、靜脈和毛細(xì)血管一樣,每種芯片的理想冷板設(shè)計(jì)都是由形狀精確的通道組成的復(fù)雜網(wǎng)絡(luò)。 Corintis已經(jīng)擴(kuò)大了其增材制造能力,能夠大規(guī)模生產(chǎn)通道窄如人類頭發(fā)(約70微米)的銅部件。其冷板技術(shù)與當(dāng)今的液體冷卻系統(tǒng)兼容。該公司認(rèn)為,這種方法可以將冷板結(jié)果提高至少25%。通過與芯片制造商直接合作,在硅本身中開辟通道,Corintis認(rèn)為最終可以實(shí)現(xiàn)十倍的冷卻效果。 推進(jìn)AI芯片的液體冷卻 液體冷卻遠(yuǎn)非新鮮事。例如,半個(gè)多世紀(jì)前,IBM 360大型機(jī)是用水冷卻的。現(xiàn)代液體冷卻在很大程度上是浸沒系統(tǒng)和直接芯片系統(tǒng)之間的競爭,在浸沒系統(tǒng)中,機(jī)架和有時(shí)整排設(shè)備都浸沒在冷卻液中,在直接芯片系統(tǒng)中,冷卻液被引導(dǎo)到放置在芯片上的冷板上。 浸沒式冷卻尚未準(zhǔn)備好進(jìn)入黃金時(shí)段。雖然直接芯片冷卻被廣泛部署以保持GPU的冷卻,但它只冷卻芯片表面周圍。 van Erp說:“當(dāng)今形式的液體冷卻是一種一刀切的解決方案,依賴于不適合芯片的簡單設(shè)計(jì),這阻礙了良好的熱傳遞”!懊總(gè)芯片的最佳設(shè)計(jì)是一個(gè)由精確形狀的微尺度通道組成的復(fù)雜網(wǎng)絡(luò),這些通道與芯片相適應(yīng),將冷卻劑引導(dǎo)到最關(guān)鍵的區(qū)域! Corintis已經(jīng)在與芯片制造商合作改進(jìn)設(shè)計(jì)。芯片制造商正在使用該公司的熱仿真平臺以毫米級分辨率對硅測試芯片的散熱進(jìn)行編程,然后在安裝所選的冷卻方法后感測芯片上的溫度。換句話說,Corintis充當(dāng)芯片設(shè)計(jì)和冷卻系統(tǒng)設(shè)計(jì)之間的橋梁,使芯片設(shè)計(jì)人員能夠?yàn)锳I應(yīng)用構(gòu)建具有卓越熱性能的未來芯片。 下一階段是從冷卻通道和芯片設(shè)計(jì)之間的橋梁轉(zhuǎn)變?yōu)檫@兩個(gè)過程的統(tǒng)一!艾F(xiàn)代芯片和冷卻目前是兩個(gè)獨(dú)立的元件,兩者之間的界面是傳熱的主要瓶頸之一,”van Erp說。 為了將冷卻性能提高十倍,Corintis押注于一個(gè)未來,即冷卻作為芯片本身的一個(gè)組成部分緊密耦合——微流體冷卻通道將直接在微處理器封裝內(nèi)蝕刻,而不是在周邊的冷板上蝕刻。 Corintis已經(jīng)生產(chǎn)了10000多塊銅冷板,并正在提高其制造能力,到2026年底達(dá)到100萬塊冷板。它還在瑞士開發(fā)了一條原型生產(chǎn)線,在那里它正在開發(fā)直接在芯片內(nèi)而不是在冷板上的冷卻通道。這只計(jì)劃用于小批量演示基本概念,然后將這些概念交給芯片制造商和冷板制造商。 Corintis在微軟Teams測試發(fā)布后立即宣布了這些擴(kuò)張計(jì)劃。此外,該公司還將在美國開設(shè)辦事處,為美國客戶提供服務(wù),并在德國慕尼黑開設(shè)工程辦事處。此外,該公司還宣布完成由BlueYard Capital和其他投資者牽頭的2400萬美元a輪融資。(編譯:鐠元素;剪報(bào)來源:IEEE)
|