行業(yè)里存在這樣一種說法:全世界的數(shù)據(jù)中心消耗了大量的能源——事實(shí)也確實(shí)如此。具體消耗量因來源(和數(shù)據(jù)中心)而異,但大致上一個(gè)數(shù)據(jù)中心可以消耗 100 兆瓦;該數(shù)目來自 Energy Innovation (EI) 的報(bào)告《數(shù)據(jù)中心到底用了多少能源?(How Much Energy Do Data Centers Really Use?) 》。
下方餅圖也出自這份報(bào)告,報(bào)告中表示,粗略來看,全世界一半的電力用于運(yùn)行數(shù)據(jù)中心的設(shè)備,另一半用于將電力輸送到建筑內(nèi)并將熱量排出。
一個(gè)很好的例子是位于美國俄勒岡州達(dá)爾斯市的谷歌數(shù)據(jù)中心——因?yàn)槟抢镌ㄓ袖X冶煉廠。鋁是利用大量的電力從鋁土礦中提煉出來的,所以冶煉廠總是位于發(fā)電廠附近,如水電大壩。俄勒岡州的鋁冶煉廠關(guān)閉了,因此有大量的電力可用,所以谷歌在那里建立了數(shù)據(jù)中心。另外,該數(shù)據(jù)中心位于哥倫比亞河上,這為冷卻提供了一個(gè)取之不盡的冷水來源。這是我所知道的“熊彼特創(chuàng)造性破壞理論”最好的例子之一:20 世紀(jì)的鋁冶煉廠被 21 世紀(jì)的超大規(guī)模數(shù)據(jù)中心所取代。
全球數(shù)據(jù)中心的電力增長幅度是多少?
既然全球各地都在建造越來越多的數(shù)據(jù)中心,那么可以假設(shè),數(shù)據(jù)中心的總耗電量正在快速增長。一些推測性的圖表顯示整個(gè)世界的電力供應(yīng)將用于為數(shù)據(jù)中心(或比特幣礦工)供電:
“
隨著全球互聯(lián)網(wǎng)用戶數(shù)量的增長,市場對數(shù)據(jù)中心服務(wù)的需求也在增加,這引起了人們對數(shù)據(jù)中心能源使用增長的擔(dān)憂。2010 年至 2018 年間,全球 IP 流量(在互聯(lián)網(wǎng)上傳輸?shù)臄?shù)據(jù)量)增加了 10 倍以上,而同時(shí)全球數(shù)據(jù)中心的存儲容量也增加了 25 倍。在同一時(shí)期,全球服務(wù)器上運(yùn)行的計(jì)算實(shí)例數(shù)量(托管的總應(yīng)用數(shù))增加了 6 倍以上。
——Energy Innovation (EI) 報(bào)告
”
但事實(shí)證明,擔(dān)憂這些問題的人對半導(dǎo)體、EDA、摩爾定律以及使芯片的功耗越來越低的解決方案一無所知。目前,全球數(shù)據(jù)中心的總耗電量約為 200TWh/年,但其實(shí)這與十年前沒有什么不同。以下內(nèi)容來自 EI 報(bào)告:
“
然而,從自下而上的角度來看,新的結(jié)果表明情況并非如此:盡管在過去十年中,信息服務(wù)的需求快速增長,但在 2010 年至 2018 年間,全球數(shù)據(jù)中心的能源使用可能只增加了 6%。
……
2018 年全球數(shù)據(jù)中心消耗了約 205 太瓦時(shí) (TWh),占全球電力使用的 1%,這一發(fā)現(xiàn)與先前基于外推法的估算數(shù)據(jù)形成了鮮明的對比——此前估計(jì)在過去十年內(nèi),數(shù)據(jù)中心的能源使用迅速上升。
——Energy Innovation (EI) 報(bào)告
”
從某種意義上說,這是很了不起的。另一方面,在 2010 年至 2018 年間,半導(dǎo)體工藝技術(shù)經(jīng)歷了幾個(gè)節(jié)點(diǎn):2010 年時(shí)28nm 還沒有問世,然后到 2018 年時(shí) 7nm已然誕生。每前進(jìn)一個(gè)節(jié)點(diǎn)都會使功耗降低約 30%,這意味著同樣的功能,2018 年的功耗約為 2010 年的 15%。因此,即便互聯(lián)網(wǎng)流量、數(shù)據(jù)中心、云計(jì)算經(jīng)歷了爆炸式增長,使用的電力僅占全球電力總量的 1%。
測算功耗
2010 年至今的另一個(gè)變化是,我們在設(shè)計(jì)芯片時(shí)可以使用更好的工具來測算功耗。曾經(jīng)除了憑感覺判斷,我們只能使用 Excel 表格來測算功耗。2010 年之前,這幾乎是芯片設(shè)計(jì)師、服務(wù)器設(shè)計(jì)師和整個(gè)數(shù)據(jù)中心設(shè)計(jì)師的唯一工作方式。這個(gè)方法通常會導(dǎo)致非常悲觀的設(shè)計(jì),因?yàn)榇蠹覠o法承受芯片過熱熔化,或者整個(gè)機(jī)架過熱的后果。
當(dāng)然,這個(gè)問題需要一層一層入手,彼此嵌套。一個(gè)數(shù)據(jù)中心由一排又一排的機(jī)架組成。每個(gè)機(jī)架通常包含大量的服務(wù)器,并在頂部配有路由器。這些服務(wù)器通常被稱為“披薩盒”,因?yàn)槠浯笮『托螤畲笾氯绱?,并且?a target="_blank">處理器、GPU 和其他芯片取代了意大利香腸。這些是所有熱量的來源。因此,要想提高機(jī)架(乃至整個(gè)數(shù)據(jù)中心)功耗估算數(shù)據(jù)的準(zhǔn)確性,就要從準(zhǔn)確計(jì)算每個(gè)芯片的耗散功耗入手。
Voltus 和 Celsius
Cadence Voltus IC Power Integrity Solution 和 Celsius Thermal Solver可以在這方面發(fā)揮重要作用,深入了解請閱讀文章《免費(fèi)下載 I 如何在芯片的熱分析中實(shí)現(xiàn)2+2=5?》。
Voltus 主要用于計(jì)算芯片上各處的 IR 壓降,并同時(shí)生成 Voltus 熱模型 (Voltus Thermal Models ,VTM)。VTM 模型包含裸片上的材料特性、金屬密度(因?yàn)榻饘偌葘?dǎo)熱又導(dǎo)電)、動態(tài)功耗信息以及與溫度有關(guān)的泄漏功耗。
以上只是一個(gè)起點(diǎn);芯片裝在封裝里,封裝又裝在電路板上——因此,芯片產(chǎn)生的一些熱量是分散的,因?yàn)榉庋b和電路板在傳導(dǎo)信號的同時(shí)也在傳導(dǎo)熱量。同時(shí)其周邊還有其他重要的熱源,如散熱器、熱管、風(fēng)扇等等。此時(shí) Celsius Thermal Solver就派上了用場,它是 Cadence推出的業(yè)內(nèi)首款用于完整電熱協(xié)同仿真系統(tǒng)分析的熱求解器,由兩個(gè)不同的基礎(chǔ)求解器組成:一個(gè)基于有限元方法 (FEM),用于處理通過電路板的傳導(dǎo)及輻射熱;另一個(gè)基于計(jì)算流體力學(xué) (CFD),用于處理與流體有關(guān)的一切,通常是氣流,但也包括水冷所涉及的流體(或?qū)嶋H上通常使用的其他流體)。
經(jīng)過生產(chǎn)驗(yàn)證,Celsius Thermal Solver的大規(guī)模并行架構(gòu)可在不犧牲精度的前提下,提供比傳統(tǒng)解決方案加快10倍的性能。
同時(shí),Celsius Thermal Solver 可以和Voltus工具無縫集成、協(xié)同工作,對“披薩盒服務(wù)器”進(jìn)行非常精確的分析;然后將這些數(shù)據(jù)相加,得到一整個(gè)機(jī)架的數(shù)據(jù);再將機(jī)架數(shù)據(jù)相加,得到一整個(gè)數(shù)據(jù)中心的數(shù)據(jù)。同時(shí),這種分析也可用于決定在哪里放置風(fēng)扇、擋板和散熱器等部件。
下圖顯示了通過Voltus 和 Celsius的熱分析而發(fā)現(xiàn)的“比薩盒服務(wù)器”中的問題:
如果想進(jìn)一步了解Voltus 和 Celsius 之間1+1>2的熱分析,歡迎點(diǎn)擊下圖下載白皮書《使用 Celsius Thermal Solver 對 3D-IC 進(jìn)行熱和應(yīng)力分析》,該白皮書詳細(xì)講述了Voltus 和 Celsius的協(xié)同工作流程:
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7104瀏覽量
89294
發(fā)布評論請先 登錄
相關(guān)推薦
評論