一年一度的國(guó)際超級(jí)計(jì)算大會(huì)(SupercomputingConference,以下簡(jiǎn)稱SC)上,每次都有一個(gè)非官方的主題出現(xiàn)。過(guò)去兩年的焦點(diǎn)是機(jī)器學(xué)習(xí)(Machine learning)和深度學(xué)習(xí)(Deep learning),而在之前則是大規(guī)模數(shù)據(jù)密集計(jì)算,以及利用云重塑超級(jí)計(jì)算未來(lái)發(fā)展方向的潛力。
所有這些主題都有一個(gè)共同點(diǎn),那就是:它們的重點(diǎn)都不是CPU處理器。實(shí)際上,它們都是圍繞X86架構(gòu)下的CPU性能提升或生態(tài)系統(tǒng)發(fā)展的相關(guān)話題?;叵胍幌?,近年來(lái)我們最后一次看到硬件設(shè)備成為大會(huì)的核心主題,還是在第一批大規(guī)模GPU超級(jí)計(jì)算機(jī)進(jìn)入500強(qiáng)榜單時(shí),然而它們只是加速器而不是設(shè)備的核心。
在今年的SC17上,核心處理器再次成為了非官方主題?;?a target="_blank">ARM架構(gòu)的硬件和軟件生態(tài)系統(tǒng)進(jìn)行了廣泛的演示,Cray等超級(jí)計(jì)算公司還展示了全面的系統(tǒng)集成效果,很多基準(zhǔn)測(cè)試的結(jié)果足以與英特爾的最先進(jìn)產(chǎn)品相抗衡。
基于ARM處理器的“Isambard”超級(jí)計(jì)算機(jī)將包含10,000個(gè)內(nèi)核(采用Cavium的ThunderX2 ARM處理器),將于明年在英國(guó)布里斯托大學(xué)面世,負(fù)責(zé)開(kāi)發(fā)該超級(jí)計(jì)算機(jī)的團(tuán)隊(duì)一直致力于基于ARM的HPC系統(tǒng)的研究和開(kāi)發(fā)工作。我們現(xiàn)在看到,在基于大量開(kāi)發(fā)工作鋪墊的ARM系統(tǒng)中,最著名的當(dāng)屬巴塞羅那超級(jí)計(jì)算中心的Mont Blanc(幾年前開(kāi)始采用雙Cortex-A15 ARM,現(xiàn)在基于Cavium ThunderX2 ARM處理器)。
McIntosh-Smith和他的團(tuán)隊(duì)日前公布了一些很有意義的基準(zhǔn)測(cè)試結(jié)果。這次基準(zhǔn)測(cè)試采用了Cray 8節(jié)點(diǎn)設(shè)備集群和32核ThunderX2 ARM處理器,并與英特爾Skylake和Broadwell解決方案進(jìn)行了對(duì)比。下面列出了在多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn) -
McIntosh-Smith表示,總體而言,以內(nèi)存帶寬密集型的任何應(yīng)用都能夠在ThunderX2上很好地運(yùn)行,性能顯著優(yōu)于 Skylake。然而對(duì)于偏向浮點(diǎn)密集型的應(yīng)用來(lái)說(shuō),因?yàn)镾kylake使用了更寬的向量運(yùn)算器所以會(huì)更勝一籌,但是ThunderX2 能與Broadwell平臺(tái)旗鼓相當(dāng)。如果繼續(xù)增加高帶寬內(nèi)存,測(cè)試結(jié)果會(huì)怎么樣?這將會(huì)非常有趣。
基準(zhǔn)測(cè)試結(jié)果請(qǐng)參見(jiàn)下圖:
內(nèi)存帶寬密集型的優(yōu)勢(shì)在OpenFOAM上的HPC應(yīng)用中體現(xiàn)得最為明顯——OpenFOAM是一種開(kāi)源CFD應(yīng)用,通常更多地用于商業(yè)和科研領(lǐng)域的高性能計(jì)算。上圖的基準(zhǔn)測(cè)試報(bào)告顯示,ThunderX2的OpenFOAM測(cè)試結(jié)果要好于Skylake 和 Broadwell 。
天氣和氣候模擬代碼也顯示內(nèi)存帶寬密集型應(yīng)用的性能會(huì)有同樣的提高。上圖顯示了在ThunderX2上測(cè)試英國(guó)氣象局(Met Office)的生產(chǎn)代碼的情況——Nemo是一種海洋模擬代碼。
“初步的結(jié)果顯示,對(duì)于GROMACS、CP2K和VASP等計(jì)算密集型的應(yīng)用,不同處理器之間的性能差距很小。而內(nèi)存帶寬密集型的應(yīng)用則可以顯著看出不同處理器之間的差異。這是因?yàn)?,盡管這些代碼可受益于X86處理器的更廣泛向量單位,但ThunderX2可以借助更多內(nèi)核和更高的時(shí)鐘速度來(lái)進(jìn)行補(bǔ)償,“McIntosh-Smith說(shuō)。
隨著高端Cray XC50系統(tǒng)的面世,我們將在下一屆超級(jí)計(jì)算大會(huì)上看到基于ARM處理器的實(shí)際生產(chǎn)環(huán)境中的超級(jí)計(jì)算機(jī)的更多測(cè)試結(jié)果。
Isambard項(xiàng)目架構(gòu)請(qǐng)參見(jiàn)下圖:
直到今天,很多HPC ARM觀察家都知道Isambard是Cray的機(jī)型;但如果他們知道這家超級(jí)計(jì)算機(jī)生產(chǎn)商選擇了一條更加艱難的道路,將ThunderX2 ARM處理器與業(yè)內(nèi)著名的Aries互聯(lián)芯片相集成,并可以運(yùn)行全套Cray軟件的話,很多人肯定會(huì)大吃一驚。相比較而言,如果把ThunderX2添加到CS Storm系列,而不是基于Aries的產(chǎn)品系列中,對(duì)Cray來(lái)說(shuō)將簡(jiǎn)單得多。但在McIntosh-Smith看來(lái),這恰恰彰顯了Cray將ARM廣泛用于HPC領(lǐng)域的堅(jiān)定決心。
McIntosh-Smith認(rèn)為,將來(lái)不同的ARM選項(xiàng)可能會(huì)采用同一種專用的部署方法。“將來(lái),基于ARM的HPC將增強(qiáng)向量功能,達(dá)到與其他CPU廠商不相上下的水平。下一代ARM產(chǎn)品將具有和任何其他廠商產(chǎn)品相當(dāng)?shù)南蛄繉挾取!?/p>
有趣的一點(diǎn)是這些結(jié)果基于單純優(yōu)化內(nèi)核數(shù)量和基本條件后的編譯結(jié)果,只進(jìn)行了幾個(gè)小時(shí)的微調(diào)。McIntosh-Smith表示,這些今天實(shí)現(xiàn)的突飛猛進(jìn),實(shí)際上是多年來(lái)在基于ARM的HPC系統(tǒng)上堅(jiān)持不懈的努力結(jié)果。在硬件就緒后,ARM在HPC應(yīng)用中所需的軟件也會(huì)更快到位,隨著面向超級(jí)計(jì)算機(jī)的ARM處理器的正式上市,整個(gè)行業(yè)將迎來(lái)架構(gòu)改造的新紀(jì)元,ARM架構(gòu)將在HPC領(lǐng)域揭開(kāi)廣泛處理器選擇的新篇章。
-
HPC
+關(guān)注
關(guān)注
0文章
316瀏覽量
23773
原文標(biāo)題:HPC將迎來(lái)處理器變革新時(shí)代
文章出處:【微信號(hào):icbank,微信公眾號(hào):icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論