0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

M8kW_icbank ? 2017-12-21 13:50 ? 次閱讀

一年一度的國(guó)際超級(jí)計(jì)算大會(huì)(SupercomputingConference,以下簡(jiǎn)稱SC)上,每次都有一個(gè)非官方的主題出現(xiàn)。過(guò)去兩年的焦點(diǎn)是機(jī)器學(xué)習(xí)(Machine learning)和深度學(xué)習(xí)(Deep learning),而在之前則是大規(guī)模數(shù)據(jù)密集計(jì)算,以及利用云重塑超級(jí)計(jì)算未來(lái)發(fā)展方向的潛力。

所有這些主題都有一個(gè)共同點(diǎn),那就是:它們的重點(diǎn)都不是CPU處理器。實(shí)際上,它們都是圍繞X86架構(gòu)下的CPU性能提升或生態(tài)系統(tǒng)發(fā)展的相關(guān)話題?;叵胍幌?,近年來(lái)我們最后一次看到硬件設(shè)備成為大會(huì)的核心主題,還是在第一批大規(guī)模GPU超級(jí)計(jì)算機(jī)進(jìn)入500強(qiáng)榜單時(shí),然而它們只是加速器而不是設(shè)備的核心。

在今年的SC17上,核心處理器再次成為了非官方主題?;?a target="_blank">ARM架構(gòu)的硬件和軟件生態(tài)系統(tǒng)進(jìn)行了廣泛的演示,Cray等超級(jí)計(jì)算公司還展示了全面的系統(tǒng)集成效果,很多基準(zhǔn)測(cè)試的結(jié)果足以與英特爾的最先進(jìn)產(chǎn)品相抗衡。

基于ARM處理器的“Isambard”超級(jí)計(jì)算機(jī)將包含10,000個(gè)內(nèi)核(采用Cavium的ThunderX2 ARM處理器),將于明年在英國(guó)布里斯托大學(xué)面世,負(fù)責(zé)開(kāi)發(fā)該超級(jí)計(jì)算機(jī)的團(tuán)隊(duì)一直致力于基于ARM的HPC系統(tǒng)的研究和開(kāi)發(fā)工作。我們現(xiàn)在看到,在基于大量開(kāi)發(fā)工作鋪墊的ARM系統(tǒng)中,最著名的當(dāng)屬巴塞羅那超級(jí)計(jì)算中心的Mont Blanc(幾年前開(kāi)始采用雙Cortex-A15 ARM,現(xiàn)在基于Cavium ThunderX2 ARM處理器)。

McIntosh-Smith和他的團(tuán)隊(duì)日前公布了一些很有意義的基準(zhǔn)測(cè)試結(jié)果。這次基準(zhǔn)測(cè)試采用了Cray 8節(jié)點(diǎn)設(shè)備集群和32核ThunderX2 ARM處理器,并與英特爾Skylake和Broadwell解決方案進(jìn)行了對(duì)比。下面列出了在多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn) -

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

McIntosh-Smith表示,總體而言,以內(nèi)存帶寬密集型的任何應(yīng)用都能夠在ThunderX2上很好地運(yùn)行,性能顯著優(yōu)于 Skylake。然而對(duì)于偏向浮點(diǎn)密集型的應(yīng)用來(lái)說(shuō),因?yàn)镾kylake使用了更寬的向量運(yùn)算器所以會(huì)更勝一籌,但是ThunderX2 能與Broadwell平臺(tái)旗鼓相當(dāng)。如果繼續(xù)增加高帶寬內(nèi)存,測(cè)試結(jié)果會(huì)怎么樣?這將會(huì)非常有趣。

基準(zhǔn)測(cè)試結(jié)果請(qǐng)參見(jiàn)下圖:

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

內(nèi)存帶寬密集型的優(yōu)勢(shì)在OpenFOAM上的HPC應(yīng)用中體現(xiàn)得最為明顯——OpenFOAM是一種開(kāi)源CFD應(yīng)用,通常更多地用于商業(yè)和科研領(lǐng)域的高性能計(jì)算。上圖的基準(zhǔn)測(cè)試報(bào)告顯示,ThunderX2的OpenFOAM測(cè)試結(jié)果要好于Skylake 和 Broadwell 。

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

天氣和氣候模擬代碼也顯示內(nèi)存帶寬密集型應(yīng)用的性能會(huì)有同樣的提高。上圖顯示了在ThunderX2上測(cè)試英國(guó)氣象局(Met Office)的生產(chǎn)代碼的情況——Nemo是一種海洋模擬代碼。

“初步的結(jié)果顯示,對(duì)于GROMACS、CP2K和VASP等計(jì)算密集型的應(yīng)用,不同處理器之間的性能差距很小。而內(nèi)存帶寬密集型的應(yīng)用則可以顯著看出不同處理器之間的差異。這是因?yàn)?,盡管這些代碼可受益于X86處理器的更廣泛向量單位,但ThunderX2可以借助更多內(nèi)核和更高的時(shí)鐘速度來(lái)進(jìn)行補(bǔ)償,“McIntosh-Smith說(shuō)。

隨著高端Cray XC50系統(tǒng)的面世,我們將在下一屆超級(jí)計(jì)算大會(huì)上看到基于ARM處理器的實(shí)際生產(chǎn)環(huán)境中的超級(jí)計(jì)算機(jī)的更多測(cè)試結(jié)果。

Isambard項(xiàng)目架構(gòu)請(qǐng)參見(jiàn)下圖:

多種HPC應(yīng)用中進(jìn)行對(duì)比的基準(zhǔn)

直到今天,很多HPC ARM觀察家都知道Isambard是Cray的機(jī)型;但如果他們知道這家超級(jí)計(jì)算機(jī)生產(chǎn)商選擇了一條更加艱難的道路,將ThunderX2 ARM處理器與業(yè)內(nèi)著名的Aries互聯(lián)芯片相集成,并可以運(yùn)行全套Cray軟件的話,很多人肯定會(huì)大吃一驚。相比較而言,如果把ThunderX2添加到CS Storm系列,而不是基于Aries的產(chǎn)品系列中,對(duì)Cray來(lái)說(shuō)將簡(jiǎn)單得多。但在McIntosh-Smith看來(lái),這恰恰彰顯了Cray將ARM廣泛用于HPC領(lǐng)域的堅(jiān)定決心。

McIntosh-Smith認(rèn)為,將來(lái)不同的ARM選項(xiàng)可能會(huì)采用同一種專用的部署方法。“將來(lái),基于ARM的HPC將增強(qiáng)向量功能,達(dá)到與其他CPU廠商不相上下的水平。下一代ARM產(chǎn)品將具有和任何其他廠商產(chǎn)品相當(dāng)?shù)南蛄繉挾取!?/p>

有趣的一點(diǎn)是這些結(jié)果基于單純優(yōu)化內(nèi)核數(shù)量和基本條件后的編譯結(jié)果,只進(jìn)行了幾個(gè)小時(shí)的微調(diào)。McIntosh-Smith表示,這些今天實(shí)現(xiàn)的突飛猛進(jìn),實(shí)際上是多年來(lái)在基于ARM的HPC系統(tǒng)上堅(jiān)持不懈的努力結(jié)果。在硬件就緒后,ARM在HPC應(yīng)用中所需的軟件也會(huì)更快到位,隨著面向超級(jí)計(jì)算機(jī)的ARM處理器的正式上市,整個(gè)行業(yè)將迎來(lái)架構(gòu)改造的新紀(jì)元,ARM架構(gòu)將在HPC領(lǐng)域揭開(kāi)廣泛處理器選擇的新篇章。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    316

    瀏覽量

    23773

原文標(biāo)題:HPC將迎來(lái)處理器變革新時(shí)代

文章出處:【微信號(hào):icbank,微信公眾號(hào):icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基準(zhǔn)點(diǎn)識(shí)別簡(jiǎn)述

      用來(lái)進(jìn)行基準(zhǔn)點(diǎn)識(shí)別的方法根據(jù)基準(zhǔn)點(diǎn)的形狀而彼此獨(dú)立。最小的基準(zhǔn)點(diǎn)尺寸由向量點(diǎn)的尺寸決定,向量點(diǎn)可以畫(huà)和計(jì)算到基準(zhǔn)點(diǎn)邊緣。不論什么形狀的
    發(fā)表于 09-03 10:46

    Bricked Curiosity HPC無(wú)法進(jìn)行編程

    嗨,所有,得到一個(gè)好奇的HPC的盒子,可以讀取固件(1.41),并試圖通過(guò)MPLAB 4.15更新到最新的PKOB固件(1.51),它失敗了。無(wú)法進(jìn)行編程。好奇號(hào)HPC是否有應(yīng)急引導(dǎo)加載程序恢復(fù)
    發(fā)表于 10-16 15:32

    HPC-95PH

    ` HPC-95PHHPC-95PH長(zhǎng)期代理韓國(guó)HITROL液位開(kāi)關(guān)吳經(jīng)理:132.4667.5433 / 0755-26998458工作Q:1139878854 地址:深圳市南山區(qū)南海大道4050
    發(fā)表于 12-19 09:45

    HITROL HPC-95P

    ` 代理韓國(guó)HITROL液位傳感器,控制器吳經(jīng)理:0755-26998458/132.4667.5433 工作QQ:1139878854HCC(HPC)-95P系列是一款電容式液/料位開(kāi)關(guān),它通過(guò)
    發(fā)表于 12-19 09:47

    HPC-100CT-2液位計(jì)

    HPC-100CT-2液位計(jì) HPC-100CT-2液位計(jì)詳詢請(qǐng)致電: ***吳經(jīng)理工作Q:1139878854 地址:深圳市南山區(qū)科技園南海大道4050號(hào) HITROL公司運(yùn)用專利的熱擴(kuò)散技術(shù),為
    發(fā)表于 01-15 17:57

    如何在FL Studio中進(jìn)行側(cè)鏈?

    使用果味限制器在FL Studio中進(jìn)行側(cè)鏈壓縮的方法
    發(fā)表于 11-04 09:28

    使用UMC 28HPC工藝進(jìn)行MC仿真有什么問(wèn)題嗎?

    最近在使用UMC 28HPC工藝進(jìn)行MC仿真,發(fā)現(xiàn)兩個(gè)問(wèn)題:1. MC仿真結(jié)果的std(標(biāo)準(zhǔn)差)和實(shí)測(cè)結(jié)果不match,實(shí)測(cè)結(jié)果大概為仿真結(jié)果的3倍。查看了一下U28HPC的model file
    發(fā)表于 06-25 06:40

    如何在android中進(jìn)行驅(qū)動(dòng)呢

    如何在android中進(jìn)行驅(qū)動(dòng)呢?并輸出dev和sys中的界面用程序調(diào)用呢?
    發(fā)表于 03-02 09:53

    多ADC系統(tǒng)的基準(zhǔn)電壓設(shè)計(jì)

    本文討論了針對(duì)超聲成像系統(tǒng)空間受限特點(diǎn)定制的兩個(gè)成功應(yīng)用的基準(zhǔn)電路,這兩個(gè)方案均采用一個(gè)基準(zhǔn)源為多個(gè)模/數(shù)轉(zhuǎn)換器(ADC)供電。最后,對(duì)這兩個(gè)電路進(jìn)行了測(cè)試,測(cè)試結(jié)果將在后續(xù)的應(yīng)用筆記中進(jìn)行
    發(fā)表于 01-27 14:37 ?3648次閱讀
    多ADC系統(tǒng)的<b class='flag-5'>基準(zhǔn)</b>電壓設(shè)計(jì)

    在Protel DXP中進(jìn)行FPGA設(shè)計(jì)和仿真

    在Protel DXP中進(jìn)行FPGA設(shè)計(jì)和仿真
    發(fā)表于 12-25 10:09 ?0次下載

    在SDAccel中進(jìn)行調(diào)試

    在SDAccel中進(jìn)行調(diào)試
    的頭像 發(fā)表于 11-29 06:20 ?1900次閱讀

    uboot中進(jìn)行LCD初始化的流程免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是uboot中進(jìn)行LCD初始化的流程免費(fèi)下載。
    發(fā)表于 08-12 08:00 ?11次下載
    uboot<b class='flag-5'>中進(jìn)行</b>LCD初始化的流程免費(fèi)下載

    如何對(duì)推理加速器進(jìn)行基準(zhǔn)測(cè)試

      客戶對(duì)基準(zhǔn)推理學(xué)習(xí)曲線的最后階段是開(kāi)發(fā)自己的模型,使用通常來(lái)自 Nvidia 或數(shù)據(jù)中心的訓(xùn)練硬件/軟件,然后在可能的目標(biāo)推理加速器上對(duì)該模型進(jìn)行基準(zhǔn)測(cè)試。
    的頭像 發(fā)表于 06-06 16:02 ?1331次閱讀

    如何高效管理MCU內(nèi)存? 多種分配算法對(duì)比

    如何高效管理MCU內(nèi)存? 多種分配算法對(duì)比?
    的頭像 發(fā)表于 10-17 18:21 ?1247次閱讀
    如何高效管理MCU內(nèi)存? <b class='flag-5'>多種</b>分配算法<b class='flag-5'>對(duì)比</b>?

    什么是頻率域?為什么要在頻率域中進(jìn)行圖像處理?

    什么是頻率域?為什么要在頻率域中進(jìn)行圖像處理? 頻率域是指在頻率上對(duì)圖像進(jìn)行分析和處理的領(lǐng)域。在頻率域中,圖像被轉(zhuǎn)換為一組頻率成分,其中每個(gè)頻率表示圖像中某種特定的變化。頻率域分析使用一種叫做
    的頭像 發(fā)表于 11-20 14:05 ?1948次閱讀