據(jù)TrendForce報(bào)告顯示,2021年全球高性能計(jì)算(HPC,High Performance Computing)的市場(chǎng)規(guī)模約為368億美元,比2020年增長(zhǎng)7.1%,預(yù)計(jì)2022年將會(huì)增長(zhǎng)7.3%,達(dá)到397億美元。增長(zhǎng)的主要驅(qū)動(dòng)力來(lái)自數(shù)據(jù)中心、自動(dòng)駕駛以及智能制造等領(lǐng)域?qū)τ?jì)算能力需求的提升。
從市場(chǎng)分布來(lái)看,美國(guó)是HPC最大的市場(chǎng),約占市場(chǎng)總量的48%,其次是中國(guó)和歐洲市場(chǎng),合計(jì)占了35%左右。那么,HPC主要有哪些應(yīng)用呢?其實(shí),高性能計(jì)算一直都是用來(lái)解決人類面臨的最大挑戰(zhàn),比如氣象預(yù)測(cè)、災(zāi)害預(yù)警、太空探索、基因測(cè)序以及智能制造等場(chǎng)景。
精準(zhǔn)氣候預(yù)測(cè)
自從有計(jì)算機(jī)后,氣象局就是使用最頻繁、用得最好的單位之一。氣象局需要對(duì)天氣的變化做出預(yù)測(cè),而如果想要有效地模擬區(qū)域氣候變化,并做出精準(zhǔn)預(yù)測(cè)的話,就需要一臺(tái)比現(xiàn)在大十億倍的超級(jí)計(jì)算機(jī)。
來(lái)自 NVIDIA、加州理工學(xué)院、伯克利實(shí)驗(yàn)室、普渡大學(xué)、密歇根大學(xué)和萊斯大學(xué)的研究人員開(kāi)發(fā)了一個(gè)名為 FourCastNet 的天氣預(yù)報(bào) AI 模型。FourCastNet 是一種基于物理信息的深度學(xué)習(xí)模型,可以預(yù)測(cè)颶風(fēng)、大氣河以及極端降水等事件。FourCastNet 以歐洲中期天氣預(yù)報(bào)中心 (ECMWF) 長(zhǎng)達(dá) 40 年的再分析數(shù)據(jù)為基礎(chǔ),學(xué)會(huì)了如何預(yù)測(cè)天氣。
據(jù)了解,這是深度學(xué)習(xí)模型首次在降水預(yù)測(cè)方面的準(zhǔn)確率超過(guò)了先進(jìn)的數(shù)值模型,而且將預(yù)測(cè)速度提高了4到5個(gè)數(shù)量級(jí),也就是說(shuō),傳統(tǒng)的數(shù)值模擬需要一年時(shí)間才能完成的計(jì)算,現(xiàn)在只需要幾分鐘。
大氣河是天空中巨大的水汽輸送帶 ,其輸送的水汽量比亞馬遜河的流量還要多。大氣河一方面為美國(guó)西部提供了關(guān)鍵的降水來(lái)源,但另一方面,這些巨大的強(qiáng)風(fēng)暴也會(huì)導(dǎo)致災(zāi)難性的洪災(zāi)和暴雪。
據(jù)NVIDIA的CEO黃仁勛介紹,此 GPU 加速的 AI 數(shù)字孿生模型 FourCastNet,由自適應(yīng)傅里葉神經(jīng)算子提供支持,基于 10 TB 的地球系統(tǒng)數(shù)據(jù)進(jìn)行訓(xùn)練,依托這些數(shù)據(jù),以及 NVIDIA Modulus 和 Omniverse,該模型能夠提前一周預(yù)測(cè)災(zāi)難性大氣河的精確路線。
更重要的是,在一塊 NVIDIA GPU 的助力下,F(xiàn)ourCastNet 只需幾分之一秒即可完成預(yù)測(cè)。憑借如此快的速度,我們可以生成數(shù)千個(gè)模擬場(chǎng)景,探索所有可能的結(jié)果。與以往相比,人類能夠更加自信地量化災(zāi)難性洪災(zāi)的風(fēng)險(xiǎn)。
其實(shí),HPC主要是通過(guò)多臺(tái)高速互聯(lián)的服務(wù)器進(jìn)行并行計(jì)算,從而達(dá)到提升整體計(jì)算能力,對(duì)CPU、GPU、存儲(chǔ)和主板等都有較高的要求。FourCastNet之所以能如此精準(zhǔn)快速地預(yù)測(cè)天氣,主要得益于NVIDIA的高性能GPU的支持。不久前,NVIDIA更新了其GPU產(chǎn)品線,推出了其核彈級(jí)產(chǎn)品基于新一代Hopper架構(gòu)超級(jí)芯片H100,讓GPU的性能更上一層樓。
性能更強(qiáng)的GPU和CPU是高性能計(jì)算的性能保障
據(jù)其官網(wǎng)介紹,H100 是一款超大的芯片,采用了 TSMC 4N 工藝,具有 800 億個(gè)晶體管,可以實(shí)現(xiàn)縱向擴(kuò)展和橫向擴(kuò)展。H100 是首款支持 PCIe 5.0 標(biāo)準(zhǔn)的 GPU,也是首款采用 HBM3 標(biāo)準(zhǔn)的 GPU,單個(gè) H100 可支持 40 Tb/s 的 IO 帶寬。從另一個(gè)角度來(lái)說(shuō),20 塊 H100 GPU 便可承托相當(dāng)于全球互聯(lián)網(wǎng)的流量。
H100采用最新的 Hopper架構(gòu),相比前一代Ampere架構(gòu),H100有更強(qiáng)的性能,并采用的新的Tensor處理格式:FP8;采用風(fēng)冷和液冷設(shè)計(jì),是首個(gè)實(shí)現(xiàn)性能擴(kuò)展至700瓦的GPU;在AI方面,Hopper H100 FP8 的 4 PetaFLOPS 性能是 Ampere A100 FP16 的 6 倍,且引入了Transformer 引擎;在云計(jì)算方面,多租戶基礎(chǔ)架構(gòu)能夠直接轉(zhuǎn)化為收益和服務(wù)成本,一塊H100 可劃分為多達(dá) 7 個(gè)實(shí)例,能夠托管7個(gè)云租戶;此前,機(jī)密計(jì)算只能基于 CPU,而Hopper 實(shí)現(xiàn)了首個(gè) GPU 機(jī)密計(jì)算;此外,H100引入了一組名為DPX的新指令集,可加速動(dòng)態(tài)規(guī)劃算法。
圖:借助NVLink連接,DGX使8塊H100成為了一個(gè)巨型GPU(來(lái)源:NVIDIA)
在封裝方面,H100 采用 TSMC CoWoS 2.5D 封裝,搭載了 HBM3 顯存,并與電壓調(diào)節(jié)集成至 SXM 的超級(jí)芯片模組中。8 個(gè) H100 SXM 模組通過(guò)主板上的 4 個(gè) NV Switch 芯片相連可構(gòu)建成更為先進(jìn)的AI計(jì)算基礎(chǔ)架構(gòu)。比如DGX就是借助NVLink連接,讓8塊H100成為了一個(gè)巨型GPU,其包括了6400 億個(gè)晶體管、32 PetaFLOPS 的 AI 性能、640 GB HBM3 顯存,以及 24 TB/s 的顯存帶寬。
此外,DGX還可以進(jìn)一步擴(kuò)展,借助NVLink Switch,可以連接多達(dá)32個(gè)DGX,也就是說(shuō),DGX只是最小的計(jì)算單元,通過(guò) NVLink Switch 系統(tǒng),可以將其擴(kuò)展為一個(gè)巨大的擁有 32 個(gè)節(jié)點(diǎn)、256 個(gè) GPU 的 DGX POD,并且 HBM3 顯存高達(dá) 20.5 TB,顯存帶寬高達(dá) 768 TB/s。
其實(shí),除了GPU產(chǎn)品,NVIDIA在今年還推出了一個(gè)新的產(chǎn)品------針對(duì)數(shù)據(jù)中心的Grace CPU 超級(jí)芯片,它集成了兩個(gè)基于Arm的CPU,有多達(dá)144個(gè)高性能Arm Neoverse核心,并且支持ARM新一代矢量擴(kuò)展指令集和1 TB/s的內(nèi)存子系統(tǒng),支持最新的PCIe 5.0協(xié)議,可實(shí)現(xiàn)與GPU之間最高性能連接,同時(shí)還能連接NVIDIA ConnectX-7智能網(wǎng)卡以及NVIDIA BlueField-3 DPU。令人驚嘆的是,整個(gè)模組(包括內(nèi)存)的功率僅為 500 瓦。
ISC 2022上,英偉達(dá)CPU+GPU的產(chǎn)品組合獲得了認(rèn)可,美國(guó)和歐洲的領(lǐng)先超級(jí)計(jì)算中心都將率先采用這兩款超級(jí)芯片。
美國(guó)阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)的新一代系統(tǒng)Venado將成為美國(guó)首個(gè)采用NVIDIA Grace CPU技術(shù)的系統(tǒng)。Venado是使用HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建而成的異構(gòu)系統(tǒng),將同時(shí)配備Grace CPU超級(jí)芯片和Grace Hopper超級(jí)芯片,這一系統(tǒng)建成后的AI性能預(yù)計(jì)將超過(guò)10 Exaflops(Exaflops : 每秒10的18次方,百億億次)。
圖:NVIDIA推出的液冷GPU
另一個(gè)率先采用英偉達(dá)Grace CPU和 Hopper GPU的系統(tǒng)是瑞士國(guó)家計(jì)算中心的新系統(tǒng)Alps,該系統(tǒng)基于HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建,這是一個(gè)通用系統(tǒng),向瑞士及其他國(guó)家的研究者開(kāi)放。
英偉達(dá)還宣布,源訊、戴爾科技,技嘉科技、慧與、浪潮、聯(lián)想和超微宣布計(jì)劃部署基于Grace CPU和Grace Hopper超級(jí)芯片的服務(wù)器。
DPU為HPC提供強(qiáng)大助力
在NVIDIA于2020年提出DPU(Data Processing Unit)數(shù)據(jù)處理器這一概念后,DPU成了數(shù)據(jù)中心市場(chǎng)競(jìng)相追逐的新潮流。DPU成了數(shù)據(jù)中心里除了CPU和GPU之外的第三大處理單元。通常這些DPU具備高速網(wǎng)絡(luò)連接性,其作用說(shuō)起來(lái)很簡(jiǎn)單,那就是優(yōu)化數(shù)據(jù)中心里數(shù)據(jù)的移動(dòng),而CPU和GPU則專注于計(jì)算,從而騰出寶貴的計(jì)算資源用于其他價(jià)值更高的工作。
在歐洲和美國(guó),HPC 開(kāi)發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強(qiáng)大功能為超級(jí)計(jì)算機(jī)提供強(qiáng)大助力。
美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室 (LANL) 正在與 NVIDIA 進(jìn)行一項(xiàng)為期多年的廣泛合作,這項(xiàng)合作旨在將計(jì)算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計(jì),使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運(yùn)行的 DPU可顯著提升性能。這將使利用 BlueField 以及NVIDIA DOCA 軟件框架在計(jì)算存儲(chǔ)、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
德克薩斯高級(jí)計(jì)算中心 (TACC) 近期也開(kāi)始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級(jí)計(jì)算的開(kāi)發(fā)平臺(tái)。TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開(kāi)發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
另外,據(jù)公開(kāi)信息顯示,劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用DPU。倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動(dòng)數(shù)據(jù),以便在需要時(shí)數(shù)據(jù)已然就位。Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲(chǔ)框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。在美國(guó),佐治亞理工學(xué)院的研究人員正在與桑迪亞國(guó)家實(shí)驗(yàn)室合作,利用 BlueField-2 DPU 加速分子動(dòng)力學(xué)研究。一篇論文描述了他們目前的工作成果,結(jié)果表明,算法可以加速高達(dá) 20%,且不會(huì)損失模擬的準(zhǔn)確性。
結(jié)語(yǔ)
其實(shí),很多地方都在大量使用HPC,比如說(shuō)互聯(lián)大電網(wǎng)在線安全分析。經(jīng)過(guò)百年的發(fā)展,電力系統(tǒng)已經(jīng)成為了世界上最大的人工動(dòng)態(tài)系統(tǒng),在電網(wǎng)雙碳戰(zhàn)略實(shí)施,電力系統(tǒng)快速演進(jìn),日益運(yùn)行于穩(wěn)定邊界的大電網(wǎng),安全問(wèn)題,日益突出。此時(shí),如果想要建立互聯(lián)大電網(wǎng)及關(guān)鍵設(shè)備的“影子系統(tǒng)”,實(shí)現(xiàn)快速仿真和分析,完成分鐘級(jí)、甚至是秒級(jí)在線制定電網(wǎng)安全策略的話,就需要HPC的支持。
還有個(gè)性化醫(yī)療的智慧醫(yī)療、預(yù)測(cè)我們星球的未來(lái)的氣候變遷、了解我們的星球和宇宙的太空探索、預(yù)防疾病的基因研究、災(zāi)害預(yù)警的地震數(shù)據(jù)處理、保證食品安全的智慧農(nóng)業(yè)、具有更好的質(zhì)量和成本的智能制造等等應(yīng)用場(chǎng)景都是HPC的用武之地,未來(lái)性能更強(qiáng)的HPC,定然能夠給人類生活帶來(lái)更多的便利,解決人類目前面臨的很多挑戰(zhàn)。
-
智能電網(wǎng)
+關(guān)注
關(guān)注
35文章
2936瀏覽量
116378 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5049瀏覽量
103349 -
gpu
+關(guān)注
關(guān)注
28文章
4760瀏覽量
129129 -
DPU
+關(guān)注
關(guān)注
0文章
365瀏覽量
24217 -
人工智能
+關(guān)注
關(guān)注
1792文章
47492瀏覽量
239175 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
83瀏覽量
13405
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論