在最新發(fā)布的全球最強(qiáng)超級(jí)計(jì)算機(jī)排名 Top500 的榜單中,InfiniBand 網(wǎng)絡(luò)再次以絕對(duì)的數(shù)量和性能優(yōu)勢蟬聯(lián)超級(jí)計(jì)算機(jī)互連設(shè)備數(shù)量榜首,比上次排行榜的數(shù)量又有了大幅度的增長。縱觀這次的榜單,可以歸納出以下三個(gè)趨勢。
基于 InfiniBand 網(wǎng)絡(luò)的超級(jí)計(jì)算機(jī)以 197 臺(tái)的數(shù)量大幅領(lǐng)先于其它網(wǎng)絡(luò)技術(shù)。特別在 Top100 的系統(tǒng)中,基于 InfiniBand 網(wǎng)絡(luò)的超級(jí)計(jì)算機(jī)更是遙遙領(lǐng)先,InfiniBand 網(wǎng)絡(luò)已經(jīng)成為了追求性能的超級(jí)計(jì)算機(jī)的標(biāo)配。
NVIDIA 網(wǎng)絡(luò)產(chǎn)品成為 Top500 系統(tǒng)中的主流互連設(shè)備,其中超過三分之二的超級(jí)計(jì)算機(jī)在使用 NVIDIA 網(wǎng)絡(luò)互連,NVIDIA 網(wǎng)絡(luò)的性能和技術(shù)領(lǐng)先性已經(jīng)得到了廣泛認(rèn)可。
還值得一提的是,InfiniBand 網(wǎng)絡(luò)不僅在傳統(tǒng)的 HPC 業(yè)務(wù),在企業(yè)級(jí)數(shù)據(jù)中心和公有云上也已被廣泛使用。目前性能第一的企業(yè)級(jí)超級(jí)計(jì)算機(jī) NVIDIA Selene 和微軟公司的 Azure 公有云都在利用 InfiniBand 網(wǎng)絡(luò)來發(fā)揮其超高的業(yè)務(wù)性能。
網(wǎng)絡(luò)計(jì)算技術(shù)成就性能優(yōu)勢
為什么 InfiniBand 網(wǎng)絡(luò)在 Top500 中受到了如此的重視?
其性能優(yōu)勢起到了決定性的作用。
InfiniBand 網(wǎng)絡(luò)率先實(shí)現(xiàn)了通信和計(jì)算在網(wǎng)絡(luò)中的融合,是業(yè)界第一款會(huì)計(jì)算的網(wǎng)絡(luò),其先進(jìn)的網(wǎng)絡(luò)計(jì)算技術(shù),不僅大幅提升了計(jì)算性能,還通過計(jì)算的手段解決了困擾通信領(lǐng)域數(shù)十年的問題,如 Reduce 、Allreduce 、Barrier 等通信操作帶來的網(wǎng)絡(luò)擁塞問題。
這些操作會(huì)在網(wǎng)絡(luò)中產(chǎn)生瞬間的網(wǎng)絡(luò)流量突發(fā),對(duì)于無損網(wǎng)絡(luò)來說,會(huì)通過擁塞控制技術(shù)來強(qiáng)迫網(wǎng)絡(luò)降速以緩解擁塞問題;對(duì)于有損網(wǎng)絡(luò)來說,就會(huì)造成網(wǎng)絡(luò)中的大量丟包,從而導(dǎo)致網(wǎng)絡(luò)重傳數(shù)據(jù),這兩種情形都會(huì)造成業(yè)務(wù)的性能下降。
由于這些通信操作是很多業(yè)務(wù)中頻繁使用的通信方式,在過去幾十年的時(shí)間里,眾多的科研人員都在致力于優(yōu)化擁塞控制的算法和優(yōu)化通信法則來解決這個(gè)問題,但是一直沒能有突破性的進(jìn)展。
InfiniBand 網(wǎng)絡(luò)的 SHARP 網(wǎng)絡(luò)計(jì)算技術(shù)(In-Network Computing)的出現(xiàn),為業(yè)界提供了新的思路,利用計(jì)算的手段從根本上可以解決這些通信模型造成的擁塞問題,讓您的網(wǎng)絡(luò)不必再降速或者丟包,在全線速的狀態(tài)下完成數(shù)據(jù)的傳輸。
這項(xiàng)技術(shù)已經(jīng)被廣泛用到 Top500 的眾多的機(jī)器當(dāng)中。
性能隔離技術(shù)解決企業(yè)級(jí)數(shù)據(jù)中心
和云市場難題
為什么 InfiniBand 網(wǎng)絡(luò)進(jìn)入了企業(yè)級(jí)數(shù)據(jù)中心和云的市場?
InfiniBand 網(wǎng)絡(luò)帶來的性能隔離技術(shù)為其叩開了這些市場的大門。
對(duì)于業(yè)務(wù)來進(jìn)行性能隔離也是困擾網(wǎng)絡(luò)界和計(jì)算界很久的問題,現(xiàn)在我們已經(jīng)實(shí)現(xiàn)了租戶之間的安全隔離,租戶業(yè)務(wù)和業(yè)務(wù)之間的隔離,但是當(dāng)很多的租戶在同時(shí)運(yùn)行多個(gè)應(yīng)用的時(shí)候,卻無法實(shí)現(xiàn)應(yīng)用之間的性能隔離。
即使我們通過一些先進(jìn)的 QoS 技術(shù)來將計(jì)算資源和通信資源隔離開來,但卻無法實(shí)現(xiàn)業(yè)務(wù)運(yùn)行在 Bare Metal 系統(tǒng)上的性能。
InfiniBand 網(wǎng)絡(luò)極先進(jìn)的性能隔離技術(shù),除了實(shí)現(xiàn)業(yè)務(wù)的隔離之外,更是保障了業(yè)務(wù)在云上多租戶、多任務(wù)的狀態(tài)下,實(shí)現(xiàn)和在 Bare Metal 環(huán)境下一樣的性能。
這項(xiàng)技術(shù)已經(jīng)在微軟的 Azure 公有云上開始向用戶提供服務(wù)。
在當(dāng)前的算力成為服務(wù),數(shù)據(jù)中心成為計(jì)算單元的新型計(jì)算平臺(tái)下,網(wǎng)絡(luò)成為決定算力性能的關(guān)鍵因素。
單機(jī)的性能已無法滿足算力的需求,數(shù)據(jù)中心的性能以及多數(shù)據(jù)中心的綜合性能才是算力保障的基礎(chǔ)。
作為連接數(shù)據(jù)中心內(nèi)的計(jì)算單元、存儲(chǔ)單元以及各個(gè)數(shù)據(jù)中心之間的網(wǎng)絡(luò),成為算力保障的核心。
InfiniBand 網(wǎng)絡(luò)憑借其極致的性能,不斷創(chuàng)新的技術(shù)架構(gòu),在更低功耗、更少硬件設(shè)備的前提下幫助用戶實(shí)現(xiàn)了業(yè)務(wù)性能的最大化,其進(jìn)入越來越多的使用場景自是大勢所趨。
原文標(biāo)題:算力時(shí)代,網(wǎng)絡(luò)決定性能
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4986瀏覽量
103046 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4778瀏覽量
72123 -
InfiniBand
+關(guān)注
關(guān)注
1文章
29瀏覽量
9197 -
公有云
+關(guān)注
關(guān)注
1文章
95瀏覽量
17414
原文標(biāo)題:算力時(shí)代,網(wǎng)絡(luò)決定性能
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論