0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超算芯片霸主之爭,終究將迎來結(jié)局

如意 ? 來源:虎嗅APP ? 作者:虎嗅APP ? 2020-11-17 11:07 ? 次閱讀

2020年4月,以近70億美元被英偉達(dá)最終收購的以色列頂級(jí)數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)公司Mellanox,在長達(dá)半年多的“沉默”后,在11月迎來了兩件足以引起業(yè)內(nèi)轟動(dòng)的大事。首先,陪Mellanox走了21年,并一手促成這筆交易的創(chuàng)始人兼首席執(zhí)行官Eyal Waldman宣布離職,并留下了一句頗為瀟灑的話:

“在達(dá)成這筆交易時(shí),我就知道我要離開了。你知道我用幾十年創(chuàng)建一家公司并做出所有決策,不是用來做第二名的?!?/p>

其次,就在今天,Mellanox作為英偉達(dá)GPU家族的一部分,被英偉達(dá)融入了新的網(wǎng)絡(luò)連接架構(gòu)產(chǎn)品——NVIDIA Mellanox 400G InfiniBand。

此后,它將以“GPU伴侶”的身份,率先打入數(shù)據(jù)中心市場的最精銳部隊(duì)——超級(jí)計(jì)算機(jī)市場。

NVIDIA Mellanox 400G InfiniBand產(chǎn)品的架構(gòu)組成。簡單來說,就是一個(gè)用以連接其他服務(wù)器與英偉達(dá)產(chǎn)品的組件

英偉達(dá)在今天的全球超級(jí)計(jì)算大會(huì)上,再次刷新了自己最強(qiáng)大GPU產(chǎn)品線——企業(yè)級(jí)加速器A100的 性能紀(jì)錄。

新一代的A100 GPU將高帶寬內(nèi)存提升至80GB,比上一代擴(kuò)大一倍。這意味著,每秒超過2TB的內(nèi)存帶寬,會(huì)讓數(shù)據(jù)在內(nèi)存與GPU之間流通得更加迅速,以便“承受”研究人員建立更大規(guī)模人工智能模型和數(shù)據(jù)集帶來的壓力。

“現(xiàn)在要在AI和高性能計(jì)算(HPC)的研究成果上繼續(xù)突破上限,科學(xué)家們必須要構(gòu)建更大更復(fù)雜的模型,那么便需要比以往更大的內(nèi)存容量與更高的帶寬?!?英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro指出。

英偉達(dá)在英國劍橋的超算中心部署了由若干塊A10080GB組成的DGX系統(tǒng)

實(shí)際上,除了改變芯片產(chǎn)品的架構(gòu),把成百上千塊芯片用最高效的形式“連”起來,當(dāng)然也能解決科學(xué)家們每秒/百億億次的超大計(jì)算需求,而收購的Mellanox的用意便在于此。

如果你見過位于無錫的中國超級(jí)計(jì)算機(jī)“太湖之光”,就會(huì)發(fā)現(xiàn)“這臺(tái)計(jì)算機(jī)”其實(shí)是一個(gè)由成百上千臺(tái)黑色機(jī)柜組成的計(jì)算機(jī)集群,可以填滿一間約1000平米的屋子。

它既可以被稱為“高性能計(jì)算機(jī)群”,也可以被看做是一個(gè)不小規(guī)模的數(shù)據(jù)中心。

當(dāng)然,這些黑色機(jī)柜的性能,要比普通服務(wù)器強(qiáng)大太多,由4萬多塊不同種類的國產(chǎn)芯片組成,僅集成它們就是一項(xiàng)極為艱巨的任務(wù),用時(shí)兩年,總投入超過了18億人民幣。

位于無錫超算中心的太湖之光

而NVIDIA Mellanox 400G InfiniBand的作用,便是將超級(jí)計(jì)算機(jī)中上萬塊CPU、GPU以及其他種類芯片“連接”在一起。在發(fā)揮性能最大化的同時(shí),每塊芯片的數(shù)據(jù)傳輸效率也不能有太多損耗。

“之前CPU與GPU之間的互聯(lián),都是通過英偉達(dá)的NVlinks(一種總線及其通信協(xié)議),但這個(gè)東西互聯(lián)的效率沒有特別好,不能簡單擴(kuò)展到上千塊芯片互聯(lián)的超算場景。”參與研發(fā)過TPU,芯英科技聯(lián)合創(chuàng)始人楊龔軼凡告訴虎嗅,Mellanox擅長的便是此前英偉達(dá)最大的短板之一,

“一臺(tái)超級(jí)計(jì)算機(jī),各品牌芯片之間的高效配合,極為重要。之前英偉達(dá)的NVlinks只能和IBM的CPU互聯(lián)。而收購Mellanox后,英偉達(dá)增強(qiáng)了用芯片構(gòu)建超算系統(tǒng)的可擴(kuò)展性,可以讓GPU與其他品牌和種類的芯片進(jìn)行連接?!?/p>

換句話說,英偉達(dá)找到了“讓自己產(chǎn)品輕松插進(jìn)包括英特爾在內(nèi),所有服務(wù)器芯片接口”的方法。

超算市場,不可忽視的芯片掘金地

英偉達(dá)的這次全系列產(chǎn)品,無一例外面向的都是“燒錢魔窟”——超級(jí)計(jì)算機(jī)市場。

舉個(gè)例子,在2020年6月頒布的全球超級(jí)計(jì)算機(jī)Top500榜單上,排名第二的美國橡樹嶺國家實(shí)驗(yàn)室超級(jí)計(jì)算機(jī)Summit,在每個(gè)節(jié)點(diǎn)配備了2個(gè)IBM的 Power9 CPU和 6個(gè)英偉達(dá)的Tesla V100。這樣的節(jié)點(diǎn)有4356個(gè),總耗資2億美元。

而在2019年3月,美國能源部阿貢實(shí)驗(yàn)室公開宣布,將耗資5億美元搭建新一代超級(jí)計(jì)算機(jī) Aurora 。這臺(tái)將在2021年實(shí)現(xiàn)交付的超級(jí)計(jì)算機(jī),并非追求一味追求計(jì)算速度,而是需要針對人工智能等新技術(shù)應(yīng)用采用新的設(shè)計(jì)思路。

那么這筆巨額政府合同的主要受益者是誰?外界猜測是美國最大的CPU生產(chǎn)商英特爾與著名超算系統(tǒng)集成商Cray。

但不可忽視的是,隨著超算系統(tǒng)被用在人工智能研究領(lǐng)域的次數(shù)越來越多,額外裝載的加速芯片GPU,逐漸成為搭建超級(jí)計(jì)算機(jī)的必選品。

因此,英偉達(dá)也在全球許多超算項(xiàng)目中獲得了頗為豐厚的收益,包括美國技術(shù)最強(qiáng)大的國家實(shí)驗(yàn)室——橡樹嶺實(shí)驗(yàn)室、阿貢實(shí)驗(yàn)室,都是英偉達(dá)最好性能產(chǎn)品的首批嘗鮮者。

美國迄今最強(qiáng)的超級(jí)計(jì)算機(jī)Summit(巔峰),在最新的Top500榜單中排名第2。

超級(jí)計(jì)算機(jī)之間的競爭,從來都被看作是國家之間技術(shù)實(shí)力的競爭。

盡管這是一個(gè)狹隘的衡量標(biāo)準(zhǔn),但這些超級(jí)計(jì)算機(jī)群的確在很多軍事與科學(xué)任務(wù)中發(fā)揮著極為重要的作用,譬如武器設(shè)計(jì)與密碼破譯,再譬如模擬氣候變化,研究與診斷新冠病毒。

很多前所未有的材料與化學(xué)實(shí)驗(yàn),不太可能在云端執(zhí)行,因此部署高性能服務(wù)器便顯得格外重要。

“沒有人愿意燒很多錢去做一些幾十年沒成果的新技術(shù)研究,但是這些研究卻很有必要,那么這些新技術(shù)的運(yùn)算就需要超級(jí)計(jì)算機(jī)來支持?!币晃粯I(yè)內(nèi)人士告訴虎嗅。

而這場競爭中,中國與美國理所當(dāng)然是最為強(qiáng)勁的參賽選手,也是最愿意砸錢做超算系統(tǒng)的兩個(gè)科技大國。

2020年6月,盡管Top500的榜首之位,被日本神戶理研計(jì)算中心耗資10億美元的超算系統(tǒng)Fugaku奪走,但在這500個(gè)超級(jí)計(jì)算機(jī)中,中國擁有其中226個(gè)系統(tǒng),而美國則占據(jù)114個(gè)。

2020年6月最新榜單的前10名。在2016年~2017年蟬聯(lián)4次冠軍的中國超級(jí)計(jì)算機(jī)太湖之光位于第四名,天河二號(hào)第五名。

因此,如果按照每臺(tái)超級(jí)計(jì)算機(jī)單價(jià)上億美元來計(jì)算,這是一個(gè)令人垂涎的市場。而政府一次又一次創(chuàng)下記錄的巨額訂單,對商業(yè)公司產(chǎn)生著越來越大的吸引力;

此外,毫無疑問,由于超級(jí)計(jì)算機(jī)運(yùn)行的都是難度最高的技術(shù)研發(fā)任務(wù),它們的存在,是未來技術(shù)下沉到工業(yè)和消費(fèi)級(jí)市場的源動(dòng)力。

國家之間的超級(jí)計(jì)算機(jī)之戰(zhàn)從幾十年前就已打響。一開始,大多數(shù)超級(jí)計(jì)算機(jī)使用的微處理器都是從英特爾和AMD的PC芯片演變而來,然而,就是在過去5年里,數(shù)據(jù)量開始如爆炸般增長,新技術(shù)應(yīng)用層出不窮,因此最強(qiáng)大的超級(jí)計(jì)算機(jī)已經(jīng)開始加大專業(yè)芯片的使用力度,而英偉達(dá),便是最大的受益者之一。

從圖中可以看出,2020年~2025年產(chǎn)生的數(shù)據(jù)量,是2010~2020年數(shù)據(jù)量的三倍。圖片來自英偉達(dá)。

不過有意思的是,日本Fugaku打敗中國和美國最強(qiáng)計(jì)算機(jī)的“源動(dòng)力”,竟然是富士通的48核 A64FX SoC,這應(yīng)該是榜單上第一個(gè)由ARM處理器提供動(dòng)力的超算系統(tǒng)(雖然不想把英偉達(dá)和ARM的收購聯(lián)系起來,但這好歹是個(gè)開始)。

“未來超算市場,目前現(xiàn)在的共識(shí)是HPC+AI。也就是說,未來AI是超算的典型應(yīng)用,而且量級(jí)很大。所以英偉達(dá),想要作為未來霸主,保持在這個(gè)市場的領(lǐng)先地位。當(dāng)然,高性能計(jì)算市場,一切都沒那么容易?!?br /> 責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50818

    瀏覽量

    423727
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4989

    瀏覽量

    103076
  • 超級(jí)計(jì)算機(jī)

    關(guān)注

    2

    文章

    462

    瀏覽量

    41948
收藏 人收藏

    評論

    相關(guān)推薦

    ETH-X節(jié)點(diǎn):開辟AI力約束突破的新路徑

    AI力提升新途徑,為構(gòu)建ETH-X節(jié)點(diǎn)互聯(lián)開放協(xié)作產(chǎn)業(yè)生態(tài)提供支撐。同時(shí),共同編制相關(guān)技術(shù)規(guī)范,為行業(yè)樹立標(biāo)準(zhǔn),引導(dǎo)節(jié)點(diǎn)技術(shù)高質(zhì)發(fā)展。
    的頭像 發(fā)表于 11-09 10:03 ?824次閱讀
    ETH-X<b class='flag-5'>超</b>節(jié)點(diǎn):開辟AI<b class='flag-5'>算</b>力約束突破的新路徑

    本源“量融合先進(jìn)計(jì)算平臺(tái)”入選2024力中國·年度重大成果

    入選。圖為2024中國力大會(huì)“力中國·年度重大成果”“量融合先進(jìn)計(jì)算平臺(tái)”項(xiàng)目獎(jiǎng)項(xiàng)證書該量融合先進(jìn)計(jì)算平臺(tái)項(xiàng)目量子計(jì)算和超級(jí)計(jì)算的
    的頭像 發(fā)表于 10-16 08:06 ?372次閱讀
    本源“量<b class='flag-5'>超</b>融合先進(jìn)計(jì)算平臺(tái)”入選2024<b class='flag-5'>算</b>力中國·年度重大成果

    哈爾濱即將迎來力新紀(jì)元:中國移動(dòng)智中心節(jié)點(diǎn)盛大啟用

    8月22日,來自“哈爾濱發(fā)布”公眾號(hào)的最新消息振奮人心,宣布了中國移動(dòng)智中心(哈爾濱)節(jié)點(diǎn)的一項(xiàng)重大進(jìn)展——其萬卡智集群將于8月30日正式投入運(yùn)營。這一里程碑式的投用,不僅標(biāo)志著哈爾濱市在人工智能研發(fā)領(lǐng)域的
    的頭像 發(fā)表于 08-22 15:19 ?678次閱讀

    光子計(jì)算芯片最新突破,峰值1000tops,比電芯片更適合大模型

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,國內(nèi)光計(jì)算芯片公司光本位科技宣布,公司已完成算力密度和力精度均達(dá)到商用標(biāo)準(zhǔn)的光計(jì)算芯片流片。這顆芯片的矩陣規(guī)模為128×128,峰值
    的頭像 發(fā)表于 07-08 07:18 ?4661次閱讀
    光子計(jì)算<b class='flag-5'>芯片</b>最新突破,峰值<b class='flag-5'>算</b>力<b class='flag-5'>超</b>1000tops,比電<b class='flag-5'>芯片</b>更適合大模型

    預(yù)定下代第一?富士通144核Arm處理器公開

    設(shè)計(jì)A64FX SoC,整個(gè)集群的峰值性能可以達(dá)到537.21PFlop/s。如此強(qiáng)大的性能,甚至于日本東京工業(yè)大學(xué)、日本東北大學(xué)等都宣布借助富岳來開發(fā)日語生成式AI。 ? 然而在最新的TOP500排行榜上,隨著更新的英特
    的頭像 發(fā)表于 06-24 00:26 ?2776次閱讀
    預(yù)定下代<b class='flag-5'>超</b><b class='flag-5'>算</b>第一?富士通144核Arm處理器公開

    最新Top500榜單公布:Frontier再奪魁首,Aurora破百億大關(guān)

    此次Top500排行榜中只有一個(gè)顯著變動(dòng):瑞士國家超級(jí)計(jì)算機(jī)中心的Alps憑借270 PFlop/s的Rmax LINPACK FP64力排名上升至第六,超過了IBM POWER9處理器和Nvidia Volta GV10
    的頭像 發(fā)表于 05-14 09:36 ?833次閱讀

    思必馳DFM-2大模型入駐國家互聯(lián)網(wǎng)平臺(tái)

    近日,思必馳DFM-2大模型入駐國家互聯(lián)網(wǎng)平臺(tái),雙方攜手共進(jìn),共同推動(dòng)大模型的落地應(yīng)用,為傳統(tǒng)產(chǎn)業(yè)提質(zhì)煥新提供新動(dòng)能。
    的頭像 發(fā)表于 05-11 10:25 ?631次閱讀
    思必馳DFM-2大模型入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網(wǎng)平臺(tái)

    揭秘芯片力:為何它如此關(guān)鍵?

    在數(shù)字化時(shí)代,芯片作為電子設(shè)備的核心組件,其性能直接關(guān)系到設(shè)備的運(yùn)行速度和處理能力。而芯片力,即其計(jì)算能力,更是衡量芯片性能的重要指標(biāo)。那么,
    的頭像 發(fā)表于 05-09 08:27 ?1077次閱讀
    揭秘<b class='flag-5'>芯片</b><b class='flag-5'>算</b>力:為何它如此關(guān)鍵?

    科學(xué)計(jì)算的下一輪創(chuàng)新,AI與數(shù)字孿生

    隨著超大規(guī)模云服務(wù)廠商、互聯(lián)網(wǎng)巨頭和各國中心紛紛投入到AI的開發(fā)中來,這類系統(tǒng)的應(yīng)用范圍已經(jīng)被極大地?cái)U(kuò)寬了,比如數(shù)字孿生等。就連SDA廠商Cadence,也加入搭建AI
    的頭像 發(fā)表于 05-07 00:16 ?2006次閱讀
    科學(xué)計(jì)算的下一輪創(chuàng)新,AI<b class='flag-5'>超</b><b class='flag-5'>算</b>與數(shù)字孿生

    “捷智”正式入駐國家互聯(lián)網(wǎng)平臺(tái)

    ABSTRACT摘要2024年4月2日,本公司旗下力服務(wù)品牌“捷智”正式入駐國家互聯(lián)網(wǎng)平臺(tái),開設(shè)云gpu旗艦店。我們借助國家
    的頭像 發(fā)表于 04-12 08:26 ?581次閱讀
    “捷智<b class='flag-5'>算</b>”正式入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網(wǎng)平臺(tái)

    千億美元打造一個(gè)系統(tǒng),成本越來越高的AI

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從近年來新發(fā)布的算機(jī)器和新的HPC AI性能榜單可以看出,AI力已經(jīng)在中成了不可忽視的性能指標(biāo)之一,但也為廠商帶來了更大的成本挑戰(zhàn)。比如微軟近期就
    的頭像 發(fā)表于 04-09 00:19 ?3061次閱讀

    賽昉科技與聚變達(dá)成戰(zhàn)略合作,RISC-V在數(shù)據(jù)中心迎來歷史性跨越

    ;賽昉科技聯(lián)合創(chuàng)新中心,賽昉科技為數(shù)據(jù)中心場景打造的首款研發(fā)代號(hào)為“獅子山”的RISC-V芯片應(yīng)用在聚變的智產(chǎn)品中。貫徹發(fā)展新質(zhì)生產(chǎn)力的時(shí)代要求,賽昉科技
    的頭像 發(fā)表于 03-23 08:18 ?930次閱讀
    賽昉科技與<b class='flag-5'>超</b>聚變達(dá)成戰(zhàn)略合作,RISC-V在數(shù)據(jù)中心<b class='flag-5'>迎來</b>歷史性跨越

    智能力規(guī)模通用力,大模型對智能力提出高要求

    的縮寫,即每秒所能夠進(jìn)行的浮點(diǎn)運(yùn)算數(shù)目(每秒浮點(diǎn)運(yùn)算量)。 ? 力可以分為通用力、智能力和算算力。早前通用力占整體
    的頭像 發(fā)表于 02-06 00:08 ?6363次閱讀

    國產(chǎn)ARM建設(shè)歷程 Arm計(jì)算在領(lǐng)域的實(shí)踐

    ARM 指令集兼容架構(gòu)已成為HPC 主流技術(shù)與未來發(fā)展的重要趨勢,可滿足大型系統(tǒng)與商用HPC 系統(tǒng)的技術(shù)需求。
    的頭像 發(fā)表于 01-25 14:06 ?1250次閱讀
    國產(chǎn)ARM<b class='flag-5'>超</b><b class='flag-5'>算</b>建設(shè)歷程 Arm計(jì)算在<b class='flag-5'>超</b><b class='flag-5'>算</b>領(lǐng)域的實(shí)踐

    力網(wǎng)絡(luò)面臨三大挑戰(zhàn)

    2024年,以AIGC為代表的人工智能技術(shù)進(jìn)一步激發(fā)力需求,力網(wǎng)絡(luò)、智中心、中心
    的頭像 發(fā)表于 01-12 10:39 ?1106次閱讀