0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD和惠普企業(yè)介紹新制造的超級計算機Frontier

中科院半導體所 ? 來源:悅智網(wǎng) ? 作者:Charles ? 2022-11-03 16:07 ? 次閱讀

AMD和惠普企業(yè)介紹新制造的超級計算機Frontier。

當前全世界最快的超級計算機是美國田納西州橡樹嶺國家實驗室打造的Frontier,該計算機運算功能強大,運算速度比其他7臺最快的超級計算機的總和還要高,是運算速度排名第二的計算機的2倍多。Frontier不僅是第一臺突破每秒百億億次計算(exaflops)門檻的計算機,還在全球高能效超級計算機中排名第二。現(xiàn)在,協(xié)作制造Frontier的超微半導體公司(AMD)和惠普企業(yè)揭開了該超級計算機正常運轉(zhuǎn)的電子訣竅。

Frontier由74個惠普企業(yè)Cray EX超級計算機柜組成,這些機柜共容納超過9400個CPU。每個節(jié)點都包含1個優(yōu)化的第三代AMD EPYC 64核2千兆赫Trento處理器,用于一般任務(wù)處理,以及4個AMD Instinct MI250X加速器,用于高度并行超級計算和人工智能AI)運算,此外,還有5太字節(jié)閃存,協(xié)助向GPU快速輸送數(shù)據(jù)。Frontier總共包含9408個CPU、37632個GPU和8730112個內(nèi)核,這些組件由145千米的網(wǎng)絡(luò)電纜連接在一起。美國田納西州橡樹嶺國家實驗室表示,這臺全球領(lǐng)先的超級計算機的功耗約為21兆瓦。

f0f8bc84-5a9f-11ed-a3b6-dac502259ad0.jpg

2022年5月,在德國漢堡的全球高性能計算大會上,F(xiàn)rontier展示了每秒1.1 exaflops的整體性能,成為全球500強超級計算機的巔峰。它還可能變得更快,理論峰值性能為2 exaflops。

另外,F(xiàn)rontier在最新的全球綠色500強中排名第二,該排名衡量超級計算機的能源效率。(這并不影響它在整體性能上成為全球最快的超級計算機。)不過,日本的MN-3作為先前全球綠色500強的榜首,每瓦能實現(xiàn)39.38 gigaflops(每秒10億浮點運算),而Frontier的測試開發(fā)系統(tǒng)為每瓦52.23 gigaflops。

Frontier成功的一個關(guān)鍵在于采用AMD的Infinity Fabric互連架構(gòu),每個節(jié)點內(nèi)CPU和GPU連接方式有助于增加CPU和GPU的一致性,即它們的共享數(shù)據(jù)視圖完全相同。

得克薩斯州奧斯汀AMD公司GPU和加速處理數(shù)據(jù)中心的副總裁布拉德?麥克雷迪(Brad McCredie)說:“一致性對于提升性能非常重要。它能幫助你確保分配合適的處理器運行合適的工作負載。很容易使并行CPU處理小任務(wù)和GPU處理大型任務(wù)?!?/p>

在Frontier的開發(fā)中,AMD表示,其面對的最大的挑戰(zhàn)是功率性能?!坝泻芏辔墨I說,要達到每秒百億億次運算,需要幾十萬個GPU和150兆到500兆瓦功率,而我們想要使用幾萬個GPU和20兆瓦功率來實現(xiàn)。”麥克雷迪說,“因此,開發(fā)過程中上上下下每個人都在追求效率?!?/p>

例如,F(xiàn)rontier的每個GPU上都緊密結(jié)合一個128千兆字節(jié)的高帶寬內(nèi)存。這可以幫助GPU克服計算機性能的一個著名瓶頸:內(nèi)存和處理之間的數(shù)據(jù)傳輸。

此外,F(xiàn)rontier的每個GPU還使用了臺積電生產(chǎn)的先進6納米節(jié)點芯片。因此,“它們執(zhí)行雙精度浮點運算的速度與單精度浮點運算相同,這是一項重大創(chuàng)新?!丙溈死椎险f。

借助這些進步,F(xiàn)rontier只需幾萬個GPU,而不需要幾十萬個GPU。“它承擔所有的并行管理,將程序員身上的負擔轉(zhuǎn)移到硬件上。這使得該系統(tǒng)更易于編程?!丙溈死椎险f。

一個“計算刀片”上有2個AMD節(jié)點,74個機柜中的每個都裝有64個這種刀片。計算刀片通過惠普企業(yè)Slingshot連接器互連,每個連接器都有一個專門設(shè)計的64端口交換機,可提供每秒12.8太字節(jié)的網(wǎng)絡(luò)帶寬。各組刀片的連接采用一種被稱為蜻蜓的拓撲結(jié)構(gòu),數(shù)百個機柜和數(shù)十萬個節(jié)點都可以相互通信,任意兩個節(jié)點之間最多可以跳轉(zhuǎn)3次。

“Slingshot的部署得到了高度優(yōu)化,根據(jù)所需距離合理采用能效最高的電纜,直連銅纜和有源光纜?!被萜掌髽I(yè)資深會員和HPC/MCS的首席技術(shù)官邁克?伍德克(Mike Woodacre)說。他補充道,去除低效的通用器件“顯著降低了線纜的能耗”。

機柜中計算機刀片的降溫采用了液體冷卻?;萜掌髽I(yè)高性能計算和人工智能系統(tǒng)副總裁杰拉爾德?克萊恩(Gerald Kleyn)表示,這臺超級計算機的密度能夠達到傳統(tǒng)風冷結(jié)構(gòu)的5倍。其結(jié)果是,這種緊湊的系統(tǒng)反過來大大降低了布線要求和運行費用。

“突破百億億次計算的門檻很重要,同時位列全球綠色500強第二更是非凡。”克萊恩說。此外,他說,在疫情期間和全球性供應(yīng)鏈問題的環(huán)境下,實現(xiàn)這一點“全靠美國橡樹嶺國家實驗室、惠普企業(yè)和AMD之間強大的團隊合作”。

Frontier下一步的工作包括繼續(xù)測試和驗證該系統(tǒng)。該實驗室表示,2022年后期將繼續(xù)進行最后驗收和早期科學應(yīng)用,計劃于2023年初全面開放應(yīng)用于科學項目。

已經(jīng)計劃在Frontier展開的項目包括癌癥研究、藥物研發(fā)、核聚變、特殊材料、超高效引擎和恒星爆炸。這臺機器的目標是將完成這類工作所需的時間從幾周縮短到幾個小時,從幾個小時縮短到幾秒。

“Frontier可幫助科學家們開展更多的科學研究,這意味著更接近高效清潔能源,更快發(fā)現(xiàn)有效的病毒疫苗?!丙溈死椎险f,“Frontier成為首個百億億次級計算機,這是我們整個征途的開始。看到美國橡樹嶺國家實驗室的研究人員致力于解決氣候、能源和疫情方面的問題,以及人類面臨的其他重大挑戰(zhàn),我們已經(jīng)從制造一臺強大的計算機走向想要制造一些對每個人都有幫助的東西。”

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5470

    瀏覽量

    134211
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7500

    瀏覽量

    88032
  • 超級計算機
    +關(guān)注

    關(guān)注

    2

    文章

    462

    瀏覽量

    41949

原文標題:首臺百億億次計算機內(nèi)部的秘密

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?130次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學家們利用量子力學,制造出具有革命性能力的
    的頭像 發(fā)表于 11-24 11:00 ?328次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    工業(yè)計算機類型介紹

    ,各行各業(yè)80%的企業(yè)依靠計算機進行日常運營,使其成為成功不可或缺的工具。從小型企業(yè)到大型企業(yè),計算機已成為工業(yè)領(lǐng)域的支柱,推動著增長并推動
    的頭像 發(fā)表于 11-04 15:56 ?228次閱讀
    工業(yè)<b class='flag-5'>計算機</b>類型<b class='flag-5'>介紹</b>

    丹麥推出首臺AI超級計算機Gefion

    近日,丹麥正式推出了該國首臺人工智能超級計算機,命名為Gefion,以紀念丹麥神話中的女神。此次揭幕儀式由英偉達首席執(zhí)行官黃仁勛與丹麥國王共同出席,彰顯了該項目的重要性和影響力。 Gefion AI
    的頭像 發(fā)表于 10-29 15:13 ?400次閱讀

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計算機。
    的頭像 發(fā)表于 10-27 09:42 ?449次閱讀

    云端超級計算機怎么用

    云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?161次閱讀

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?525次閱讀

    AMD雄心勃勃:計劃構(gòu)建百萬級GPU超級計算機集群

    在全球科技競賽的舞臺上,AMD近日宣布了一項令人矚目的計劃——打造一個包含多達120萬顆GPU的超級計算機集群。這一宏大的舉措立即引發(fā)了業(yè)界的廣泛關(guān)注,許多人認為,這是AMD為了與英偉
    的頭像 發(fā)表于 06-27 14:37 ?670次閱讀

    本源超導量子計算機自主制造鏈11類產(chǎn)品系列之十:中國首套量子計算機應(yīng)用軟件與解決方案

    使用。中國首套量子計算機應(yīng)用軟件與解決方案本源量子著力打造量子計算生態(tài)聯(lián)盟,推出中國首套量子計算機應(yīng)用軟件與解決方案,為生產(chǎn)制造上下游企業(yè)、
    的頭像 發(fā)表于 06-06 08:22 ?509次閱讀
    本源超導量子<b class='flag-5'>計算機</b>自主<b class='flag-5'>制造</b>鏈11類產(chǎn)品系列之十:中國首套量子<b class='flag-5'>計算機</b>應(yīng)用軟件與解決方案

    富士通使用富岳超級計算機訓練LLM

    盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?556次閱讀

    從原子到超級計算機:NVIDIA與合作伙伴擴展量子計算應(yīng)用

    量子計算領(lǐng)域的最新進展包括分子研究、部署巨型超級計算機,以及通過一項新的學術(shù)計劃培養(yǎng)量子從業(yè)人員。
    的頭像 發(fā)表于 03-22 10:05 ?434次閱讀

    【量子計算機重構(gòu)未來 | 閱讀體驗】+ 初識量子計算機

    介紹了量子計算機的工作原理、計算能力、研發(fā)現(xiàn)狀等專業(yè)知識點;第二部分介紹了量子計算機的應(yīng)用場景,比如工廠、物流、智慧交通、自動駕駛等等;正
    發(fā)表于 03-05 17:37

    國產(chǎn)計算機平臺介紹——龍芯

    你了解中國的自主平臺的計算機嗎?不僅是中國制造,而是由中國自主研發(fā),可以持續(xù)迭代產(chǎn)品,而且還能夠決定產(chǎn)品用途、決定技術(shù)歸屬權(quán)的國產(chǎn)計算機才是真正中國計算機。 而作為中國
    的頭像 發(fā)表于 03-05 11:40 ?786次閱讀
    國產(chǎn)<b class='flag-5'>計算機</b>平臺<b class='flag-5'>介紹</b>——龍芯

    英偉達與Equinix合作為企業(yè)客戶提供超級計算機系統(tǒng)

    近日,數(shù)據(jù)中心運營商Equinix與芯片巨頭英偉達宣布達成一項重要合作。雙方將共同為企業(yè)客戶提供英偉達的超級計算機系統(tǒng),使企業(yè)能夠更輕松地擁有并控制自己的AI
    的頭像 發(fā)表于 01-29 11:20 ?742次閱讀

    特斯拉在布法羅超級工廠投資5億美元建造Dojo超級計算機

    霍楚爾表示,此次項目投資為5億美元,并將同時在紐約州立大學建設(shè)另一臺獨立的AI超級計算機?!拔液軜s幸地告訴大家,特斯拉將在布法羅投資5億美元,用于其新一代超級計算機的建設(shè)”,她說道。
    的頭像 發(fā)表于 01-29 10:58 ?412次閱讀