0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾聚力整合實現(xiàn)可持續(xù)的異構(gòu)計算

英特爾中國 ? 來源:英特爾中國 ? 作者:Jeff McVeigh ? 2022-06-12 17:30 ? 次閱讀

接下來的超算普及化時代,英特爾將滿足永無止境的計算需求,并將可持續(xù)發(fā)展作為重中之重。

本文作者:Jeff McVeigh

英特爾副總裁兼超級計算事業(yè)部總經(jīng)理

隨著我們進入E級(Exascale)計算時代并邁向Z級(Zettascale)計算時代,科技行業(yè)也越來越影響著全球的碳排放。據(jù)估計,到2030年數(shù)據(jù)中心的能耗估計將達到全球能源產(chǎn)量的3%-7%①,而計算基礎(chǔ)設(shè)施將成為新增用電量的主要驅(qū)動因素。

今年,英特爾承諾到2040年實現(xiàn)全球業(yè)務(wù)的溫室氣體凈零排放,并開發(fā)更加可持續(xù)的技術(shù)解決方案。在創(chuàng)造可持續(xù)未來的同時滿足對計算永無止境的需求,這是高性能計算(HPC)面臨的最大挑戰(zhàn)之一。這個任務(wù)雖然艱巨,但如果我們能夠把芯片、軟件和系統(tǒng)這些HPC計算堆棧的每個部分都做好,它就是可以實現(xiàn)的。

我在德國漢堡舉行的2022國際超算大會(ISC2022)上發(fā)表了主題演講,上述內(nèi)容就是我在演講中傳達的核心信息。

從芯片和異構(gòu)計算架構(gòu)開始

英特爾公布了直到2024年的高性能計算產(chǎn)品路線圖,期間我們將致力于提供多樣化的異構(gòu)架構(gòu)。這些架構(gòu)不僅將使我們能夠?qū)崿F(xiàn)幾個數(shù)量級的性能提升,同時亦可降低通用工作負載及諸如人工智能、加密、分析等新興工作負載的能耗。

以內(nèi)置高帶寬內(nèi)存(HBM),代號為Sapphire Rapids的英特爾至強處理器為例,該款處理器能夠很好地展示我們?nèi)绾卫孟冗M的封裝技術(shù)和芯片創(chuàng)新,為高性能計算帶來性能、帶寬和節(jié)能方面的顯著提升。通過封裝高達64GB的高帶寬內(nèi)存HBM2e并把加速器集成到CPU中,我們能夠釋放內(nèi)存敏感型工作負載的潛力,為這些關(guān)鍵的高性能計算應(yīng)用場景大幅提升性能。在對比第三代英特爾 至強 可擴展處理器和即將推出的內(nèi)置高帶寬內(nèi)存(HBM)的Sapphire Rapids處理器時,我們發(fā)現(xiàn),后者把氣候研究、能源、制造和物理學(xué)工作負載的性能提升了2-3倍②。在主題演講中,Ansys首席技術(shù)官Prith Banerjee還展示了內(nèi)置高帶寬內(nèi)存的Sapphire Rapids為Ansys Fluent和ParSeNet的實際工作負載帶來了高達2倍的性能提升③。

為實現(xiàn)跨HPC和AI超算工作負載的幾個數(shù)量級的性能提升,計算密度是另一必不可少的要素。代號為Ponte Vecchio的英特爾首個旗艦級數(shù)據(jù)中心圖形處理器(GPU),已經(jīng)在復(fù)雜的金融服務(wù)應(yīng)用以及AI推理和訓(xùn)練工作負載方面展現(xiàn)出了卓越的優(yōu)勢。

創(chuàng)新不止于此。今天,我們還宣布這款出色數(shù)據(jù)中心GPU的下一代產(chǎn)品代號為Rialto Bridge。通過升級Ponte Vecchio架構(gòu),并結(jié)合使用下一代制程節(jié)點技術(shù)制造的增強型芯片子模塊,Rialto Bridge將大幅提高計算密度、性能和效率,同時提供軟件一致性。

展望未來,F(xiàn)alcon Shores是我們路線圖中下一個重要的架構(gòu)創(chuàng)新,即把x86 CPU和Xe GPU集成在同一插槽中。這一架構(gòu)計劃將在2024年推出,它將在每瓦性能、計算密度、內(nèi)存容量與帶寬方面均實現(xiàn)超過5倍的性能提升④。

成功的軟件戰(zhàn)略遵循三個原則:

開放、選擇、信任

如果沒有軟件為芯片注入活力,它將僅僅只是砂礫。英特爾的軟件策略是促進整個堆棧的開放式發(fā)展,并提供工具、平臺和軟件IP,以幫助開發(fā)者提升工作效率,產(chǎn)出可擴展、更高性能、更高效的代碼,這些代碼能充分利用最新的芯片創(chuàng)新,沒有重構(gòu)代碼的負擔。oneAPI行業(yè)計劃為HPC開發(fā)者提供了跨架構(gòu)編程,使代碼能透明、可遷移地適用于CPU、GPU和其他專用加速器。

目前,在世界各地領(lǐng)先的科研和學(xué)術(shù)機構(gòu)中已有20多個oneAPI卓越中心(CoE),它們正取得重要的進展。例如,布里斯托大學(xué)科學(xué)系的Simon McIntosh-Smith和他的團隊,正在使用oneAPI和Khronos Group的SYCL抽象層進行跨架構(gòu)編程,為在E級計算規(guī)模上實現(xiàn)性能可移植性開發(fā)最佳實踐。他們的工作將確??茖W(xué)代碼能在大規(guī)模異構(gòu)超算系統(tǒng)上實現(xiàn)高性能。

聚力整合:實現(xiàn)可持續(xù)的異構(gòu)計算

隨著數(shù)據(jù)中心和HPC工作負載越來越多采用分布式架構(gòu)和異構(gòu)計算,我們需要借助工具來幫助有效管理和應(yīng)對復(fù)雜多樣的計算環(huán)境。

今天,我們將推出一款開源解決方案Intel XPU Manager,它可以在本地或遠程監(jiān)測和管理英特爾數(shù)據(jù)中心GPU。該解決方案旨在簡化管理,并通過綜合診斷更好地實現(xiàn)可靠性和延長設(shè)備運行時間,以及提升利用率并支持固件更新。

針對能耗很高的數(shù)據(jù)傳輸和存儲任務(wù),分布式異步對象存儲(DAOS)文件系統(tǒng)提供了系統(tǒng)級的優(yōu)化。DAOS可以顯著地改善文件系統(tǒng)的性能,它不僅可以縮短整體訪問時間,而且能夠降低存儲所需的容量,從而減少數(shù)據(jù)中心的占用空間并提高能源效率。相比于Lustre在I/O500中的測試結(jié)果,DAOS實現(xiàn)了直接寫入文件系統(tǒng)性能70倍⑤的提升。

應(yīng)對HPC的可持續(xù)性挑戰(zhàn)

我們很榮幸能夠與全球志同道合的客戶和行業(yè)領(lǐng)先的科研機構(gòu)合作,朝著實現(xiàn)更具可持續(xù)性和開放性的高性能計算而努力。我們近期取得了一系列成果——我們與巴塞羅那超算中心合作建立了開創(chuàng)性的RISC-V Z級計算實驗室;并與劍橋大學(xué)和戴爾繼續(xù)合作,將當前的E級計算實驗室進一步打造成為新的劍橋Z級計算實驗室。

獨木難支,完整生態(tài)的構(gòu)建需要在制造、芯片、互連、軟件和系統(tǒng)等各方面攜手共進。通過與整個生態(tài)的協(xié)作,我們致力于將本世紀最大的HPC挑戰(zhàn)轉(zhuǎn)化為前所未有的機遇,創(chuàng)造改變世界的技術(shù),讓未來更美好。

注意事項與免責(zé)聲明:

①《對2020年至2030年期間全球計算機的一次能源使用、電力使用和二氧化碳排放及其所占份額的假設(shè)》,作者:Anders S.G. Andrae,《WSEAS電力系統(tǒng)匯刊》,15(2020)

②測量依據(jù)如下:

CloverLeaf

由英特爾于2022年4月26日測試。1節(jié)點,2個英特爾至強鉑金8360Y CPU,72個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB DDR4 3200MT/s),SE5C6200.86B.0021.D40.2101090208,Ubuntu 20.04,Kernel 5.10,0xd0002a0,ifort 2021.5,Intel MPI 2021.5.1,編譯器參數(shù):-xCORE-AVX512-qopt-zmm-usage=high

由英特爾于2022年4月19日測試。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,ifort 2021.5,Intel MPI 2021.5.1,編譯器參數(shù):-xCORE-AVX512–qopt-zmm-usage=high

OpenFOAM

由英特爾于2022年1月26日測試。1節(jié)點,2個英特爾至強鉑金8380 CPU,80個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,0xd000270,Rocky Linux 8.5 ,Linux版本4.18.,OpenFOAMv1912,Motorbike 28M@250次迭代;編譯說明:工具:Intel Parallel Studio 2020u4,編譯器參數(shù):-O3-ip-xCORE-AVX512

由英特爾于2022年1月26日測試。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內(nèi)核,超線程關(guān)閉,睿頻關(guān)閉,總內(nèi)存128GB(HBM2e以3200MHz的頻率運行),試生產(chǎn)的平臺和BIOS,CentOS 8,Linux版本5.12,OpenFOAMv1912,Motorbike 28M@250次迭代;編譯說明:工具:Intel Parallel Studio 2020u4,編譯器參數(shù):-O3-ip-xCORE-AVX512

WRF

由英特爾于2022年5月3日測試。1節(jié)點,2個英特爾至強8380 CPU,80個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5,Linux版本4.18,WRF v4.2.2

由英特爾于2022年5月3日測試。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,WRF v4.2.2

YASK

由英特爾于2022年5月9日測試。1節(jié)點,2個英特爾至強鉑金8360Y CPU,72個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB DDR4 3200MT/s),SE5C6200.86B.0021.D40.2101090208,Rocky linux 8.5,Kernel 4.18.0,0xd000270,編譯器參數(shù):make-j YK_CXX='mpiicpc-cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,

由英特爾于2022年5月3日測試。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,編譯器參數(shù):make-j YK_CXX='mpiicpc-cxx=icpx'arch=avx2 stencil=iso3dfd radius=8,

③Ansys Fluent

由英特爾于2022年2月測試。1節(jié)點,2個英特爾至強鉑金8380 CPU,80個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5,Linux版本4.18,Ansys Fluent 2021 R2 Aircraft_wing_14m;編譯說明:商業(yè)版本使用Intel 19.3編譯器和Intel MPI 2019u

由英特爾于2022年2月測試。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內(nèi)核,超線程關(guān)閉,睿頻關(guān)閉,總內(nèi)存128GB(HBM2e以3200MHz的頻率運行),預(yù)生產(chǎn)的平臺和BIOS,CentOS 8,Linux版本5.12,Ansys Fluent 2021 R2 Aircraft_wing_14m;編譯說明:商業(yè)版本使用Intel 19.3編譯器和Intel MPI 2019u8

Ansys ParSeNet

由英特爾于2022年5月24日測試。1節(jié)點,2個英特爾至強鉑金8380CPU,80個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存256GB(16x16GB DDR4 3200MT/s [3200 MT/s]),SE5C6200.86B.0021 .D40.2101090208,Ubuntu 20.04.1 LTS,5.10,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL (2021.4-Product Build 20210904),oneDNN (V2.5.0)

由英特爾測試于2022年4月18日。1節(jié)點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,112個內(nèi)核,超線程開啟,睿頻開啟,總內(nèi)存128GB(HBM2e 3200 MT/s),EGSDCRB1.86B.0077.D11.2203281354,CentOS Stream 8,5.16,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL(2021.4-Product Build 20210904),oneDNN(v2.5.0)

④Falcon Shores的性能目標基于截至2022年2月相對于當前平臺的預(yù)測。結(jié)果可能有所不同。

⑤結(jié)果可能有所不同。更多信息請訪問io500和YouTube視頻《DAOS與Lustre的性能對比測試》

原文標題:加速創(chuàng)新,打造更具可持續(xù)性和開放性的HPC

文章出處:【微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9974

    瀏覽量

    171823
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    316

    瀏覽量

    23793
  • 高性能計算
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    13390

原文標題:加速創(chuàng)新,打造更具可持續(xù)性和開放性的HPC

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價格提供卓越的性能與價值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負載提供加速。其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS 2提供強大支持。XeSS 2的三項核心技術(shù)協(xié)同工作,共同提高性能表現(xiàn)、增強視覺流暢性并加快響應(yīng)速度。 “ ? 全新
    的頭像 發(fā)表于 12-07 10:16 ?771次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    【一文看懂】什么是異構(gòu)計算?

    隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求,異構(gòu)計算因此應(yīng)運而生,成為現(xiàn)代計算領(lǐng)域的一個重要方向。
    的頭像 發(fā)表于 12-04 01:06 ?1461次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>?

    憶聯(lián)亮相英特爾新質(zhì)生產(chǎn)技術(shù)生態(tài)大會

    近日,英特爾新質(zhì)生產(chǎn)技術(shù)生態(tài)大會在成都舉行。本次大會由英特爾主辦,匯聚四川省政府、成都市政府、高新區(qū)管委會及有關(guān)部門領(lǐng)導(dǎo),以及2000多位產(chǎn)業(yè)伙伴,分享數(shù)字經(jīng)濟推動新質(zhì)生產(chǎn)發(fā)展的趨
    的頭像 發(fā)表于 11-30 15:58 ?556次閱讀

    英特爾分析新質(zhì)生產(chǎn)發(fā)展的趨勢和機遇

    “這次大會是探討未來的,我相信這也是我們緊密合作,一起塑造共同未來的開始!”面對英特爾新質(zhì)生產(chǎn)技術(shù)生態(tài)大會現(xiàn)場的2,000余名產(chǎn)業(yè)伙伴,英特爾公司高級副總裁、英特爾中國區(qū)董事長王銳如
    的頭像 發(fā)表于 11-28 14:27 ?315次閱讀

    英特爾攜手騰訊云,驅(qū)動AIoT邊緣設(shè)備、云游戲和智能計算應(yīng)用落地

    打造AI解決方案,深耕數(shù)據(jù)中心多年,英特爾不僅通過產(chǎn)品技術(shù)創(chuàng)新,為AI浪潮提供數(shù)據(jù)中心卓越算,也積極攜手騰訊共同打造滿足產(chǎn)業(yè)需求且兼具高能效的解決方案,持續(xù)探索AI、云計算等對有效推
    的頭像 發(fā)表于 09-11 19:02 ?4575次閱讀
    <b class='flag-5'>英特爾</b>攜手騰訊云,驅(qū)動AIoT邊緣設(shè)備、云游戲和智能<b class='flag-5'>計算</b>應(yīng)用落地

    芯??萍糴dge BMC首秀2024英特爾網(wǎng)絡(luò)與邊緣計算行業(yè)峰會

    7月23-24日,“2024英特爾網(wǎng)絡(luò)與邊緣計算行業(yè)大會”在天津于家堡洲際酒店熱烈舉行。本屆大會以“芯所及 AI無處不在”為主題,匯聚全球網(wǎng)絡(luò)與邊緣計算領(lǐng)域的400多位精英專家與先鋒企業(yè)高管,聚焦
    發(fā)表于 07-25 13:40 ?199次閱讀
    芯??萍糴dge BMC首秀2024<b class='flag-5'>英特爾</b>網(wǎng)絡(luò)與邊緣<b class='flag-5'>計算</b>行業(yè)峰會

    英特爾是如何實現(xiàn)玻璃基板的?

    在今年9月,英特爾宣布率先推出用于下一代先進封裝的玻璃基板,并計劃在未來幾年內(nèi)向市場提供完整的解決方案,從而使單個封裝內(nèi)的晶體管數(shù)量不斷增加,繼續(xù)推動摩爾定律,滿足以數(shù)據(jù)為中心的應(yīng)用的算需求
    的頭像 發(fā)表于 07-22 16:37 ?335次閱讀

    異構(gòu)計算:解鎖算潛能的新途徑

    在這個數(shù)據(jù)爆炸的時代,計算力是推動社會與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運行到超級計算機的尖端模擬,均依賴強大的計算能力。但面對多樣化的復(fù)雜計算任務(wù),單一處理器難以勝任。于是,
    的頭像 發(fā)表于 07-18 08:28 ?7837次閱讀
    <b class='flag-5'>異構(gòu)計算</b>:解鎖算<b class='flag-5'>力</b>潛能的新途徑

    新思科技面向英特爾代工推出量產(chǎn)的多裸晶芯片設(shè)計參考流程,加速芯片創(chuàng)新

    英特爾代工(Intel Foundry)的EMIB先進封裝技術(shù),提升異構(gòu)集成的結(jié)果質(zhì)量; 新思科技3DIC Compiler是一個從探索到簽核的統(tǒng)一平臺,支持采用
    發(fā)表于 07-09 13:42 ?789次閱讀

    智能時代的路,將由異構(gòu)計算鋪就

    的數(shù)字產(chǎn)業(yè)集群,全面實施智能制造行動計劃,已經(jīng)成為我國當前發(fā)展的重點之一。在此背景下,企業(yè)如何突破算迷局,找到更加高效的算形態(tài),就變得至關(guān)重要。據(jù)英特爾預(yù)測,到2
    的頭像 發(fā)表于 07-03 08:28 ?237次閱讀
    智能時代的路,將由<b class='flag-5'>異構(gòu)計算</b>鋪就

    英特爾CEO:AI時代英特爾動力不減

    英特爾CEO帕特·基辛格堅信,在AI技術(shù)的飛速發(fā)展之下,英特爾的處理器仍能保持其核心地位。基辛格公開表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術(shù)上的創(chuàng)新能力將持續(xù)驅(qū)動公司前進。
    的頭像 發(fā)表于 06-06 10:04 ?438次閱讀

    高通NPU和異構(gòu)計算提升生成式AI性能?

    異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負擔,需要配備不同的處理器,如專注于AI工作負載的定制設(shè)計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?806次閱讀

    英特爾1nm投產(chǎn)時間曝光!領(lǐng)先于臺積電

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月28日 16:28:32

    英特爾首推面向AI時代的系統(tǒng)級代工—英特爾代工

    英特爾首推面向AI時代的系統(tǒng)級代工——英特爾代工(Intel Foundry),在技術(shù)、韌性和可持續(xù)性方面均處于領(lǐng)先地位。
    的頭像 發(fā)表于 02-25 10:38 ?555次閱讀
    <b class='flag-5'>英特爾</b>首推面向AI時代的系統(tǒng)級代工—<b class='flag-5'>英特爾</b>代工

    英特爾登頂2023年全球半導(dǎo)體榜單之首

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月01日 11:55:16