最近中文字幕免费完整影视,99热99这里只有高清国产

高性能計算（HPC）已成為我們現(xiàn)代世界的重要組成部分，執(zhí)行對科學(xué)研究、工程、安全和其他領(lǐng)域至關(guān)重要的復(fù)雜模擬和計算。然而，隨著對HPC的需求不斷增長，通常是在超級計算機(jī)和大型數(shù)據(jù)中心，對其環(huán)境影響的擔(dān)憂也在增加。近年來，鑒于對總擁有成本和氣候問題的影響，人們越來越關(guān)注數(shù)據(jù)中心的可持續(xù)性。在這篇博文中，我們將探討有關(guān)數(shù)據(jù)中心能效的一些關(guān)鍵問題，并討論 AMD 幫助減少 HPC 對環(huán)境的影響的一些策略。

數(shù)據(jù)中心面臨的最大挑戰(zhàn)之一是當(dāng)您擴(kuò)展到百萬兆次級及更高規(guī)模時，它們的能耗。服務(wù)器節(jié)點消耗大量能量，HPC 需要更多能量，其所有 CPU 和加速器，這使得提高效率成為重要優(yōu)先事項。隨著對 HPC 計算需求的不斷增加，我們遇到了能耗是一個門控因素的情況。這種能源消耗不僅給環(huán)境帶來了壓力，也給數(shù)據(jù)中心運營商的底線帶來了壓力，因為行業(yè)需要更多的計算性能。因此，隨著行業(yè)邁向下一個里程碑，需要大幅提高每瓦性能。

由于 AMD 是尖端服務(wù)器 CPU 和 GPU 的設(shè)計者，我們認(rèn)識到我們在解決這些關(guān)鍵優(yōu)先事項方面的重要作用。我們專注于提高服務(wù)器能效，降低數(shù)據(jù)中心總擁有成本（TCO），并提供高性能計算（HPC），以幫助應(yīng)對世界上一些最嚴(yán)峻的挑戰(zhàn)。早在 2021 年 2 月，AMD 就宣布了一個雄心勃勃的目標(biāo)，即提高運行處理器的能效......要實現(xiàn)這一目標(biāo)，AMD 需要以比過去五年中全行業(yè)總體改進(jìn)快 5.<> 倍以上的速度提高計算節(jié)點的能效。

AMD Instinct? 加速器通過在設(shè)備和系統(tǒng)級別提供卓越的每瓦性能，從而實現(xiàn)高能效的 HPC 和 AI，從而提高計算的能效。要實現(xiàn) AMD HPC 和 AI 能效目標(biāo)，需要圍繞架構(gòu)、內(nèi)存和互連進(jìn)行更高水平的思考，這些架構(gòu)、內(nèi)存和互連相結(jié)合，可加速系統(tǒng)級改進(jìn)。對于我們的 AMD Instinct MI200 系列加速器，我們從多方面的角度看待它，我們將在下面更詳細(xì)地解釋一些關(guān)鍵技術(shù)，以實現(xiàn)每瓦特和效率的領(lǐng)先性能。

架構(gòu)技術(shù) – MI2 系列中的 AMD CDNA? 200 架構(gòu)通過增強(qiáng)面向 HPC 和 AI 的矩陣核心技術(shù)，推動雙精度浮點數(shù)據(jù)和各種矩陣乘法基元的計算能力，代表了與上一代產(chǎn)品相比的重大飛躍。一個特別強(qiáng)調(diào)的是使用FP64矩陣和矢量數(shù)據(jù)的科學(xué)計算，以便在橡樹嶺國家實驗室前沿超級計算機(jī)等大型系統(tǒng)中擴(kuò)展時實現(xiàn)百萬兆次級的性能，性能為1.1 exaflops。與上一代 MI4 CDNA 架構(gòu)相比，這些改進(jìn)使 FP64 矢量 TFLOP/s 和 2.5 倍 FP64 TFLOPS/瓦特相應(yīng)提高了 100 倍，從而提高了每瓦性能。

封裝技術(shù) – 小芯片和先進(jìn)的封裝技術(shù)是提高性能和整體效率的巨大杠桿。它們允許您將不同的技術(shù)用于不同的功能，組合多個加速器芯片，并使加速器更接近內(nèi)存等?；ミB密度越密集，解決方案的效率就越高，并有助于降低昂貴的數(shù)據(jù)傳輸能耗。

MCM - 全球首款多芯片 GPU，旨在通過單個封裝最大限度地提高計算和數(shù)據(jù)吞吐量。MI250 和 MI250X 在單個封裝中使用兩個 AMD CDNA 2 圖形內(nèi)核芯片（GCD），在高度精簡的封裝中提供 58 億個晶體管，與 AMD 上一代加速器相比，內(nèi)核數(shù)量增加了 1.8 倍，內(nèi)存帶寬提高了 2.6 倍。兩個GCD通過高速接口連接在一起，用于芯片到芯片的通信。

高架扇出橋 – 將 AMD CDNA 芯片連接到基板上各自的 HBM2E 內(nèi)存堆棧，這可以降低復(fù)雜性并提高可擴(kuò)展性，同時降低成本。傳統(tǒng)上，硅中介層部署有微凸塊以支持高密度互連。這種方法需要一個大的硅襯底來支撐上面的整個硅加HBM組件。

通信技術(shù) – 在開發(fā)高性能計算機(jī)時，通信是處理大量數(shù)據(jù)的關(guān)鍵。在處理器和外部世界之間高效移動數(shù)據(jù)的能力對于向上和向外擴(kuò)展的系統(tǒng)性能也至關(guān)重要。將硅芯片在物理和電氣上更緊密地結(jié)合在一起，可以大大降低通信能量，同時提供更高的吞吐量潛力。AMD Infinity 架構(gòu)是我們在 CPU 和 GPU 以及 GPU 到 GPU 之間的高速通信高速公路，我們將在加速器中討論提高通信效率的兩個領(lǐng)域。

芯片到芯片互連 - 封裝內(nèi) AMD 無限結(jié)構(gòu)?接口是 AMD CDNA 2 系列的關(guān)鍵創(chuàng)新之一，可連接 MI2 或 MI250X 中的 250 個 GCD。它利用封裝內(nèi) GCD 之間的極短距離，以 25 Gbps 和極低的功耗運行，在 GCD 之間提供高達(dá) 400 GB/s 的理論最大雙向帶寬。

Infinity Architecture – 最新的 AMD Instinct 產(chǎn)品使用我們的第 3 代 Infinity Fabric，與上一代產(chǎn)品相比有了顯著的改進(jìn)。MI200 系列為 AMD Instinct? MI8（或 MI2X）加速器上的 GPU P250P 或 I/O 提供多達(dá) 250 個外部無限結(jié)構(gòu)?鏈路，提供高達(dá) 800 GB/s 的總理論帶寬，提供高達(dá) 235% 的 GPU P2P（或 I/O）理論帶寬性能，是上一代產(chǎn)品（3）。

結(jié)論
如今，AMD 使用我們當(dāng)前的 EPYC（霄龍）和本能處理器和加速器為一些最高效的超級計算機(jī)提供支持。Green500 是超級計算機(jī)的行業(yè)排名，每年兩次通過測量每瓦性能按能效排名。AMD 在最新的 2 年 7 月 Green2023 名單上保持著 #500 到 #<> 的位置，這證明了 AMD CPU 和 GPU 技術(shù)不僅提供了一些最強(qiáng)大的超級計算機(jī)，而且還提供了名單上一些最節(jié)能的超級計算機(jī)。

為了推動Zetascale的未來計算里程碑，需要圍繞架構(gòu)、內(nèi)存和互連進(jìn)行更高水平的思考，這些架構(gòu)、內(nèi)存和互連相結(jié)合，以加速系統(tǒng)級改進(jìn)。AMD 已經(jīng)邁出了第一步，將關(guān)鍵部分組合成一個新的加速器，其中包括最好的 AMD EPYC（霄龍）? CPU 和 AMD 本能?加速器，旨在實現(xiàn)比之前的 MI250 設(shè)計更高的代際效率和性能提升。這款名為 MI300 的全新 AMD Instinct 加速器將成為全球首款結(jié)合 CPU + GPU + 共享 HBM 的集成數(shù)據(jù)中心 APU，并提供突破性的架構(gòu)，為未來的百萬兆次級 AI 和 HPC 超級計算機(jī)提供動力。正是 MI300 上的單片集成利用了剛才討論的所有方法，實現(xiàn)了比之前的 MI250 設(shè)計更大的代際效率提升。

總之，長期提高計算機(jī)能效對于降低運營成本和推進(jìn)高性能計算機(jī)、超級計算機(jī)和數(shù)據(jù)中心的可持續(xù)發(fā)展目標(biāo)非常重要。AMD Instinct 團(tuán)隊致力于解決設(shè)備和系統(tǒng)級別的每瓦性能問題，從而提高計算效率并推進(jìn)數(shù)據(jù)中心對 HPC 和 AI 的可持續(xù)性。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10891

瀏覽量
212446
加速器

加速器

+關(guān)注

關(guān)注
2

文章
804

瀏覽量
37980
服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
12

文章
9262

瀏覽量
85780

玩游戲能減少延時,超級QQ登陸IP隱藏軟件智雨網(wǎng)絡(luò)加速器

加速器可以將您家里的寬帶網(wǎng)絡(luò)質(zhì)量提升到一個全新的檔次，說句帶點玩笑性質(zhì)但又是實情的話：“您正在使用的寬帶網(wǎng)絡(luò)質(zhì)量越糟糕，我們軟件帶給您幫助就

發(fā)表于 05-07 16:50

由采購員提升到采購工程師的四大訣竅

本帖最后由 maskmyself 于 2016-4-15 15:14 編輯如何從一個小小的采購員提升到一個經(jīng)驗老道的采購工程師除了

發(fā)表于 05-16 20:06

把可持續(xù)性運營放在最前線

這些可持續(xù)性項目是安森美半導(dǎo)體企業(yè)社會責(zé)任活動的重要一環(huán)。每年，我們都會跟蹤150多個以減少碳排放、降低能耗、節(jié)水、減少使用化學(xué)品和減少廢物產(chǎn)生為目標(biāo)的項目。安森美半導(dǎo)體的企業(yè)社會責(zé)任大部分建基于我

發(fā)表于 10-26 08:53

如何進(jìn)行電流檢測放大器使用，以達(dá)到電壓提升到可用水平？

如何進(jìn)行放大器設(shè)計和使用，以將它們之間產(chǎn)生的電壓提升到可用水平？通常兩端小電壓通常從數(shù)十或數(shù)百毫伏增加到零點幾伏，通過在電流檢測放大器分流作用下，能否得到很大提升，帶集成增益設(shè)定電阻器

發(fā)表于 01-10 15:06

如何將DSP性能提升到極限？

如何將DSP性能提升到極限？FPGA用做數(shù)字信號處理應(yīng)用

發(fā)表于 04-30 06:34

使用AMD-Xilinx FPGA設(shè)計一個AI加速器通道

介紹使用 AMD-Xilinx FPGA設(shè)計一個全連接DNN核心現(xiàn)在比較容易（Vitis AI），但是利用這個核心在 DNN 計算中使用它是另一

發(fā)表于 02-21 15:01

英飛凌穩(wěn)居全球最具可持續(xù)性公司行列再度入選《可持續(xù)性年鑒》

英飛凌已連續(xù)四年被瑞士投資公司 RobecoSAM 列入知名的《可持續(xù)性年鑒》。由此，德國半導(dǎo)體制造商英飛凌再次躋身全球最具可持續(xù)性公司行列。

發(fā)表于 02-10 17:45 ?607次閱讀

手機(jī) UL 110 可持續(xù)性標(biāo)準(zhǔn)認(rèn)證被 EPEAT 認(rèn)證系統(tǒng)采用

日前，UL環(huán)境部和EPEAT認(rèn)證系統(tǒng)管理者——綠色電子委員會（GEC）共同宣布，手機(jī)的可持續(xù)性認(rèn)證標(biāo)準(zhǔn)ANSI（美國國家標(biāo)準(zhǔn)學(xué)會）/ UL 110被EPEAT（電子產(chǎn)品環(huán)境影響評估工具）認(rèn)證系統(tǒng)采用，成為全球公共和私人集團(tuán)采購商用于識別和購買可持續(xù)性IT產(chǎn)品的標(biāo)準(zhǔn)。

發(fā)表于 03-09 13:22 ?5859次閱讀

利用以下八個開源AI技術(shù)，你的機(jī)器學(xué)習(xí)項目可提升到新水平

人工智能（AI）技術(shù)正迅速改變我們生活中幾乎每一個領(lǐng)域。從我們?nèi)绾谓涣鞯剑糜诮煌ǖ氖侄?，我們似乎越來越沉迷于人工智能。由于AI快速發(fā)展，大量的人才和資源致力于加速技術(shù)的發(fā)展。利用以下最好的開源AI技術(shù)，可將你的機(jī)器學(xué)習(xí)項目

發(fā)表于 05-16 14:14 ?1955次閱讀

歐司朗的Oslon為新概念提升了HX 將駕駛員輔助系統(tǒng)提升到一個新的水平

Oslon Boost HX非常適合用于DMD系統(tǒng)，因為它可提供出色的亮度，將基于光的駕駛員輔助系統(tǒng)提升到一個新的水平。

發(fā)表于 10-12 14:39 ?5575次閱讀

如何利用物聯(lián)網(wǎng)將工業(yè)自動化提升到新的水平

（IIOT）使制造系統(tǒng)能夠“感知”和“思考”流程中的變化，并對緊急情況下的變化做出“反應(yīng)”，因此，物聯(lián)網(wǎng)的引入將自動化制造系統(tǒng)的性能和功能提升到了一個全新的水平。

發(fā)表于 06-12 16:01 ?1476次閱讀

AMD宣布推出全新AMD Instinct MI200系列加速器

? —?AMD?Instinct MI200系列加速器憑借全新AMD CDNA 2架構(gòu)，在HPC性能方面可提供極具突破性的

發(fā)表于 11-16 10:04 ?2694次閱讀

利用NVIDIA BlueField DPU將加速計算提升到新的水平

全球的超級計算中心都在紛紛利用 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上的 NVIDIA BlueField DPU 將加速計算提升到

發(fā)表于 06-01 10:29 ?1255次閱讀

互連解決方案的可持續(xù)性發(fā)展

以下幾個主要市場正推動著可持續(xù)性互連解決方案的發(fā)展

發(fā)表于 11-20 15:14 ?148次閱讀

IBM與AMD攜手部署MI300X加速器，強(qiáng)化AI與HPC能力

近日，據(jù)外媒最新報道，國際商業(yè)機(jī)器公司(IBM)與超威半導(dǎo)體公司(AMD)已正式宣布達(dá)成一項重要合作。雙方將攜手在IBM Cloud上部署AMD的Instinct MI300X

發(fā)表于 11-21 11:07 ?265次閱讀

搜索歷史

利用AMD本能加速器將HPC的可持續(xù)性提升到一個新的水平

評論

玩游戲能減少延時,超級QQ登陸IP隱藏軟件智雨網(wǎng)絡(luò)加速器

由采購員提升到采購工程師的四大訣竅

把可持續(xù)性運營放在最前線

如何進(jìn)行電流檢測放大器使用，以達(dá)到電壓提升到可用水平？

如何將DSP性能提升到極限？

使用AMD-Xilinx FPGA設(shè)計一個AI加速器通道

英飛凌穩(wěn)居全球最具可持續(xù)性公司行列再度入選《可持續(xù)性年鑒》

手機(jī) UL 110 可持續(xù)性標(biāo)準(zhǔn)認(rèn)證被 EPEAT 認(rèn)證系統(tǒng)采用

利用以下八個開源AI技術(shù)，你的機(jī)器學(xué)習(xí)項目可提升到新水平

歐司朗的Oslon為新概念提升了HX 將駕駛員輔助系統(tǒng)提升到一個新的水平

如何利用物聯(lián)網(wǎng)將工業(yè)自動化提升到新的水平

AMD宣布推出全新AMD Instinct MI200系列加速器

利用NVIDIA BlueField DPU將加速計算提升到新的水平

互連解決方案的可持續(xù)性發(fā)展

IBM與AMD攜手部署MI300X加速器，強(qiáng)化AI與HPC能力