0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是 NVLink?

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-04-19 04:05 ? 次閱讀

NVLink 是加速系統(tǒng)中 GPUCPU 處理器的高速互連技術(shù),推動(dòng)數(shù)據(jù)和計(jì)算加速得出可執(zhí)行結(jié)果。

加速計(jì)算是一項(xiàng)曾經(jīng)只有政府研究實(shí)驗(yàn)室中才有的高性能計(jì)算能力。如今,它已成為主流技術(shù)。

銀行、汽車制造商、工廠、醫(yī)院、零售商等機(jī)構(gòu)需要處理和理解的數(shù)據(jù)日益增加,他們現(xiàn)在正在采用 AI 超級(jí)計(jì)算機(jī)來處理這些堆積如山的數(shù)據(jù)。

這些強(qiáng)大、高效的系統(tǒng)如同一條條“超級(jí)計(jì)算高速公路”。它們?cè)诙鄺l并行路徑上同時(shí)傳輸數(shù)據(jù)和計(jì)算,可以瞬間得出可執(zhí)行結(jié)果。

GPU 和 CPU 處理器是“公路”沿途的資源,而快速互連通道是通往它們的“匝道”。NVLink 是加速計(jì)算互連通道的黃金標(biāo)準(zhǔn)。

那么,什么是 NVLink?

NVLink 是 GPU 和 CPU 之間的高速連接通道。它由一個(gè)強(qiáng)大的軟件協(xié)議組成,通常通過印在計(jì)算機(jī)板上的多對(duì)導(dǎo)線實(shí)現(xiàn),可以讓處理器以閃電般的速度收發(fā)共享內(nèi)存池中的數(shù)據(jù)。

如今,第四代 NVLink 連接主機(jī)和加速處理器的速度高達(dá)每秒 900GB/s。

這是傳統(tǒng) x86 服務(wù)器的互連通道——PCIe 5.0 帶寬的 7 倍多。由于每傳輸 1 字節(jié)數(shù)據(jù)僅消耗 1.3 皮焦,因此 NVLink 的能效是 PCIe 5.0 的 5 倍。

NVLink 的歷史

NVLink 最初作為 NVIDIA P100 GPU 的互連通道推出,之后便與每一代新的 NVIDIA GPU 架構(gòu)同步發(fā)展。

daa33fec-de23-11ed-bfe3-dac502259ad0.jpg

2018 年,NVLink 首次亮相便被用于連接兩臺(tái)超級(jí)計(jì)算機(jī)——Summit 和 Sierra 的 GPU 和 CPU,成為了高性能計(jì)算領(lǐng)域的焦點(diǎn)。

這兩套安裝在美國橡樹嶺國家實(shí)驗(yàn)室和美國勞倫斯利弗莫爾國家實(shí)驗(yàn)室的系統(tǒng)正在推動(dòng)藥物研發(fā)、自然災(zāi)害預(yù)測(cè)等科學(xué)領(lǐng)域的發(fā)展。

帶寬翻倍,繼續(xù)發(fā)展

2020 年,第三代 NVLink 將每個(gè) GPU 的最大帶寬翻倍提高至 600GB/s,每個(gè) NVIDIA A100 Tensor Core GPU 中都有十幾條互連通道。

A100 為全球各地企業(yè)數(shù)據(jù)中心云計(jì)算服務(wù)和 HPC 實(shí)驗(yàn)室的 AI 超級(jí)計(jì)算機(jī)提供動(dòng)力。

如今,一個(gè) NVIDIA H100 Tensor Core GPU 中包含 18 條第四代 NVLink 互連通道。這項(xiàng)技術(shù)已承擔(dān)了一項(xiàng)新的戰(zhàn)略任務(wù)——幫助打造全球領(lǐng)先的 CPU 和加速器。

芯片到芯片互聯(lián)

NVIDIA NVLink-C2C 是一種板級(jí)互連技術(shù),它能夠在單個(gè)封裝中將兩個(gè)處理器連接成一塊超級(jí)芯片。比如它通過連接兩塊 CPU 芯片,使 NVIDIA Grace CPU 超級(jí)芯片具有 144 個(gè) Arm Neoverse V2 核心,為云、企業(yè)和 HPC 用戶帶來了高能效性能。

NVIDIA NVLink-C2C 還將 Grace CPU 和 Hopper GPU 連接成 Grace Hopper 超級(jí)芯片,將用于處理最棘手的 HPC 和 AI 工作的加速計(jì)算能力集合到一塊芯片中。

計(jì)劃在瑞士國家計(jì)算中心投入使用的 AI 超級(jí)計(jì)算機(jī) Alps 將是首批使用 Grace Hopper 的計(jì)算機(jī)之一。這套高性能系統(tǒng)將在今年晚些時(shí)候上線,用于處理從天體物理學(xué)到量子化學(xué)等領(lǐng)域的大型科學(xué)問題。

Grace 和 Grace Hopper 還非常適合用于提升高要求云計(jì)算工作負(fù)載的能效。

例如 Grace Hopper 是最適合用于推薦系統(tǒng)的處理器。這些互聯(lián)網(wǎng)的經(jīng)濟(jì)引擎需要快速、高效地訪問大量數(shù)據(jù),才能每天向數(shù)十億用戶提供數(shù)萬億條結(jié)果。

dab5048e-de23-11ed-bfe3-dac502259ad0.jpg

與使用傳統(tǒng) CPU 的 Hopper 相比,采用 Grace Hopper 的推薦系統(tǒng)的性能提高了 4 倍,并且效率更高。

另外,NVLink 還被用于為汽車制造商提供的強(qiáng)大系統(tǒng)級(jí)芯片,包括 NVIDIA Hopper、Grace 和 Ada Lovelace 處理器等。車載計(jì)算平臺(tái) NVIDIA DRIVE Thor 將數(shù)字儀表板、車載信息娛樂、自動(dòng)駕駛、泊車等諸多智能功能統(tǒng)一整合到單個(gè)架構(gòu)中。

“樂高式”計(jì)算鏈路

NVLink 的作用就像是樂高積木的凸粒和凹槽。它是構(gòu)建超級(jí)系統(tǒng)以處理超大型 HPC 和 AI 工作的基礎(chǔ)。

例如,NVIDIA DGX 系統(tǒng)中的八個(gè) GPU 上的 NVLink 通過 NVSwitch 芯片共享快速、直接的連接。它們共同組成了一個(gè) NVLink 網(wǎng)絡(luò),使服務(wù)器中的每一個(gè) GPU 都是一套系統(tǒng)的一部分。

為了獲得更強(qiáng)大的性能,DGX 系統(tǒng)本身可以堆疊成由 32 臺(tái)服務(wù)器組成的模塊化單元,形成一個(gè)強(qiáng)大、高效的計(jì)算集群。

用戶可以利用 DGX 內(nèi)部的 NVLink 網(wǎng)絡(luò)與兩者之間的 NVIDIA Quantum-2 InfiniBand 交換以太網(wǎng),將 32 個(gè) DGX 系統(tǒng)模塊連接成一臺(tái) AI 超級(jí)計(jì)算機(jī)。例如,一臺(tái) NVIDIA DGX H100 SuperPOD 包含 256 個(gè) H100 GPU,可提供最高 1 EXAFLOP 的峰值 AI 性能。

如要進(jìn)一步提高性能,用戶還可以使用云中的 AI 超級(jí)計(jì)算機(jī),例如微軟Azure使用數(shù)萬個(gè) A100 和 H100 GPU 打造的超級(jí)計(jì)算機(jī)。OpenAI 等團(tuán)隊(duì)正在使用這項(xiàng)服務(wù)訓(xùn)練一些全球最大的生成式 AI 模型。

這再次印證了加速計(jì)算的力量。


原文標(biāo)題:什么是 NVLink?

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91111

原文標(biāo)題:什么是 NVLink?

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    挑戰(zhàn)英偉達(dá)NVLink!英特爾/谷歌等成立聯(lián)盟,推出UALink 1.0

    ,UALink推廣組正在抓緊制定一項(xiàng)新的行業(yè)標(biāo)準(zhǔn),用于推進(jìn)數(shù)據(jù)中心內(nèi)連接的大規(guī)模AI系統(tǒng)的高速和低延遲通信,擺脫英偉達(dá)NVLink在AI加速器連接方面的統(tǒng)治。 ? 對(duì)于這項(xiàng)新的行業(yè)標(biāo)準(zhǔn),AMD數(shù)據(jù)中心
    的頭像 發(fā)表于 06-03 06:31 ?2760次閱讀
    挑戰(zhàn)英偉達(dá)<b class='flag-5'>NVLink</b>!英特爾/谷歌等成立聯(lián)盟,推出UALink 1.0

    分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)NVLink的演進(jìn)

    大型模型的大小已經(jīng)超出了單個(gè) GPU 的范圍。所以就需要實(shí)現(xiàn)跨多個(gè) GPU 的模型訓(xùn)練,這種訓(xùn)練方式就涉及到了分布式通信和 NVLink。 當(dāng)談及分布式通信和 NVLink 時(shí),我們進(jìn)入了一個(gè)引人入勝且不斷演進(jìn)的技術(shù)領(lǐng)域,下面我們將簡(jiǎn)單介紹分布式通信的原理和實(shí)
    的頭像 發(fā)表于 11-18 09:39 ?455次閱讀
    分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)<b class='flag-5'>NVLink</b>的演進(jìn)

    鴻海再獲AI領(lǐng)域大單,獨(dú)家供貨英偉達(dá)GB200 NVLink交換器

    在人工智能(AI)領(lǐng)域的激烈競(jìng)爭(zhēng)中,鴻海集團(tuán)再次傳來捷報(bào)。繼成功獲得英偉達(dá)(NVIDIA)GB200 AI服務(wù)器代工訂單的大份額后,鴻海又獨(dú)家攬獲了GB200關(guān)鍵元件——被譽(yù)為“提升算力法寶”的NVLink交換器(switch)的巨額訂單。
    的頭像 發(fā)表于 06-19 15:04 ?990次閱讀

    科技巨頭組建“復(fù)仇者聯(lián)盟”,挑戰(zhàn)英偉達(dá)的NVLink技術(shù)

    據(jù)報(bào)導(dǎo),包括 AMD、谷歌、微軟、英特爾(Intel)、博通(Broadcom)和思科(Cisco)在內(nèi)的多家國際科技龍頭聯(lián)手,組成“復(fù)仇者聯(lián)盟”,欲挑戰(zhàn) NVIDIA 的 NVLink 技術(shù)。
    的頭像 發(fā)表于 05-31 11:54 ?627次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    帶寬和1.8TB/s的NVLink帶寬,使處理能力翻倍,大幅增加內(nèi)存容量和帶寬,為處理大規(guī)模人工智能模型和復(fù)雜計(jì)算提供必要資源。 針對(duì)大規(guī)模模型如GPT-MoE-1.8T,HGX B200的推理性
    發(fā)表于 05-13 17:16

    一文詳解基于以太網(wǎng)的GPU Scale-UP網(wǎng)絡(luò)

    最近Intel Gaudi-3的發(fā)布,基于RoCE的Scale-UP互聯(lián),再加上Jim Keller也在談?dòng)靡蕴W(wǎng)替代NVLink
    的頭像 發(fā)表于 04-22 17:22 ?3764次閱讀
    一文詳解基于以太網(wǎng)的GPU Scale-UP網(wǎng)絡(luò)

    全面解讀英偉達(dá)NVLink技術(shù)

    NVLink是一種解決服務(wù)器內(nèi)GPU之間通信限制的協(xié)議。與傳統(tǒng)的PCIe交換機(jī)不同,NVLink帶寬有限,可以在服務(wù)器內(nèi)的GPU之間實(shí)現(xiàn)高速直接互連。第四代NVLink提供更高的帶寬,每條通道達(dá)到112Gbps,比PCIe Ge
    發(fā)表于 04-22 11:01 ?1341次閱讀
    全面解讀英偉達(dá)<b class='flag-5'>NVLink</b>技術(shù)

    什么是NVIDIA?InfiniBand網(wǎng)絡(luò)VSNVLink網(wǎng)絡(luò)

    NVSwitch物理交換機(jī)將多個(gè)NVLink GPU服務(wù)器連接成一個(gè)大型Fabric網(wǎng)絡(luò),即NVLink網(wǎng)絡(luò),解決了GPU之間的高速通信帶寬和效率問題。
    發(fā)表于 04-16 09:56 ?1375次閱讀
    什么是NVIDIA?InfiniBand網(wǎng)絡(luò)VSNVLink網(wǎng)絡(luò)

    NVLink的演進(jìn):從內(nèi)部互聯(lián)到超級(jí)網(wǎng)絡(luò)

    NVLink是NVIDIA開發(fā)的一種高速、低延遲的互聯(lián)技術(shù),旨在連接多個(gè)GPU以實(shí)現(xiàn)高性能并行計(jì)算。與傳統(tǒng)的PCIe總線相比,NVLink提供了更高的帶寬和更低的延遲,使得GPU之間可以更加高效地共享數(shù)據(jù)和通信。
    的頭像 發(fā)表于 04-13 11:22 ?1138次閱讀
    <b class='flag-5'>NVLink</b>的演進(jìn):從內(nèi)部互聯(lián)到超級(jí)網(wǎng)絡(luò)

    深入探討常見的GPU系統(tǒng)架構(gòu)

    同一主機(jī)內(nèi)GPU之間的通信:通過NVLink技術(shù),雙向帶寬達(dá)到600GB/s,單向帶寬達(dá)到300GB/s。
    發(fā)表于 04-07 11:35 ?2045次閱讀
    深入探討常見的GPU系統(tǒng)架構(gòu)

    NVLink技術(shù)之GPU與GPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會(huì)產(chǎn)生較大延時(shí),影響GPU并行計(jì)算的效率和性能。
    發(fā)表于 03-27 09:40 ?3945次閱讀
    <b class='flag-5'>NVLink</b>技術(shù)之GPU與GPU的通信

    NVIDIA宣布推出NVIDIA Blackwell平臺(tái)以賦能計(jì)算新時(shí)代

    全新 Blackwell GPU、NVLink 和可靠性技術(shù)賦能萬億參數(shù)規(guī)模的 AI 模型
    的頭像 發(fā)表于 03-20 09:44 ?620次閱讀

    英偉達(dá)AI服務(wù)器NVLink版與PCIe版有何區(qū)別?又如何選擇呢?

    在人工智能領(lǐng)域,英偉達(dá)作為行業(yè)領(lǐng)軍者,推出了兩種主要的GPU版本供AI服務(wù)器選擇——NVLink版(實(shí)為SXM版)與PCIe版。這兩者有何本質(zhì)區(qū)別?又該如何根據(jù)應(yīng)用場(chǎng)景做出最佳選擇呢?讓我們深入探討一下。
    的頭像 發(fā)表于 03-19 11:21 ?5562次閱讀
    英偉達(dá)AI服務(wù)器<b class='flag-5'>NVLink</b>版與PCIe版有何區(qū)別?又如何選擇呢?

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個(gè)同時(shí)擁有 GPU、CPU和DPU的計(jì)算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C技術(shù)將CPU、GPU進(jìn)行靈活連接組合形成統(tǒng)一的硬件架構(gòu),并于CUDA一起形成完整的軟硬件生態(tài)。
    發(fā)表于 03-13 09:25 ?962次閱讀
    深度解讀Nvidia AI芯片路線圖

    英偉達(dá)推出為中國大陸定制的H20 AI GPU芯片

    盡管英偉達(dá)H20降低了AI算力,但其具有更低的售價(jià)、支持NVLink高速互聯(lián)技術(shù)以及CUDA等優(yōu)勢(shì)。
    的頭像 發(fā)表于 01-03 14:30 ?1935次閱讀