0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA CPU+GPU超級芯片大升級!

硬件世界 ? 來源:硬件世界 ? 2023-08-10 09:37 ? 次閱讀

NVIDIA官方宣布了新一代GH200 Grace Hopper超級芯片平臺,全球首發(fā)采用HBM3e高帶寬內存,可滿足世界上最復雜的生成式AI負載需求。

NVIDIA 2022年3月推出了Grace Hopper超級芯片,首次將CPU、GPU融合在一塊主板上,不過直到今年5月份才量產(chǎn)。

其中,Grace CPU擁有72個Armv9 CPU核心、198MB緩存,支持1TB/s高帶寬的LPDDR5X ECC內存,還支持PCIe 5.0。

Hopper GPU則采用臺積電4nm定制工藝,800億晶體管,集成18432個CUDA核心、576個Tenor核心、60MB二級緩存,支持6144-bit HBM高帶寬內存,此前版本配備的是96GB HBM3。

雙路配置的系統(tǒng)中,兩顆新一代GH200超級芯片可帶來144個CPU核心、8PFlops(8千萬億次浮點計算每秒) AI性能、282GB HBM3e內存,容量是現(xiàn)在的3.5倍,而高達10TB/s的帶寬也是現(xiàn)在的3倍。

基于NVLink高速總線,GH200超級芯片還可以繼續(xù)拓展互連,GPU可以訪問全部的CPU內存,雙路配置下總容量可達1.2TB。

NVIDIA沒有透露采用的HBM3e來自哪家供應商,很可能是SK海力士。

首批基于GH200超級芯片的系統(tǒng)將在2024年第二季度出貨。

順帶一提,AMD Instinct MI300A、MI300X AI加速器分別配備128GB、192GB HBM3,后者帶寬超過5TB/s。

NVIDIA Ada Lovelace架構在桌面、筆記本游戲卡上已經(jīng)布局完畢,如今在工作站上也圓滿了。

今天,NVIDIA正式發(fā)布了RTX 5000 ADA、RTX 4500 ADA、RTX 4000 ADA三款新專業(yè)卡,加上此前的旗艦級RTX 6000 ADA、半高式RTX 4000 SFF ADA,高中低端都齊了。

RTX 6000 ADA旗艦卡為雙插槽、單渦輪風扇設計,滿血的AD102 GPU核心,配備18176個CUDA核心、568個Tensor核心,核心加速頻率可達2.5GHz。

顯存搭檔384-bit 48GB GDDR6 ECC,等效頻率20GHz,帶寬為960GB/s,整卡功耗300W,四個DP 1.4a接口

FP32浮點性能91.1TFlops(每秒91.1萬億次),價格高達6800美元,約合人民幣4.90萬元。

RTX 5000 ADA延續(xù)了老大哥的造型、AD102核心,精簡到12800個CUDA核心、400個Tensor核心。

顯存也砍到256-bit 32GB,頻率18GHz,帶寬降至578GB/s,功耗也來到250W。

浮點性能65.3TFlops,相當于旗艦卡的約72%,價格4000美元,約合人民幣2.88元。

RTX 4500 ADA外觀依然不變,但內部改成了AD104核心(跳過AD103),7680個CUDA核心、240個Tensor核心的規(guī)模與RTX 4070 Ti完全一致。

核心頻率是全系列最高的2.6GHz,顯存是192-bit 24GB GDDR6 ECC,頻率18GHz,帶寬432GB/s。

浮點性能39.6TFlops,價格2250美元,約合人民幣1.62萬元。

RTX 4000 ADA改成了單插槽設計,還是單個渦輪風扇,AD104核心,6144個CUDA核心、192個Tensor核心、160-bit 20GB GDDR6顯存,接口四個mini DP 1.4a,這些都和SFF半完全一致。

不過核心頻率從1.56GHz大幅提高到2.2GHz,顯存頻率也從16GHz提高到18GHz,浮點性能來到了26.7TFlops,功耗也從70W大幅增至130W。

價格倒是沒變,還是1250美元,約合人民幣9000元。

Boxx、戴爾、Lamdda、聯(lián)想、惠普等將從今年秋天開始陸續(xù)推出搭載新卡的工作站,甚至有的會配備四塊RTX 6000 ADA,總顯存多達192GB。

43f9e084-36cd-11ee-9e74-dac502259ad0.png

442e621e-36cd-11ee-9e74-dac502259ad0.png






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 晶體管
    +關注

    關注

    77

    文章

    9692

    瀏覽量

    138178
  • 緩存器
    +關注

    關注

    0

    文章

    63

    瀏覽量

    11659
  • PCIe接口
    +關注

    關注

    0

    文章

    120

    瀏覽量

    9704
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5812
  • NVIDIA顯卡
    +關注

    關注

    0

    文章

    15

    瀏覽量

    3153

原文標題:NVIDIA CPU+GPU超級芯片大升級!史無前例282GB內存

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA 以太網(wǎng)加速 xAI 構建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡平臺,該平臺
    發(fā)表于 10-30 09:33 ?153次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b>計算機

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講算力芯片CPU
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    紙質媒體的高質量和專業(yè)網(wǎng)絡媒體的信息更新速度。 算力芯片在最近15年有著巨大性能突破,這些年Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA
    發(fā)表于 09-02 10:09

    NVIDIA GB200超級芯片引領液冷散熱新紀元

    ,特別是其單顆B200芯片功耗高達1000W,以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級芯片GB200功耗驚人地
    的頭像 發(fā)表于 08-01 16:35 ?1029次閱讀

    NVIDIA GB200 CPU+GPU超級芯片功耗達2700W

    7月31日,集邦咨詢發(fā)布的最新報告揭示了AI服務器領域的一個重要趨勢:隨著計算能力與功耗的同步攀升,特別是NVIDIA計劃在年底推出的下一代Blackwell平臺將帶來顯著的功耗增長,液冷散熱技術正逐步成為行業(yè)標配,預計今年底其市場滲透率將達到10%。
    的頭像 發(fā)表于 07-31 13:02 ?1046次閱讀

    超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

    ABSTRACT摘要根據(jù)最新傳言,旗艦級NVIDIAGeForceRTX5090GPU看起來將是一款超級猛獸。據(jù)稱,顯卡的基本時鐘速度將設定在2.9GHz左右,幾乎達到3GHz的門檻
    的頭像 發(fā)表于 07-12 08:26 ?446次閱讀
    <b class='flag-5'>超級</b>猛獸 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本頻率接近 2.9 GHz

    CPU渲染和GPU渲染優(yōu)劣分析

    GPU的出現(xiàn),基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片,在某些情況下提供與CPU渲染相當?shù)慕Y果。從廣義上講,
    的頭像 發(fā)表于 05-23 08:27 ?596次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    CPU和72個Blackwell GPU,并通過NVIDIA NVLink技術連接。DGX SuperPOD可以通過NVIDIA Quantum InfiniBand連接多個機架,實
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?725次閱讀

    AI服務器異構計算深度解讀

    AI服務器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內的主要選擇(占比91.9%)
    發(fā)表于 04-12 12:27 ?630次閱讀
    AI服務器異構計算深度解讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級
    的頭像 發(fā)表于 03-21 09:49 ?702次閱讀

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    基于先進的 NVIDIA 網(wǎng)絡、NVIDIA 全棧 AI 軟件和存儲技術,可將集群中 Grace Blackwell 超級芯片的數(shù)量擴展至數(shù)萬個,通過
    發(fā)表于 03-19 10:56 ?425次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI <b class='flag-5'>超級</b>計算

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個同時擁有 GPUCPU和DPU的計算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C
    發(fā)表于 03-13 09:25 ?953次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI<b class='flag-5'>芯片</b>路線圖

    Nvidia與AMD新芯片,突破PCIe瓶頸

    AMD 和 NvidiaGPU 都依賴 PCI 總線與 CPU 進行通信。CPUGPU 有兩個不同的內存域,數(shù)據(jù)必須通過 PCI
    的頭像 發(fā)表于 03-08 14:15 ?673次閱讀
    <b class='flag-5'>Nvidia</b>與AMD新<b class='flag-5'>芯片</b>,突破PCIe瓶頸

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務和數(shù)據(jù),而CPU通常只能一次處理一項任務。這是因為GPU的架構使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2409次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?