0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá) A100 GPU 全面上市,推理性能比 CPU 快 237 倍

工程師鄧生 ? 來源:IT之家 ? 作者:孤城 ? 2020-11-04 15:34 ? 次閱讀

根據(jù)英偉達(dá)官方的消息,在 AWS 運(yùn)行 NVIDIA GPU 十周年之際,AWS 發(fā)布了采用全新 A100 的 Amazon EC2 P4d 實例。

IT之家了解到,現(xiàn)在已全面上市的全新 AWS P4d 實例采用最新 NVIDIA A100 Tensor Core GPU。A100 計算卡采用了 7nm 工藝的 GA100 GPU,這款 GPU 擁有 6912 CUDA 核心和 432 張量核心。GPU 封裝尺寸為 826mm2,集成了 540 億個晶體管。

英偉達(dá)表示,全新的 P4d 實例,為機(jī)器學(xué)習(xí)訓(xùn)練和高性能計算應(yīng)用提供 AWS 上性能與成本效益最高的 GPU 平臺。與默認(rèn)的 FP32 精度相比,全新實例將 FP16 機(jī)器學(xué)習(xí)模型的訓(xùn)練時間減少多達(dá) 3 倍,將 TF32 機(jī)器學(xué)習(xí)模型的訓(xùn)練的時間減少多達(dá) 6 倍。

這些實例還提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基準(zhǔn)測試中一騎絕塵,實現(xiàn)了比 CPU 快 237 倍的性能。

每個 P4d 實例均內(nèi)置八個 NVIDIA A100 GPU,通過 AWS UltraClusters,客戶可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可擴(kuò)展高性能存儲,按需、可擴(kuò)展地同時訪問多達(dá) 4,000 多個 GPU。P4d 提供 400Gbps 網(wǎng)絡(luò),通過使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技術(shù),進(jìn)一步加速深度學(xué)習(xí)訓(xùn)練的工作負(fù)載。EFA 上的 NVIDIA GPUDirect RDMA 在服務(wù)器之間可通過 GPU 傳輸數(shù)據(jù),無需通過 CPU 和系統(tǒng)內(nèi)存,從而確保網(wǎng)絡(luò)的低延遲。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211797
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128953
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8418

    瀏覽量

    132654
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91114
  • A100
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    7794
收藏 人收藏

    評論

    相關(guān)推薦

    蘋果 A18 芯片發(fā)布:CPU 提升 30%、GPU 提升 40%

    CPU 包括 2 個性能核心和 4 個效率核心, iPhone 15 的 A16 Bionic 30%,能耗降低 30% 。
    的頭像 發(fā)表于 09-11 12:19 ?649次閱讀
    蘋果 <b class='flag-5'>A</b>18 芯片發(fā)布:<b class='flag-5'>CPU</b> 提升 30%、<b class='flag-5'>GPU</b> 提升 40%

    開箱即用,AISBench測試展示英特爾至強(qiáng)處理器的卓越推理性能

    近期,第五代英特爾?至強(qiáng)?可擴(kuò)展處理器通過了中國電子技術(shù)標(biāo)準(zhǔn)化研究院組織的人工智能服務(wù)器系統(tǒng)性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業(yè)
    的頭像 發(fā)表于 09-06 15:33 ?347次閱讀
    開箱即用,AISBench測試展示英特爾至強(qiáng)處理器的卓越<b class='flag-5'>推理性能</b>

    英偉達(dá)全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    英偉達(dá)公司近期宣布了一項重大決策,即全面轉(zhuǎn)向開源GPU內(nèi)核模塊,并計劃最終以此取代閉源驅(qū)動程序。這一戰(zhàn)略轉(zhuǎn)變標(biāo)志著英偉
    的頭像 發(fā)表于 07-19 15:26 ?570次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉達(dá)(NVIDIA)公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)英偉達(dá)透露,B
    的頭像 發(fā)表于 06-13 09:44 ?818次閱讀

    成都匯陽投資關(guān)于英偉達(dá) GB200+終端快速放量,這一材料需求快速提升

    CPU),單 GB200 NVL72 機(jī)架可包含 72 顆 GPU,提供 720PFLOPs 訓(xùn)練性能 + 1440PFLOPs 推理性能?;ヂ?lián)模式通過 NV Switch 實現(xiàn),其
    的頭像 發(fā)表于 06-07 09:29 ?516次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    架構(gòu)在高性能計算方面的應(yīng)用有哪些? **1. **人工智能訓(xùn)練和推理 Blackwell 架構(gòu)的 GPU 核心在訓(xùn)練性能上相較前代 Hopper H
    發(fā)表于 05-13 17:16

    美方持續(xù)收緊AI芯片對華出口限制,英偉達(dá)等巨頭面臨挑戰(zhàn)

    為了挽回中國市場,英偉達(dá)不得不做出妥協(xié),推出了符合美方限制政策的A100A800芯片。
    的頭像 發(fā)表于 04-02 16:28 ?1205次閱讀

    英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

    英偉達(dá)宣稱,B200在性能以往最好的GPU30
    的頭像 發(fā)表于 03-20 09:37 ?801次閱讀

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場景等多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3635次閱讀

    英偉達(dá)H200和A100的差異

    英偉達(dá)H200和A100在多個方面存在差異。
    的頭像 發(fā)表于 03-07 16:18 ?2567次閱讀

    英偉達(dá)縮短AI GPU交付周期,持續(xù)推進(jìn)算力產(chǎn)業(yè)鏈發(fā)展

    與此同時,隨著人工智能的迅猛發(fā)展及其廣泛應(yīng)用,對像H100A100這類專為數(shù)據(jù)中心設(shè)計的高性能GPU的需求也大幅增長。而包括Yotta在內(nèi)的多家公司因此紛紛加大向
    的頭像 發(fā)表于 02-18 09:36 ?520次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項任務(wù)。這是因為
    的頭像 發(fā)表于 01-26 08:30 ?2414次閱讀
    為什么<b class='flag-5'>GPU</b><b class='flag-5'>比</b><b class='flag-5'>CPU</b>更快?

    猛獸財經(jīng):2024年繼續(xù)看好英偉達(dá)的兩個理由

    2023年可以說是英偉達(dá)成立近30年以來最好的一年。由于大語言模型帶動的訓(xùn)練和推理算力需求的增加,導(dǎo)致市場對英偉達(dá)AI芯片(H100、
    的頭像 發(fā)表于 01-11 16:24 ?934次閱讀
    猛獸財經(jīng):2024年繼續(xù)看好<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>的兩個理由

    2024年,GPU能降價嗎?

    首當(dāng)其沖的就是A100GPU。OpenAI使用的是3,617臺HGXA100服務(wù)器,包含近3萬塊英偉達(dá)GPU。國內(nèi)云計算相關(guān)專家認(rèn)為,做好A
    的頭像 發(fā)表于 01-03 15:57 ?855次閱讀
    2024年,<b class='flag-5'>GPU</b>能降價嗎?

    英偉達(dá)Grace-Hopper提供一個緊密集成的CPU + GPU解決方案

    英偉達(dá)Grace-Hopper提供了一個緊密集成的CPU + GPU解決方案,針對生成式人工智能逐漸成為主導(dǎo)的市場環(huán)境。
    的頭像 發(fā)表于 01-02 15:52 ?924次閱讀