0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為需要加速計(jì)算的企業(yè)客戶運(yùn)行測(cè)試服務(wù)器

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2021-12-15 15:35 ? 次閱讀

借助 NVIDIA AI,戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發(fā)布的新 MLPerf 基準(zhǔn)測(cè)試中創(chuàng)下快速訓(xùn)練 AI 模型的記錄

看看誰(shuí)剛剛在快速訓(xùn)練 AI 模型方面創(chuàng)下新速度記錄:戴爾科技、浪潮、Supermicro以及在 MLPerf 基準(zhǔn)測(cè)試中首次亮相的 Azure 均在使用 NVIDIA AI。

在今天宣布的 MLPerf 訓(xùn)練 1.1 結(jié)果中,NVIDIA平臺(tái)在所有八個(gè)熱門(mén)工作負(fù)載中都創(chuàng)下了記錄。

圖示:在新一輪的測(cè)試中,NVIDIA AI 訓(xùn)練所有模型的速度都快于替代方案

NVIDIA A100 Tensor Core GPU 提供了最出色每芯片性能, Selene 是NVIDIA內(nèi)部基于模塊化NVIDIA DGX SuperPOD架構(gòu)構(gòu)建的AI超級(jí)計(jì)算機(jī),借助NVIDIA InfiniBand網(wǎng)絡(luò)和NVIDIA軟件棧進(jìn)行擴(kuò)展,A100在Selene上實(shí)現(xiàn)了最快的AI訓(xùn)練速度 。

圖示:NVIDIA A100 GPU 在所有八項(xiàng) MLPerf 1.1 測(cè)試中均實(shí)現(xiàn)最好的每芯片訓(xùn)練性能

云服務(wù)更上一層樓

根據(jù)最新結(jié)果,在訓(xùn)練 AI 模型方面,Azure 的 NDm A100 v4 實(shí)例的速度遙遙領(lǐng)先。它運(yùn)行了新一輪的每項(xiàng)測(cè)試,擴(kuò)展到多達(dá) 2,048 個(gè) A100 GPU。

Azure 不僅展示了出色性能,而且在美國(guó)的六個(gè)地區(qū),現(xiàn)在所有人都可以租借和使用其出色性能。

AI 訓(xùn)練是一項(xiàng)需要大量投入的大型工作。NVIDIA希望用戶借助他們選擇的服務(wù)或系統(tǒng)以創(chuàng)紀(jì)錄的速度訓(xùn)練模型。

因此,NVIDIA將 NVIDIA AI 與面向云服務(wù)、主機(jī)托管服務(wù)、企業(yè)和科學(xué)計(jì)算中心產(chǎn)品相結(jié)合。

服務(wù)器制造商各顯身手

在OEM 中,浪潮憑借其八路GPU服務(wù)器NF5688M6 和NF5488A5液冷服務(wù)器在單節(jié)點(diǎn)性能方面創(chuàng)下了最多記錄。戴爾和 Supermicro 在四路 A100 GPU 系統(tǒng)上創(chuàng)下了記錄。

共有 10 家 NVIDIA 合作伙伴提交了本輪測(cè)試結(jié)果,其中包含 8 家 OEM 和 2 家云服務(wù)提供商。它們占所有提交的 90% 以上。

這是 NVIDIA 生態(tài)系統(tǒng)在 MLPerf 訓(xùn)練測(cè)試中的第五次亮相,也是到目前為止最出色的亮相。

NVIDIA的合作伙伴之所以積極參與,是因?yàn)樗麄冎?MLPerf 是唯一符合行業(yè)標(biāo)準(zhǔn)、經(jīng)過(guò)同行評(píng)審的 AI 訓(xùn)練和推理基準(zhǔn)測(cè)試。對(duì)于評(píng)估 AI 平臺(tái)和供應(yīng)商的客戶來(lái)說(shuō),這是一個(gè)有價(jià)值的工具。

為速度認(rèn)證的服務(wù)器

百度 PaddlePaddle、戴爾科技、富士通、技嘉科技、慧與、浪潮、聯(lián)想和 Supermicro 提交了基于本地?cái)?shù)據(jù)中心的結(jié)果(單節(jié)點(diǎn)和多節(jié)點(diǎn)任務(wù))。

NVIDIA幾乎所有的 OEM 合作伙伴都在 NVIDIA 認(rèn)證系統(tǒng)上運(yùn)行了測(cè)試,NVIDIA為需要加速計(jì)算的企業(yè)客戶驗(yàn)證了服務(wù)器。

提交的范圍展示了 NVIDIA 平臺(tái)的廣度和成熟度,該平臺(tái)為各種規(guī)模的企業(yè)提供最佳的解決方案。

既快速又靈活

NVIDIA AI 是唯一用于提交所有基準(zhǔn)測(cè)試和用例的平臺(tái)參與者,這展示了其通用性和高性能??焖凫`活的系統(tǒng)提供客戶所需的生產(chǎn)力,以加快他們的工作速度。

AI訓(xùn)練基準(zhǔn)測(cè)試涵蓋當(dāng)今最熱門(mén)的八個(gè) AI 工作負(fù)載和場(chǎng)景,例如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、推薦系統(tǒng)、增強(qiáng)學(xué)習(xí)等。

MLPerf 測(cè)試透明、客觀,因此用戶可以依靠結(jié)果做出明智的購(gòu)買(mǎi)決策。該行業(yè)基準(zhǔn)測(cè)試組織成立于 2018 年 5 月,得到阿里巴巴、ARM、Google、Intel 和 NVIDIA 等數(shù)十家行業(yè)領(lǐng)先公司的支持。

三年內(nèi)加速 20 倍

回顧過(guò)去,數(shù)據(jù)顯示,僅在過(guò)去 18 個(gè)月,NVIDIA A100 GPU 的性能就提升了 5 倍以上。這要?dú)w功于軟件的持續(xù)創(chuàng)新,這也是NVIDIA目前工作的重心。

自從三年前 MLPerf 測(cè)試首次亮相,NVIDIA 的性能提高了 20 倍以上。這種大規(guī)模加速源于NVIDIA在全棧 GPU、網(wǎng)絡(luò)、系統(tǒng)和軟件方面取得的進(jìn)步。

圖示:NVIDIA AI 在三年內(nèi)實(shí)現(xiàn)了 20 倍以上的改進(jìn)

持續(xù)改進(jìn)軟件

NVIDIA的新進(jìn)展來(lái)自多項(xiàng)軟件改進(jìn)。

例如,借助一類(lèi)新的內(nèi)存復(fù)制操作,NVIDIA在針對(duì)醫(yī)學(xué)成像的 3D-UNet 基準(zhǔn)測(cè)試中實(shí)現(xiàn) 2.5 倍的操作加速。

得益于微調(diào) GPU 以進(jìn)行并行處理的方式,NVIDIA在針對(duì)物體檢測(cè)的 Mask R-CNN 測(cè)試中實(shí)現(xiàn) 10% 的速度提升,而在針對(duì)推薦系統(tǒng)的測(cè)試中實(shí)現(xiàn)了 27% 的提升。NVIDIA只是重疊了獨(dú)立操作,這種技術(shù)尤其適合跨多個(gè) GPU 運(yùn)行的作業(yè)。

NVIDIA擴(kuò)展了 CUDA 圖形的使用范圍,盡可能減少與主機(jī) CPU通信。得益于此,NVIDIA在針對(duì)圖像分類(lèi)的 ResNet-50 基準(zhǔn)測(cè)試中實(shí)現(xiàn)了 6% 的性能提升。

NVIDIA在NCCL 上實(shí)施了兩種新技術(shù)。NCCL 是NVIDIA的庫(kù),用于優(yōu)化 GPU 之間的通信。對(duì)于 BERT 等大型語(yǔ)言模型,這樣可以將結(jié)果加速高達(dá) 5%。

利用NVIDIA的工作結(jié)果

NVIDIA使用的所有軟件均在 MLPerf 倉(cāng)庫(kù)提供,因此每個(gè)人都可以獲得NVIDIA的出色結(jié)果。NVIDIA不斷將這些優(yōu)化整合到 NGC(NVIDIA的 GPU 應(yīng)用程序軟件中心)上的容器。

它是全棧平臺(tái)的一部分,已在新的行業(yè)基準(zhǔn)測(cè)試中得到驗(yàn)證,可從各種合作伙伴處獲得,能夠處理當(dāng)今真正的 AI 作業(yè)。

原文標(biāo)題:MLPerf | 云服務(wù)、OEM 借助 NVIDIA AI 讓 AI 訓(xùn)練更上層樓

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4986

    瀏覽量

    103066
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9160

    瀏覽量

    85425
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4778

    瀏覽量

    72129

原文標(biāo)題:MLPerf | 云服務(wù)、OEM 借助 NVIDIA AI 讓 AI 訓(xùn)練更上層樓

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPU加速服務(wù)器怎么用的

    GPU加速服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,GPU
    的頭像 發(fā)表于 12-26 11:58 ?47次閱讀

    服務(wù)器 Flexus X 實(shí)例 MySQL 應(yīng)用加速測(cè)試

    文章目錄 目錄 文章目錄 ? 購(gòu)買(mǎi)配置 ? 基本配置參考如下: ? 連接服務(wù)器 ? 查詢MySQL狀態(tài) ? 啟動(dòng)MySQL ? 添加配置 ? 添加密碼并修改權(quán)限 ? 性能測(cè)試 ? C#插入數(shù)據(jù)測(cè)試
    的頭像 發(fā)表于 12-24 12:19 ?125次閱讀
    云<b class='flag-5'>服務(wù)器</b> Flexus X 實(shí)例 MySQL 應(yīng)用<b class='flag-5'>加速</b><b class='flag-5'>測(cè)試</b>

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過(guò)加速對(duì)話框啟用,打開(kāi)求解對(duì)話框,點(diǎn)擊“
    發(fā)表于 12-16 14:25

    NVIDIA加速計(jì)算如何推動(dòng)醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺(tái)副總裁 Bob Pette 在 AI Summit 一場(chǎng)演講中重點(diǎn)談?wù)摿?NVIDIA 加速計(jì)算如何推動(dòng)醫(yī)療健康
    的頭像 發(fā)表于 11-20 09:10 ?296次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?304次閱讀

    如何測(cè)試SMTP服務(wù)器功能

    在開(kāi)始測(cè)試SMTP服務(wù)器功能之前,了解其重要性是關(guān)鍵。SMTP服務(wù)器是電子郵件系統(tǒng)的核心,負(fù)責(zé)郵件的發(fā)送和接收。如果SMTP服務(wù)器出現(xiàn)問(wèn)題,可能會(huì)導(dǎo)致郵件延遲、丟失或無(wú)法發(fā)送,影響
    的頭像 發(fā)表于 10-30 17:31 ?686次閱讀

    SEO使用站群服務(wù)器租用需要考慮哪些?

    在SEO(搜索引擎優(yōu)化)的背景下,站群服務(wù)器是一種運(yùn)行多個(gè)網(wǎng)站的特殊服務(wù)器,每個(gè)網(wǎng)站共享同一個(gè)IP地址,但也可擁有獨(dú)立IP。下面將詳細(xì)探討SEO使用站群服務(wù)器租用
    的頭像 發(fā)表于 08-26 13:23 ?176次閱讀

    企業(yè)單位為什么需要NTP網(wǎng)絡(luò)時(shí)間服務(wù)器

    1、企業(yè)使用NTP網(wǎng)絡(luò)時(shí)間服務(wù)器是為了獲得精確的時(shí)間 企業(yè)使用NTP網(wǎng)絡(luò)時(shí)間服務(wù)器是為了確保其計(jì)算機(jī)網(wǎng)絡(luò)中的所有設(shè)備都具有精確的時(shí)間。NTP
    的頭像 發(fā)表于 07-10 14:33 ?318次閱讀
    <b class='flag-5'>企業(yè)</b>單位為什么<b class='flag-5'>需要</b>NTP網(wǎng)絡(luò)時(shí)間<b class='flag-5'>服務(wù)器</b>?

    如何同時(shí)在ESP8266上運(yùn)行TCP客戶端和TCP服務(wù)

    客戶端無(wú)法連接到 TCP 服務(wù)器。如果不將 TCP 客戶端從 ESP 連接到云服務(wù)器,則 ESP 上的 TCP 服務(wù)器可以很好地接受 TC
    發(fā)表于 07-08 08:26

    接口測(cè)試怎么測(cè)多個(gè)服務(wù)器連接

    接口測(cè)試是軟件開(kāi)發(fā)過(guò)程中的一個(gè)重要環(huán)節(jié),用于驗(yàn)證系統(tǒng)組件之間的交互是否符合預(yù)期。在多服務(wù)器環(huán)境中,接口測(cè)試的復(fù)雜性會(huì)增加,因?yàn)?b class='flag-5'>需要考慮服務(wù)器
    的頭像 發(fā)表于 05-30 15:16 ?420次閱讀

    華為云函數(shù)工作流:引領(lǐng)未來(lái)無(wú)服務(wù)器計(jì)算時(shí)代

    在當(dāng)今數(shù)字化飛速發(fā)展的時(shí)代,企業(yè)和個(gè)人對(duì)于計(jì)算資源的需求越來(lái)越高,但傳統(tǒng)的服務(wù)器架構(gòu)帶來(lái)的管理成本和資源浪費(fèi)問(wèn)題也愈發(fā)凸顯。解決這一難題,華為云引領(lǐng)著無(wú)
    的頭像 發(fā)表于 05-27 10:50 ?362次閱讀
    華為云函數(shù)工作流:引領(lǐng)未來(lái)無(wú)<b class='flag-5'>服務(wù)器</b><b class='flag-5'>計(jì)算</b>時(shí)代

    企業(yè)在選擇大帶寬服務(wù)器時(shí)需要考慮哪些其他因素?

    企業(yè)在選擇大帶寬服務(wù)器時(shí),除了成本因素,還需要考慮哪些因素,rak部落小編為您整理發(fā)布企業(yè)在選擇大帶寬服務(wù)器時(shí)
    的頭像 發(fā)表于 04-12 10:31 ?360次閱讀

    站群服務(wù)器需要多大內(nèi)存

    站群服務(wù)器的內(nèi)存需求取決于網(wǎng)站的數(shù)量和流量,以及服務(wù)器需要運(yùn)行的應(yīng)用和服務(wù)。RAKsmart小編為您整理發(fā)布站群
    的頭像 發(fā)表于 03-04 09:48 ?409次閱讀

    使用NVIDIA Triton推理服務(wù)器來(lái)加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺(jué)和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來(lái)加速 AI
    的頭像 發(fā)表于 02-29 14:04 ?585次閱讀

    linux服務(wù)器和windows服務(wù)器

    應(yīng)用和企業(yè)環(huán)境中使用,那么Win dows服務(wù)器可能更適合你的需求。 綜上所述,Linux服務(wù)器和Windows服務(wù)器各有優(yōu)劣,選擇適合自己需求的
    發(fā)表于 02-22 15:46