0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 在 MLPerf 測試中將推理帶到新高度

NVIDIA英偉達 ? 來源:未知 ? 2023-04-08 00:30 ? 次閱讀

最新 MLPerf 基準測試中,NVIDIA H100 和 L4 GPU 將生成式 AI 和所有其他工作負載帶到了新的水平,Jetson AGX Orin 則在性能和效率方面都有所提升。

作為獨立的第三方基準測試,MLPerf 仍是衡量 AI 性能的權威標準。自 MLPerf 誕生以來,NVIDIA 的 AI 平臺在訓練和推理這兩個方面一直展現(xiàn)出領先優(yōu)勢,包括最新發(fā)布的 MLPerf Inference 3.0 基準測試。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“三年前我們推出 A100 時,AI 世界由計算機視覺主導。如今,生成式 AI 已經(jīng)到來?!?/p>

“這正是我們打造 Hopper 的原因,其通過 Transformer 引擎專為 GPT 進行了優(yōu)化。最新的 MLPerf 3.0 凸顯了 Hopper 的性能比 A100 高出 4 倍。”

“下一階段的生成式 AI 需要高能效的新的 AI 基礎設施來訓練大型語言模型??蛻粽诖笠?guī)模采用 Hopper,以構建由數(shù)萬顆通過 NVIDIA NVLink 和 InfiniBand 連接的 Hopper GPU 組成的 AI 基礎設施?!?/p>

“業(yè)界正努力推動安全、可信的生成式 AI 取得新的進展。而 Hopper 正在推動這項重要的工作?!?/p>

最新 MLPerf 結果顯示,NVIDIA 將從云到邊緣的 AI 推理性能和效率帶到了一個新的水平。

具體而言,在 DGX H100 系統(tǒng)中運行的 NVIDIA H100 Tensor Core GPU 在每項 AI 推理測試(即在生產(chǎn)中運行神經(jīng)網(wǎng)絡)中均展現(xiàn)出最高的性能。得益于軟件優(yōu)化,該 GPU 在 9 月首次亮相時就實現(xiàn)了高達 54%的性能提升。

針對醫(yī)療領域,H100 GPU 在 3D-UNet(MLPerf 醫(yī)學影像基準測試)中的性能相比 9 月提高了 31%。

06856d9a-d561-11ed-bfe3-dac502259ad0.jpg

在 Transformer 引擎的加持下,基于 Hopper 架構的 H100 GPU 在 BERT 上的表現(xiàn)十分優(yōu)異。BERT 是一個基于 transformer 的大型語言模型,它為如今已經(jīng)得到廣泛應用的生成式 AI 奠定了基礎。

生成式 AI 使用戶可以快速創(chuàng)建文本、圖像、3D 模型等。從初創(chuàng)公司到云服務提供商,企業(yè)都在迅速采用這一能力,以實現(xiàn)新的業(yè)務模式和加速現(xiàn)有業(yè)務。

數(shù)億人現(xiàn)在正在使用 ChatGPT(同樣是一個 transformer 模型)等生成式 AI 工具,以期得到即時響應。

在這個 AI 的 iPhone 時刻,推理性能至關重要。深度學習的部署幾乎無處不在,這推動了從工廠車間到在線推薦系統(tǒng)等對推理性能的無盡需求。

L4 GPU 精彩亮相

NVIDIA L4 Tensor Core GPU 在本次 MLPerf 測試中首次亮相,其速度是上一代 T4 GPU 的 3 倍以上。這些加速器具有扁平的外形,可在幾乎所有的服務器中提供高吞吐量和低延遲。

L4 GPU 運行了所有 MLPerf 工作負載。憑借對關鍵的 FP8 格式的支持,其在對性能要求很高的 BERT 模型上取得了非常驚人的結果。

除了出色的 AI 性能外,L4 GPU 的圖像解碼速度快了 10 倍,視頻處理速度快了 3.2 倍,同時圖形和實時渲染性能提高了 4 倍以上。

這些加速器兩周前在 GTC 上發(fā)布并已通過各大系統(tǒng)制造商和云服務提供商提供。L4 GPU 是 NVIDIA 在 GTC 上發(fā)布的 AI 推理平臺產(chǎn)品組合中的最新成員。

069b91ce-d561-11ed-bfe3-dac502259ad0.jpg ?

軟件和網(wǎng)絡在系統(tǒng)測試中大放異彩

NVIDIA 的全棧式 AI 平臺在一項全新 MLPerf 測試中展現(xiàn)了其領先優(yōu)勢。

被稱之為 Network-division 的基準測試將數(shù)據(jù)傳輸至一個遠程推理服務器。它反映了企業(yè)用戶將數(shù)據(jù)存儲在企業(yè)防火墻后面、在云上運行 AI 作業(yè)的熱門場景。

在 BERT 測試中,遠程 NVIDIA DGX A100 系統(tǒng)提供高達 96%的最大本地性能,其性能下降的原因之一是因為它們需要等待 CPU 完成部分任務。在單純依靠 GPU 進行處理的 ResNet-50 計算機視覺測試中,它們達到了 100%的性能。

這兩個結果在很大程度上要歸功于 NVIDIA Quantum InfiniBand 網(wǎng)絡、NVIDIA ConnectX SmartNIC 以及 NVIDIA GPUDirect 等軟件。

Orin 在邊緣的性能提升 3.2 倍

另外,相較于一年前的結果,NVIDIA Jetson AGX Orin 模塊化系統(tǒng)的能效提高了 63%,性能提高了 81%。Jetson AGX Orin 可在需要 AI 的狹小空間內以低功率進行推理,包括在由電池供電的系統(tǒng)上。

專為需要更小模塊、更低功耗的應用而開發(fā)的 Jetson Orin NX 16G 在本次基準測試中首次亮相便大放異彩。其性能是上一代 Jetson Xavier NX 處理器的 3.2 倍。

廣泛的 NVIDIA AI 生態(tài)

MLPerf 結果顯示,NVIDIA AI 得到了業(yè)內最廣泛的機器學習生態(tài)系統(tǒng)的支持。

在這一輪測試中,有十家公司在 NVIDIA 平臺上提交了結果,包括華碩、戴爾科技、技嘉、新華三、聯(lián)想、寧暢、超微和超聚變等系統(tǒng)制造商和微軟 Azure 云服務。

他們所提交的結果表明,無論是在云端還是在自己的數(shù)據(jù)中心運行的服務器中,用戶都可以通過 NVIDIA AI 獲得出色的性能。

NVIDIA 的眾多合作伙伴也參與了 MLPerf,因為他們知道這是一個幫助客戶評估 AI 平臺和廠商的很有價值的工具。最新一輪結果表明,他們今天所提供的性能將隨著 NVIDIA 平臺的發(fā)展而不斷提升。

用戶需要的是“多面手”

NVIDIA AI 是唯一能夠在數(shù)據(jù)中心和邊緣計算中運行所有 MLPerf 推理工作負載和場景的平臺。其全面的性能和效率讓用戶能夠成為真正的贏家。

用戶在實際應用中通常會采用許多不同類型的神經(jīng)網(wǎng)絡,這些網(wǎng)絡往往需要實時提供答案。

例如,一個 AI 應用可能需要先理解用戶的語音請求,對圖像進行分類、提出建議,然后以人聲作為語音來回答用戶。每個步驟都需要用到不同類型的 AI 模型。

MLPerf 基準測試涵蓋了這些以及其他流行的 AI 工作負載,所以這些測試能夠確保 IT 決策者獲得可靠且可以靈活部署的性能。

06b4db66-d561-11ed-bfe3-dac502259ad0.jpg

用戶可以根據(jù) MLPerf 的結果做出明智的購買決定,因為這些測試是透明的、客觀的。該基準測試得到了包括 Arm、百度、Facebook AI、谷歌、哈佛大學、英特爾、微軟、斯坦福大學和多倫多大學在內的廣泛支持。

可以使用的軟件

NVIDIA AI 平臺的軟件層 NVIDIA AI Enterprise 確保用戶能夠從他們的基礎設施投資中獲得最佳的性能以及在企業(yè)數(shù)據(jù)中心運行 AI 所需的企業(yè)級支持、安全性和可靠性。

這些測試所使用的所有軟件都可以從 MLPerf 庫中獲得,因此任何人都可以獲得這些領先的結果。

各項優(yōu)化措施不斷地被整合到 NGC(NVIDIA 的 GPU 加速軟件目錄)上的容器中。本輪測試中提交的每項工作均使用了該目錄中的 NVIDIA TensorRT 優(yōu)化 AI 推理性能。

掃描海報二維碼,或點擊“閱讀原文”,即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!


原文標題:NVIDIA 在 MLPerf 測試中將推理帶到新高度

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3778

    瀏覽量

    91157

原文標題:NVIDIA 在 MLPerf 測試中將推理帶到新高度

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA DRIVE技術推動自動駕駛發(fā)展

    隨著 AI 技術的飛速發(fā)展,汽車行業(yè)正經(jīng)歷一場深刻而全面的智能化轉型。以 NVIDIA DRIVE 技術為核心,NVIDIA 正在推動著自動駕駛技術不斷邁向新高度。2025 年,AI 將在汽車行業(yè)中
    的頭像 發(fā)表于 12-29 16:02 ?301次閱讀

    解鎖光伏發(fā)電新高度:探秘 400V 轉 660V 升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘 400V 轉 660V 升壓變壓器核心力量 追求綠色能源變革的征程中,光伏發(fā)電已然成為耀眼的明星,而 400V 轉 660V 升壓變壓器則是隱藏在幕后、默默發(fā)力的關鍵
    的頭像 發(fā)表于 12-27 10:27 ?106次閱讀
    解鎖光伏發(fā)電<b class='flag-5'>新高度</b>:探秘 400V 轉 660V 升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘400V轉660V升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘400V轉660V升壓變壓器核心力量 光伏發(fā)電作為綠色能源的重要組成部分,全球能源結構中扮演著越來越重要的角色。400V轉660V升壓變壓器,作為光伏發(fā)電系統(tǒng)中的關鍵設備
    的頭像 發(fā)表于 12-13 13:51 ?119次閱讀
    解鎖光伏發(fā)電<b class='flag-5'>新高度</b>:探秘400V轉660V升壓變壓器核心力量

    智能數(shù)顯,掌控壓力新高度

    行業(yè)資訊
    shchuanganqi
    發(fā)布于 :2024年11月18日 10:03:34

    BOE(京東方)全新一代發(fā)光器件賦能iQOO 13 全面引領柔性顯示行業(yè)性能新高度

    ,畫面表現(xiàn)、護眼舒適度及性能功耗方面均達到行業(yè)領先水準,并以“直屏超窄邊”的設計為用戶呈現(xiàn)了前所未有的視覺體驗,將直板手機的產(chǎn)品性能推向了全新高度。此次BOE(京東方)攜手vivo旗下iQOO品牌聯(lián)合打造旗艦新品,既體現(xiàn)了以“Powered by BOE”的生態(tài)攜手合作
    的頭像 發(fā)表于 10-31 16:15 ?191次閱讀

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業(yè)和科研機構提供了一套高效、靈活的 AI 訓練與推理加速解決方案。無論是復雜的 AI 開發(fā)任務中,還是
    的頭像 發(fā)表于 10-27 10:03 ?223次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造AI訓練與<b class='flag-5'>推理</b>加速解決方案

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    眾,3D-UNet和CosmoFlow兩個模型共計八項測試中,斬獲五項冠軍。 MLPerf? Storage v1.0 AI存儲基準測試成績 ML
    的頭像 發(fā)表于 09-28 16:46 ?219次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準<b class='flag-5'>測試</b>五項性能全球第一

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?712次閱讀

    激光雷達-定義未來感知的新高度

    保護裝置
    jf_18500570
    發(fā)布于 :2024年06月22日 10:21:14

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?684次閱讀

    ZR執(zhí)行器:智能制造的得力干將,提升生產(chǎn)新高度

    ZR執(zhí)行器:智能制造的得力干將,提升生產(chǎn)新高度 ZR執(zhí)行器以其精準的控制能力和高效的執(zhí)行效率,智能制造領域發(fā)揮了重要作用。傳統(tǒng)的執(zhí)行器往往存在控制不精確、反應速度慢等問題,難以滿足現(xiàn)代生產(chǎn)對于高效
    的頭像 發(fā)表于 05-10 11:15 ?574次閱讀

    解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

    LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強大的功能,但通過 OpenVINO? 的優(yōu)化和推理加速,可以對這些復雜模型的執(zhí)行進行精煉,實現(xiàn)更快、更高效的處理,減少計算開銷并最大限度發(fā)揮硬件潛力,這將直接導致 LLM 實現(xiàn)更高的吞吐量和更低的延遲。
    的頭像 發(fā)表于 05-10 10:36 ?534次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱
    的頭像 發(fā)表于 04-20 09:39 ?734次閱讀

    使用NVIDIA Triton推理服務器來加速AI預測

    這家云計算巨頭的計算機視覺和數(shù)據(jù)科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。
    的頭像 發(fā)表于 02-29 14:04 ?587次閱讀

    eVTOL市場動力需求“抬頭” 電池企業(yè)集中加碼

    高比能、高倍率、高安全等方面性能上,eVTOL的“既要又要”上了新高度。
    的頭像 發(fā)表于 02-20 09:32 ?898次閱讀