0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS加速器v21.08的功能應(yīng)用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Eric Rife ? 2022-04-20 14:58 ? 次閱讀

介紹

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )現(xiàn)已發(fā)布。自 NVIDIA GTC 2020 首次發(fā)布以來,已經(jīng)有很長(zhǎng)時(shí)間了。我們?cè)谠S多方面都有所改進(jìn),特別是在易用性方面, Apache Spark 應(yīng)用程序的代碼更改很少甚至沒有。去年,該團(tuán)隊(duì)一直專注于添加功能和持續(xù)改進(jìn)性能。為了證明這一點(diǎn),我們使用 NVIDIA 數(shù)據(jù)科學(xué)( NDS )基準(zhǔn)測(cè)試了定期測(cè)量在 3000 ( 3 TB 未壓縮)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我們非常自豪地在提高所有通過查詢的端到端速度和降低 NVIDIA EGX 服務(wù)器的總體擁有成本方面取得了進(jìn)展。

基準(zhǔn)更新

NVIDIA 決策支持( NDS )是我們對(duì) Apache Spark 社區(qū)常用的行業(yè)標(biāo)準(zhǔn)數(shù)據(jù)科學(xué)基準(zhǔn)的改編。 NDS 包含與行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試 TPC-DS 相同的 105 個(gè) SQL 查詢,但修改了數(shù)據(jù)集生成和執(zhí)行腳本的部分。在 GTC 2021 更新中,有 95 個(gè)查詢通過。在 21.08 版本中,通過核心外分組方式、窗口排名和密集排名等新功能,我們已經(jīng)能夠在 GPU 上運(yùn)行所有 105 個(gè)查詢。

基準(zhǔn)設(shè)置

比例因子 -3K (帶浮點(diǎn)數(shù)的 3TB 數(shù)據(jù)集)

Systems: 4x NVIDIA 認(rèn)證 EGX 服務(wù)器

EGX 服務(wù)器硬件規(guī)格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件規(guī)格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

軟件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

圖 1 : EGX 服務(wù)器上的 NDS 查詢速度: GPU vs CPU 。

基于此版本,我們很高興地向大家展示,所有 105 個(gè)查詢現(xiàn)在都可以在 GPU 上運(yùn)行,而無需任何代碼更改。

用于這些基準(zhǔn)測(cè)試的基準(zhǔn)服務(wù)器對(duì)于四臺(tái)沒有 GPU s 的服務(wù)器的成本略低于 170000 美元,而在每臺(tái)服務(wù)器中包含一臺(tái) NVIDIA A100 GPU 的成本則低于 220000 美元。

簡(jiǎn)單來說,基準(zhǔn) GPU 服務(wù)器的成本是 CPU 服務(wù)器的 1.29 倍。

如上圖所示(圖 1 ),超過 95 個(gè)查詢現(xiàn)在比 GPU 快 1.29 倍,因此運(yùn)行起來更便宜。

GPU 上一些速度較慢的查詢目前正在解決中,我們正在不懈地努力改進(jìn)這些查詢并提高總體速度。

用戶可以很容易地推斷出 GPU 的加速從 1x 到 18x 不等,因此建議用戶確認(rèn) GPU 的正確用例。

如果用戶不確定 GPU 的正確用例,鑒定工具將是一個(gè)方便的資產(chǎn)。有關(guān)鑒定工具的更多信息,請(qǐng)參閱以下章節(jié)。

分析和鑒定工具

分析與鑒定工具于 21.06 發(fā)布,獲得了用戶社區(qū)的積極反饋以及對(duì)新功能的要求。在 21.08 中,鑒定工具現(xiàn)在能夠處理 Apache Spark 2.x 版本生成的事件日志。該工具還將支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 運(yùn)行時(shí)生成的事件日志。鑒定工具不再需要 Spark 運(yùn)行時(shí)。用戶現(xiàn)在只需在機(jī)器上使用 Apache Spark 3.x JAR 即可使用鑒定工具。最新版本還具有選擇事件日志的新過濾功能。該工具還查找插件不支持的讀取數(shù)據(jù)格式和類型,并從分?jǐn)?shù)中刪除這些格式和類型(基于 SQL Dataframe 操作中的總?cè)蝿?wù)時(shí)間)。輸出將以簡(jiǎn)潔的格式報(bào)告在終端上,對(duì)每個(gè)已處理事件日志的詳細(xì)分析將存儲(chǔ)為 csv 輸出。

新功能

此版本為數(shù)組和結(jié)構(gòu)添加了更多功能。我們現(xiàn)在可以對(duì)多層結(jié)構(gòu)數(shù)據(jù)類型進(jìn)行聯(lián)合,也可以以拼花格式編寫數(shù)組數(shù)據(jù)類型。我們?cè)诂F(xiàn)有的超前、滯后和行號(hào)功能中添加了秩和密集秩窗口功能。有了這一新增功能, RAPIDS 加速器現(xiàn)在可以支持 SQL 中最常用的窗口運(yùn)算符。對(duì)于時(shí)間戳操作符,我們添加了對(duì)遺留時(shí)間戳的支持。使用此功能,用戶可以讀取 Spark 2.0 中支持的傳統(tǒng)時(shí)間戳格式。對(duì)于 Databricks 用戶,我們添加了在 GPU 中緩存數(shù)據(jù)的功能(所有其他平臺(tái)都支持這種功能)。

我們通過處理 GPU 內(nèi)存溢出的數(shù)據(jù)集以進(jìn)行分組和窗口操作,繼續(xù)改善用戶體驗(yàn)。這一改進(jìn)將節(jié)省用戶創(chuàng)建分區(qū)的時(shí)間,以避免 GPU 上出現(xiàn)內(nèi)存不足錯(cuò)誤。類似地, UCX 1.11 的采用改進(jìn)了 RAPIDS Spark 加速洗牌管理器的錯(cuò)誤處理。

關(guān)于作者

Eric Rife 是 NVDIA 數(shù)據(jù)科學(xué)公司的技術(shù)營銷經(jīng)理。他是一名高級(jí)專業(yè)人員,擁有 25 年的管理和工程經(jīng)驗(yàn),設(shè)計(jì)和管理全天候關(guān)鍵任務(wù)企業(yè)系統(tǒng),包括 Unix / Linux / Windows 服務(wù)器、應(yīng)用程序服務(wù)器和多 PB 存儲(chǔ)解決方案。他目前領(lǐng)導(dǎo) NVIDIA 的工作,幫助基礎(chǔ)設(shè)施經(jīng)理和數(shù)據(jù)科學(xué)家重新思考如何加快 AI 在企業(yè)業(yè)務(wù)應(yīng)用中的應(yīng)用。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9267

    瀏覽量

    85798
  • WINDOWS
    +關(guān)注

    關(guān)注

    4

    文章

    3555

    瀏覽量

    89049
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺(tái),F(xiàn)inCatch 實(shí)現(xiàn)了投資研究流程的全面智能化,提升數(shù)據(jù)分析速度和準(zhǔn)確性,幫助投資者快速獲取可操作的投資洞察。
    的頭像 發(fā)表于 01-07 09:23 ?200次閱讀

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一臺(tái)機(jī)器上就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。
    的頭像 發(fā)表于 11-20 10:03 ?268次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計(jì)算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?253次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    AMD Alveo V80計(jì)算加速器網(wǎng)絡(luò)研討會(huì)

    歡迎參加本次網(wǎng)絡(luò)研討會(huì),我們將深入探討 AMD Alveo V80 計(jì)算加速器如何幫助您處理高性能計(jì)算、數(shù)據(jù)分析、金融科技、網(wǎng)絡(luò)安全、存儲(chǔ)加速、AI 計(jì)算等領(lǐng)域的內(nèi)存密集型工作負(fù)載。Alveo
    的頭像 發(fā)表于 11-08 09:35 ?240次閱讀

    貿(mào)澤開售適用于高性能計(jì)算應(yīng)用的AMD Alveo V80加速器

    2024 年 9 月 25 日 – 專注于引入新品的全球電子元器件和工業(yè)自動(dòng)化產(chǎn)品授權(quán)代理商貿(mào)澤電子 (Mouser Electronics) 即日起供應(yīng)AMD的Alveo? V80計(jì)算加速器卡。該
    發(fā)表于 09-27 14:59 ?186次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    會(huì)(ESHG)上發(fā)布,其加入了新的體細(xì)胞數(shù)據(jù)變異檢測(cè)功能,并將業(yè)內(nèi)領(lǐng)先的工具升級(jí)到最新版本。這個(gè)版本是繼在 NVIDIA GTC 2024 大會(huì)上發(fā)布 Parabricks v4.3 之后推出的新版本。
    的頭像 發(fā)表于 09-10 10:22 ?417次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫,是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?503次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺(tái)提升計(jì)算性能

    利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換

    電子發(fā)燒友網(wǎng)站提供《利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換.pdf》資料免費(fèi)下載
    發(fā)表于 09-02 11:58 ?1次下載
    利用邊沿速率<b class='flag-5'>加速器</b>和自動(dòng)感應(yīng)電平轉(zhuǎn)換<b class='flag-5'>器</b>

    什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?

    神經(jīng)網(wǎng)絡(luò)加速器是一種專門設(shè)計(jì)用于提高神經(jīng)網(wǎng)絡(luò)計(jì)算效率的硬件設(shè)備。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和計(jì)算量急劇增加,對(duì)計(jì)算性能的要求也越來越高。傳統(tǒng)的通用處理(CPU
    的頭像 發(fā)表于 07-11 10:40 ?547次閱讀

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的頭像 發(fā)表于 06-21 11:54 ?831次閱讀

    Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的需求。
    的頭像 發(fā)表于 03-22 14:02 ?681次閱讀
    Hitek Systems開發(fā)基于PCIe的高性能<b class='flag-5'>加速器</b>以滿足行業(yè)需求

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預(yù)計(jì)會(huì)在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1411次閱讀
    <b class='flag-5'>NVIDIA</b>將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU<b class='flag-5'>加速器</b>“B100”

    家居智能化,推動(dòng)AI加速器的發(fā)展

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理。在智能家居中,AI加速
    的頭像 發(fā)表于 02-23 00:18 ?4632次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)中的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。 一、回旋
    的頭像 發(fā)表于 01-30 10:02 ?4477次閱讀