0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學(xué)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-01-24 09:26 ? 次閱讀

隨著 AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練各種模型是充分發(fā)揮 AI 應(yīng)用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學(xué)家們面臨著日益增長(zhǎng)的工作負(fù)載需求,迫切需求尋找高效趁手的工具以應(yīng)對(duì)挑戰(zhàn)。

Pandas 是一個(gè)靈活而強(qiáng)大的 Python 數(shù)據(jù)分析和處理庫(kù),由于其是一款非常易于使用的 API,成為了數(shù)據(jù)科學(xué)家的首選。然而,隨著數(shù)據(jù)集大小的增長(zhǎng),Pandas 在純 CPU 系統(tǒng)中的處理速度和效率方面就會(huì)遇到困難。

對(duì)于面向數(shù)據(jù)分析工作的 DataFrame 軟件庫(kù),除了 Pandas,目前還有一顆冉冉上升的開源新星——Polars。相比于主要依賴單線程執(zhí)行的 Pandas,Polars 在處理大數(shù)據(jù)集時(shí)的速度通常比其快 5 到 10 倍。

盡管 Pandas 和 Polars 在數(shù)據(jù)處理領(lǐng)域各有所長(zhǎng),但是處理超大數(shù)據(jù)集不僅需要極致發(fā)揮 CPU 的能力,也需要 GPU 發(fā)揮作用。在這一背景下,NVIDIA 發(fā)布了 RAPIDS cuDF 庫(kù),用于加載、連接、聚合、過(guò)濾和以其他方式操作數(shù)據(jù),充分利用了 GPU 大規(guī)模并行處理能力的優(yōu)勢(shì)。

RAPIDS 是一套開源的 GPU 加速 Python 程序庫(kù),旨在改進(jìn)數(shù)據(jù)科學(xué)和分析工作流。RAPIDS cuDF 是一個(gè) GPU DataFrame 程序庫(kù),其提供了一個(gè)類似 Pandas 的 API,用于加載、過(guò)濾和操作數(shù)據(jù)。cuDF 的早期版本只適用于 GPU 開發(fā)工作流程。而 NVIDIA 也在持續(xù)對(duì)這一應(yīng)用進(jìn)行更新。

現(xiàn)在 RAPIDS cuDF 可以為 950 萬(wàn) Pandas 用戶帶來(lái) GPU 加速,而無(wú)需他們更改代碼,根據(jù)數(shù)據(jù)集大小為 5 GB 的分析基準(zhǔn)測(cè)試結(jié)果,處理時(shí)間縮短到原來(lái)的 1/150。而由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎已經(jīng)可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,這意味著僅在一臺(tái)機(jī)器上數(shù)據(jù)科學(xué)家就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。

借助 RAPIDS cuDF,數(shù)據(jù)科學(xué)家現(xiàn)在可以在他們首選的代碼庫(kù)上全速運(yùn)行數(shù)據(jù)處理。此外,隨著數(shù)據(jù)集規(guī)模不斷增長(zhǎng),處理工作占用更多內(nèi)存,在 NVIDIA RTX 加持的 AI 工作站和 PC 上的運(yùn)行也實(shí)現(xiàn)了顯著的速度提升。相比于基于傳統(tǒng) CPU 的解決方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架構(gòu) GPU,可以將性能提升多達(dá) 100 倍。

通過(guò)以下博客了解更多關(guān)于 RAPIDS cuDF 的最新信息,解鎖在 AI 應(yīng)用與解決方案中加速數(shù)據(jù)分析探索的創(chuàng)新靈感。

無(wú)需更改代碼即可將 Pandas 提速近 150 倍

Pandas 是 Python 生態(tài)系統(tǒng)中最流行的 DataFrame 程序庫(kù),但它的速度會(huì)隨著 CPU 上數(shù)據(jù)量的增加而變慢。現(xiàn)在只需一條命令,用戶就可以在無(wú)需更改代碼的情況下,使用 cuDF 將加速計(jì)算引入到其 Pandas 工作流中。根據(jù)數(shù)據(jù)集大小為 5 GB 的分析基準(zhǔn)測(cè)試結(jié)果,處理時(shí)間縮短到原來(lái)的 150 分之一。

點(diǎn)擊閱讀《無(wú)需更改代碼,RAPIDS cuDF 將 Pandas 提速近 150 倍》了解更多 cuDF 將統(tǒng)一的 CPU/GPU 體驗(yàn)引入 Pandas 工作流并為其帶來(lái)頂尖性能的詳細(xì)信息。

RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎

最高提速 13 倍

RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎現(xiàn)已發(fā)布公測(cè)版,為各行各業(yè)的數(shù)據(jù)科學(xué)家和工程師提供了一種適用于中等規(guī)模數(shù)據(jù)處理的強(qiáng)大工具。該引擎最高能夠?qū)?NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不產(chǎn)生分布式系統(tǒng)開銷的情況下,高效處理數(shù)億行規(guī)模的數(shù)據(jù)集。Polars GPU 引擎直接內(nèi)置在 Polars API 中,使所有用戶都能輕松訪問(wèn)。

點(diǎn)擊閱讀《RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎發(fā)布公測(cè)版》了解更多將 NVIDIA 加速計(jì)算引入 Polars 顯著提升加速性能的詳細(xì)介紹。

使用 RAPIDS cuDF 加速預(yù)處理工作流

突破數(shù)據(jù)科學(xué)的瓶頸

隨著 AI 和數(shù)據(jù)科學(xué)的不斷發(fā)展,快速處理和分析大量數(shù)據(jù)集的能力將成為各行業(yè)實(shí)現(xiàn)突破的關(guān)鍵差異化因素。無(wú)論是開發(fā)復(fù)雜的機(jī)器學(xué)習(xí)模型、執(zhí)行復(fù)雜的統(tǒng)計(jì)分析還是探索生成式 AI,RAPIDS cuDF 都可為新一代數(shù)據(jù)處理奠定基礎(chǔ)。

點(diǎn)擊閱讀《解密 AI 如何加速數(shù)據(jù)科學(xué)工作流》了解更多相關(guān)信息,預(yù)見 RTX AI 將如何為未來(lái)的工程師創(chuàng)造無(wú)限可能。

GTC 2025 將于2025 年 3 月 17 至 21 日在美國(guó)加州圣何塞及線上同步舉行。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5075

    瀏覽量

    103598
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4768

    瀏覽量

    129277
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31493

    瀏覽量

    270096
  • 數(shù)據(jù)科學(xué)

    關(guān)注

    0

    文章

    166

    瀏覽量

    10084

原文標(biāo)題:合集詳解 RAPIDS cuDF 如何賦能 AI 加速數(shù)據(jù)科學(xué)

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    借助NVIDIA AI Foundry平臺(tái)推動(dòng)醫(yī)療健康與生命科學(xué)行業(yè)發(fā)展

    借助 NVIDIA AI Foundry,全球領(lǐng)先的臨床研究與商業(yè)服務(wù)提供商 IQVIA 將為其全球生命科學(xué)領(lǐng)域的客戶提供 AI 智能體,助力加速
    的頭像 發(fā)表于 01-17 09:59 ?130次閱讀

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)
    的頭像 發(fā)表于 11-20 10:03 ?294次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計(jì)算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速
    的頭像 發(fā)表于 11-20 09:52 ?288次閱讀
    <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b>將pandas提速近150倍

    使用NVIDIA RAPIDS cuDF加速預(yù)處理工作流

    AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,但要充分發(fā)揮其潛力,必須基于海量的高質(zhì)量數(shù)據(jù)對(duì)各種模型進(jìn)行訓(xùn)練。數(shù)據(jù)科學(xué)家在準(zhǔn)備這類數(shù)據(jù)方面發(fā)揮著關(guān)
    的頭像 發(fā)表于 11-19 15:58 ?268次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b><b class='flag-5'>加速</b>預(yù)處理工作流

    NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

    企業(yè)借助基于 NVIDIA AI Enterprise 與 Omniverse 工業(yè) AI 構(gòu)建的創(chuàng)新中心和服務(wù)加速 AI 轉(zhuǎn)型。
    的頭像 發(fā)表于 11-19 15:45 ?292次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?391次閱讀

    華為云徐峰:AI 應(yīng)用現(xiàn)代化,加速軟件生產(chǎn)力躍升

    2024 年 9 月 19 日,在華為全聯(lián)接大會(huì) 2024 的“AI 應(yīng)用現(xiàn)代化,加速軟件生產(chǎn)力躍升”論壇上,華為云 PaaS 服務(wù)產(chǎn)品部部長(zhǎng)徐峰發(fā)表了主題演講,介紹了未來(lái)應(yīng)用智能
    的頭像 發(fā)表于 10-14 09:45 ?559次閱讀
    華為云徐峰:<b class='flag-5'>AI</b> <b class='flag-5'>賦</b><b class='flag-5'>能</b>應(yīng)用現(xiàn)代化,<b class='flag-5'>加速</b>軟件生產(chǎn)力躍升

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    高效地篩選出具有潛力的藥物候選分子,加速新藥上市的進(jìn)程。在基因測(cè)序與編輯領(lǐng)域,AI技術(shù)將提高基因數(shù)據(jù)的處理速度和準(zhǔn)確性,為個(gè)性化醫(yī)療和精準(zhǔn)醫(yī)療提供有力支持。此外,AI技術(shù)還將推動(dòng)生命
    發(fā)表于 10-14 09:21

    NVIDIA理想汽車共同推進(jìn)智能駕駛和智能座艙技術(shù)創(chuàng)新

    智能化已成為汽車行業(yè)發(fā)展的新引擎,NVIDIA 正在理想汽車共同推進(jìn)智能駕駛和智能座艙技術(shù)創(chuàng)新。 ? 作為中國(guó)新能源汽車制造商和造車新勢(shì)力頭部企業(yè)之一,理想汽車深耕智能駕駛領(lǐng)域。通過(guò)利用
    的頭像 發(fā)表于 07-01 18:21 ?1796次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù),將簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程,加速生成式 AI 的發(fā)展步伐。 NVIDIA
    的頭像 發(fā)表于 06-21 14:39 ?414次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生
    的頭像 發(fā)表于 06-20 17:36 ?770次閱讀

    NVIDIA 通過(guò) Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    美敦力、SETI協(xié)會(huì)以及領(lǐng)先的制造商正在構(gòu)建? NVIDIA IGX 系統(tǒng), 為 ?AI 在工業(yè)邊緣 ? ? COMPUTEX — 2024 年 6 月 2 日 —
    發(fā)表于 06-03 09:48 ?334次閱讀
      <b class='flag-5'>NVIDIA</b> 通過(guò) Holoscan 為 <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和<b class='flag-5'>科學(xué)</b> <b class='flag-5'>AI</b> 應(yīng)用

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報(bào)、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?452次閱讀
    助力<b class='flag-5'>科學(xué)</b>發(fā)展,<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b><b class='flag-5'>加速</b>HPC研究

    利用NVIDIA AI Enterprise IGX在邊緣任務(wù)關(guān)鍵型AI

    NVIDIA SDK 在加速智慧城市、醫(yī)療和機(jī)器人等領(lǐng)域的 AI 應(yīng)用方面發(fā)揮了重要作用。
    的頭像 發(fā)表于 04-26 09:46 ?542次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise IGX在邊緣<b class='flag-5'>賦</b><b class='flag-5'>能</b>任務(wù)關(guān)鍵型<b class='flag-5'>AI</b>

    使用NVIDIA Triton推理服務(wù)器來(lái)加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺(jué)和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來(lái)加速 AI 預(yù)測(cè)。
    的頭像 發(fā)表于 02-29 14:04 ?627次閱讀