0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

將NVIDIA加速計(jì)算引入Polars

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-20 10:03 ? 次閱讀

Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一臺(tái)機(jī)器上就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。

日新月異的數(shù)據(jù)挑戰(zhàn)

Pandas 等傳統(tǒng)數(shù)據(jù)處理庫均為單線程,當(dāng)處理數(shù)據(jù)超過數(shù)百萬行時(shí)就會(huì)顯得“力不從心”。分布式數(shù)據(jù)處理系統(tǒng)雖然可以處理數(shù)十億行數(shù)據(jù),但又會(huì)增加處理中小型數(shù)據(jù)集的復(fù)雜程度和經(jīng)費(fèi)開支。

在高效處理數(shù)千萬至數(shù)億行數(shù)據(jù)的工具之間一直存在著差距。這類工作負(fù)載常見于金融、零售、制造等行業(yè)的模型開發(fā)、需求預(yù)測(cè)和物流中。

在面向數(shù)據(jù)科學(xué)家和工程師Python 庫中,Polars 的增長速度位居前列,其設(shè)計(jì)初衷就是為了應(yīng)對(duì)這些挑戰(zhàn)。該程序庫使用了先進(jìn)的查詢優(yōu)化技術(shù),以減少不必要的數(shù)據(jù)移動(dòng)和處理,使數(shù)據(jù)科學(xué)家可以僅用一臺(tái)機(jī)器就能流暢地處理數(shù)億行規(guī)模的工作負(fù)載。Polars 彌補(bǔ)了單線程解決方案速度過慢和分布式系統(tǒng)會(huì)增加非必要復(fù)雜性的缺陷,提供了一個(gè)極具吸引力的“中等規(guī)?!睌?shù)據(jù)處理解決方案。

將 NVIDIA 加速計(jì)算引入 Polars

與其他僅使用 CPU 的數(shù)據(jù)處理工具相比,Polars 利用多線程執(zhí)行、高級(jí)內(nèi)存優(yōu)化和惰性求值(lazy evaluation)功能,可顯著提升開箱即用的加速性能。

但由于各行各業(yè)的企業(yè)面臨日益增長的數(shù)據(jù)處理需求,例如需要分析數(shù)十億筆金融交易、管理復(fù)雜的庫存系統(tǒng)等,都需要更加強(qiáng)大的性能。這時(shí)就該輪到加速計(jì)算發(fā)揮作用了:

cuDF 是 NVIDIA CUDA-X 加速庫中的 RAPIDS 套件的一部分,它是一個(gè)由 GPU 提供加速的 DataFrame 程序庫,能夠利用 GPU 的大規(guī)模并行處理能力顯著提高數(shù)據(jù)處理性能。

Polars 團(tuán)隊(duì)與 NVIDIA 一起將 cuDF 的速度與 Polars 的效率相結(jié)合,使性能最高提速至在 CPU 上 Polars 的 13 倍。如此,即便用戶的數(shù)據(jù)處理工作量增長到數(shù)億甚至數(shù)十億行數(shù)據(jù),依然能夠保持交互。

9f9cb96c-a016-11ef-93f3-92fbcf53809c.jpg

圖 1.圖中所示的是 PDS-H 基準(zhǔn)測(cè)試 22 個(gè)查詢中加速幅度最大的 4 個(gè)查詢。在運(yùn)行包含眾多復(fù)雜分組和連接操作的查詢時(shí),RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基準(zhǔn)測(cè)試規(guī)模系數(shù) 80 | GPU:NVIDIA H100 | CPU:英特爾 Xeon W9-3495X(Sapphire Rapids) | 存儲(chǔ):本地NVMe。備注:PDS-H 源自 TPC-H,但這些結(jié)果與 TPC-H 的結(jié)果不具有可比性。

由于 Polars GPU 引擎直接內(nèi)置在 Polars Lazy API 中,用戶只需通過 pip 安裝 polars[gpu] 并將 [engine=”gpu”] 發(fā)送至 collect 操作,即可將 GPU 加速應(yīng)用于他們的工作流。在后臺(tái),Polars 會(huì)嘗試首先在 GPU 上執(zhí)行操作,必要時(shí)再返回 CPU。這種方法可確保:

通過使用 Polars 的查詢優(yōu)化器,實(shí)現(xiàn)高效執(zhí)行和最低內(nèi)存使用

用戶無須修改現(xiàn)有 Polars 代碼,即可訪問 GPU 引擎

完全兼容 Polars 不斷發(fā)展的數(shù)據(jù)可視化、I/O 和機(jī)器學(xué)習(xí)庫生態(tài)系統(tǒng)

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

結(jié)語

RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎現(xiàn)已發(fā)布公測(cè)版,為各行各業(yè)的數(shù)據(jù)科學(xué)家和工程師提供了一種適用于中等規(guī)模數(shù)據(jù)處理的強(qiáng)大工具。該引擎最高能夠?qū)?NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不產(chǎn)生分布式系統(tǒng)開銷的情況下,高效處理數(shù)億行規(guī)模的數(shù)據(jù)集。Polars GPU 引擎直接內(nèi)置在 Polars API 中,使所有用戶都能輕松訪問。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5258

    瀏覽量

    105870
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4917

    瀏覽量

    130744
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    366

    瀏覽量

    22909

原文標(biāo)題:RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎發(fā)布公測(cè)版

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion AI 超級(jí)計(jì)算機(jī)的協(xié)議落地
    的頭像 發(fā)表于 06-12 15:49 ?174次閱讀

    高效地?cái)U(kuò)展Polars GPU Parquet讀取器

    在處理大型數(shù)據(jù)集時(shí),數(shù)據(jù)處理工具的性能至關(guān)重要。Polars 作為一個(gè)以速度和效率著稱的開源數(shù)據(jù)處理庫,它提供了由 cuDF 驅(qū)動(dòng)的 GPU 加速后端,能夠顯著提升性能。
    的頭像 發(fā)表于 04-21 17:12 ?245次閱讀
    高效地?cái)U(kuò)展<b class='flag-5'>Polars</b> GPU Parquet讀取器

    NVIDIA助力解決量子計(jì)算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強(qiáng)大的工具,助力解決量子計(jì)算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?499次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速計(jì)算的未來

    越來越多的企業(yè)開始采用加速計(jì)算,從而滿足生成式 AI、5G 電信和主權(quán)云的需求。NVIDIA 推出了 DOCA 平臺(tái)框架(DPF),該框架提供了基礎(chǔ)構(gòu)建模塊來釋放 NVIDIA Blu
    的頭像 發(fā)表于 01-24 09:29 ?618次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)DPU<b class='flag-5'>加速</b>云<b class='flag-5'>計(jì)算</b>的未來

    NVIDIA預(yù)測(cè)2025年AI行業(yè)發(fā)展

    NVIDIA 加速計(jì)算、數(shù)據(jù)科學(xué)和研究領(lǐng)域?qū)<翌A(yù)測(cè),多模態(tài)模型推動(dòng)行業(yè)創(chuàng)新和效率提升。
    的頭像 發(fā)表于 12-18 13:49 ?1083次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    的各個(gè)方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計(jì)算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA GPU:詳細(xì)列出了支持
    發(fā)表于 12-16 14:25

    NVIDIA加速全球大多數(shù)超級(jí)計(jì)算機(jī)推動(dòng)科技進(jìn)步

    HPCwire 讀者和編輯選擇獎(jiǎng)。 自 2006 年發(fā)布 CUDA 以來,NVIDIA 不斷推動(dòng) AI 和加速計(jì)算的進(jìn)步,最新發(fā)布的全球最強(qiáng)超級(jí)計(jì)算機(jī) TOP500 榜單突顯了該公司
    的頭像 發(fā)表于 11-24 14:38 ?632次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多數(shù)超級(jí)<b class='flag-5'>計(jì)算</b>機(jī)推動(dòng)科技進(jìn)步

    NVIDIA發(fā)布cuPyNumeric加速計(jì)算

    加速計(jì)算庫幫助科研人員無縫地?cái)U(kuò)展到強(qiáng)大的計(jì)算集群,并且無需修改 Python 代碼,推進(jìn)科學(xué)發(fā)現(xiàn)。
    的頭像 發(fā)表于 11-21 10:05 ?628次閱讀

    NVIDIA加速計(jì)算如何推動(dòng)醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺(tái)副總裁 Bob Pette 在 AI Summit 一場演講中重點(diǎn)談?wù)摿?NVIDIA 加速計(jì)算如何推動(dòng)醫(yī)療健康、網(wǎng)絡(luò)安全和制造等行業(yè)實(shí)現(xiàn)轉(zhuǎn)型。他表示,
    的頭像 發(fā)表于 11-20 09:10 ?620次閱讀

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開放計(jì)
    的頭像 發(fā)表于 11-19 15:30 ?572次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫,是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力
    的頭像 發(fā)表于 09-09 09:57 ?787次閱讀
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺(tái)提升<b class='flag-5'>計(jì)算</b>性能

    NVIDIA加速計(jì)算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計(jì)算和生成式 AI 領(lǐng)域的創(chuàng)新,以及 AI 技術(shù)在提高生
    的頭像 發(fā)表于 09-09 09:18 ?863次閱讀

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?848次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù),簡化 AI 創(chuàng)造價(jià)值的過程,加速生成式 AI 的發(fā)展步伐。 NVIDIA
    的頭像 發(fā)表于 06-21 14:39 ?611次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù),
    的頭像 發(fā)表于 06-20 17:36 ?997次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品