亚洲AV永久四虎无码精品无码,精品一区二区百度,新品亚洲高潮喷水精品视频

Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎，該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍，使數(shù)據(jù)科學(xué)家僅在一臺(tái)機(jī)器上就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。

日新月異的數(shù)據(jù)挑戰(zhàn)

Pandas 等傳統(tǒng)數(shù)據(jù)處理庫均為單線程，當(dāng)處理數(shù)據(jù)超過數(shù)百萬行時(shí)就會(huì)顯得“力不從心”。分布式數(shù)據(jù)處理系統(tǒng)雖然可以處理數(shù)十億行數(shù)據(jù)，但又會(huì)增加處理中小型數(shù)據(jù)集的復(fù)雜程度和經(jīng)費(fèi)開支。

在高效處理數(shù)千萬至數(shù)億行數(shù)據(jù)的工具之間一直存在著差距。這類工作負(fù)載常見于金融、零售、制造等行業(yè)的模型開發(fā)、需求預(yù)測(cè)和物流中。

在面向數(shù)據(jù)科學(xué)家和工程師的 Python 庫中，Polars 的增長速度位居前列，其設(shè)計(jì)初衷就是為了應(yīng)對(duì)這些挑戰(zhàn)。該程序庫使用了先進(jìn)的查詢優(yōu)化技術(shù)，以減少不必要的數(shù)據(jù)移動(dòng)和處理，使數(shù)據(jù)科學(xué)家可以僅用一臺(tái)機(jī)器就能流暢地處理數(shù)億行規(guī)模的工作負(fù)載。Polars 彌補(bǔ)了單線程解決方案速度過慢和分布式系統(tǒng)會(huì)增加非必要復(fù)雜性的缺陷，提供了一個(gè)極具吸引力的“中等規(guī)?！睌?shù)據(jù)處理解決方案。

將 NVIDIA 加速計(jì)算引入 Polars

與其他僅使用 CPU 的數(shù)據(jù)處理工具相比，Polars 利用多線程執(zhí)行、高級(jí)內(nèi)存優(yōu)化和惰性求值（lazy evaluation）功能，可顯著提升開箱即用的加速性能。

但由于各行各業(yè)的企業(yè)面臨日益增長的數(shù)據(jù)處理需求，例如需要分析數(shù)十億筆金融交易、管理復(fù)雜的庫存系統(tǒng)等，都需要更加強(qiáng)大的性能。這時(shí)就該輪到加速計(jì)算發(fā)揮作用了：

cuDF 是 NVIDIA CUDA-X 加速庫中的 RAPIDS 套件的一部分，它是一個(gè)由 GPU 提供加速的 DataFrame 程序庫，能夠利用 GPU 的大規(guī)模并行處理能力顯著提高數(shù)據(jù)處理性能。

Polars 團(tuán)隊(duì)與 NVIDIA 一起將 cuDF 的速度與 Polars 的效率相結(jié)合，使性能最高提速至在 CPU 上 Polars 的 13 倍。如此，即便用戶的數(shù)據(jù)處理工作量增長到數(shù)億甚至數(shù)十億行數(shù)據(jù)，依然能夠保持交互。

圖 1.圖中所示的是 PDS-H 基準(zhǔn)測(cè)試 22 個(gè)查詢中加速幅度最大的 4 個(gè)查詢。在運(yùn)行包含眾多復(fù)雜分組和連接操作的查詢時(shí)，RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基準(zhǔn)測(cè)試規(guī)模系數(shù) 80 | GPU：NVIDIA H100 | CPU：英特爾 Xeon W9-3495X（Sapphire Rapids） | 存儲(chǔ)：本地NVMe。備注：PDS-H 源自 TPC-H，但這些結(jié)果與 TPC-H 的結(jié)果不具有可比性。

由于 Polars GPU 引擎直接內(nèi)置在 Polars Lazy API 中，用戶只需通過 pip 安裝 polars[gpu] 并將 [engine=”gpu”] 發(fā)送至 collect 操作，即可將 GPU 加速應(yīng)用于他們的工作流。在后臺(tái)，Polars 會(huì)嘗試首先在 GPU 上執(zhí)行操作，必要時(shí)再返回 CPU。這種方法可確保：

通過使用 Polars 的查詢優(yōu)化器，實(shí)現(xiàn)高效執(zhí)行和最低內(nèi)存使用

用戶無須修改現(xiàn)有 Polars 代碼，即可訪問 GPU 引擎

完全兼容 Polars 不斷發(fā)展的數(shù)據(jù)可視化、I/O 和機(jī)器學(xué)習(xí)庫生態(tài)系統(tǒng)

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

結(jié)語

RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎現(xiàn)已發(fā)布公測(cè)版，為各行各業(yè)的數(shù)據(jù)科學(xué)家和工程師提供了一種適用于中等規(guī)模數(shù)據(jù)處理的強(qiáng)大工具。該引擎最高能夠?qū)?NVIDIA GPU 上的 Polars 工作流速度提速 13 倍，可以在不產(chǎn)生分布式系統(tǒng)開銷的情況下，高效處理數(shù)億行規(guī)模的數(shù)據(jù)集。Polars GPU 引擎直接內(nèi)置在 Polars API 中，使所有用戶都能輕松訪問。

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5258

瀏覽量
105870
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4917

瀏覽量
130744
引擎

引擎

+關(guān)注

關(guān)注
1

文章
366

瀏覽量
22909

原文標(biāo)題：RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎發(fā)布公測(cè)版

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

搜索歷史

將NVIDIA加速計(jì)算引入Polars

評(píng)論

電子發(fā)燒友