0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是流處理?為何選擇流處理?

麗臺科技 ? 來源:麗臺科技 ? 2023-12-05 09:22 ? 次閱讀

1?

什么是流處理?

流是從生產(chǎn)者到消費(fèi)者的一系列無限事件。大量數(shù)據(jù)生成為金融交易、傳感器測量或 Web 服務(wù)器日志等事件流。流處理是對接收到的新數(shù)據(jù)事件的連續(xù)處理。

Streamz 等流處理庫有助于構(gòu)建用于管理連續(xù)數(shù)據(jù)流的流程,允許應(yīng)用程序在事件發(fā)生時(shí)對其作出響應(yīng)。

9c4a74f8-9305-11ee-939d-92fbcf53809c.png

流處理流程通常涉及多個(gè)操作,例如過濾、聚合、計(jì)數(shù)、分析、轉(zhuǎn)換、充實(shí)、分支、連接、流量控制、早期階段反饋、回壓和存儲。

2?

為何選擇流處理?

數(shù)據(jù)流的持續(xù)處理在許多應(yīng)用程序中都非常有幫助,例如:

醫(yī)療健康:持續(xù)監(jiān)控儀器數(shù)據(jù)

智慧城市:交通模式和擁塞管理

制造:優(yōu)化和預(yù)測性維護(hù)

運(yùn)輸:優(yōu)化路線和燃料消耗

汽車:智能汽車

網(wǎng)絡(luò)安全和異常檢測:Web 或網(wǎng)絡(luò)日志處理

金融:股票上市時(shí)間序列

機(jī)器學(xué)習(xí):實(shí)時(shí)預(yù)測

廣告:基于位置或動作的廣告

由于各企業(yè)高度依賴實(shí)時(shí)分析、推理、監(jiān)控等功能,因此流處理市場正經(jīng)歷指數(shù)級發(fā)展。現(xiàn)在,基于流構(gòu)建的服務(wù)是日常業(yè)務(wù)的核心組成部分,結(jié)構(gòu)化遙測事件和非結(jié)構(gòu)化日志正以每年超過 5 倍的速度增長。在現(xiàn)代商業(yè)環(huán)境中,這種規(guī)模的大數(shù)據(jù)流愈加復(fù)雜并且難以有效地運(yùn)行,因此,經(jīng)濟(jì)高效的可靠流對其至關(guān)重要。

3?

GPU 加速流處理

NVIDIA RAPIDScuStreamz 是 GPU 加速流數(shù)據(jù)處理庫,旨在加速流處理吞吐量并降低總擁有成本 (TCO)。NVIDIA 的 cuStreamz 制作流程每年可節(jié)省數(shù)十萬美元。cuStreamz 使用 Python 編寫,基于 RAPIDS(用于數(shù)據(jù)科學(xué)庫的 GPU 加速器)而構(gòu)建。通過添加 GPU 支持的 Flink 可以看出,端到端 GPU 加速正迅速成為行業(yè)標(biāo)準(zhǔn),NVIDIA 很高興能成為此趨勢的一個(gè)組成部分。

cuStreamz 基于以下內(nèi)容構(gòu)建:

Streamz,一個(gè)能夠幫助構(gòu)建管理連續(xù)數(shù)據(jù)流流程的開源 Python 庫;

Dask,一個(gè)能夠并行處理流工作負(fù)載的穩(wěn)健可靠的調(diào)度程序;

RAPIDS,一種用于流計(jì)算的 GPU 加速庫套件。

cuStreamz 通過在后臺利用 RAPIDS cuDF 來加速 Streamz,從而使用 GPU 加速流數(shù)據(jù)計(jì)算。cuStreamz 還受益于 cuDF 的加速 JSON、Parquet 和 CSV 讀取器和寫入器。cuStreamz 團(tuán)隊(duì)構(gòu)建了一個(gè)加速 Kafka 數(shù)據(jù)源連接器,能夠非常快速地將 Kafka 的數(shù)據(jù)直接讀取到 cuDF 數(shù)據(jù)幀中,從而顯著提升端到端性能。然后,可以使用 Dask 在分布式模式下并行運(yùn)行流流程,從而大規(guī)模提高性能。

9c62f5dc-9305-11ee-939d-92fbcf53809c.png

在下圖中對 cuStreamz 架構(gòu)進(jìn)行了概括總結(jié)。cuStreamz 是連接 Python 流與 GPU 的橋梁,應(yīng)用了檢查點(diǎn)和狀態(tài)管理等復(fù)雜可靠的流功能。cuStreamz 還提供了必要的基礎(chǔ)模塊來編寫流作業(yè),這些作業(yè)在 GPU 上安全運(yùn)行,并且性能更好,成本更低。

9c7f509c-9305-11ee-939d-92fbcf53809c.png

4?

GPU 加速的端到端數(shù)據(jù)科學(xué)

基于 NVIDIA CUDA-X AI構(gòu)建的 RAPIDS 開源軟件庫,使您完全能夠在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程。此套件依靠 NVIDIA CUDA基元進(jìn)行低級別計(jì)算優(yōu)化,但通過用戶友好型 Python 接口能夠?qū)崿F(xiàn) GPU 并行化和高帶寬顯存速度。

9c8b6440-9305-11ee-939d-92fbcf53809c.png

借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過一個(gè)類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實(shí)現(xiàn)的。允許加速數(shù)據(jù)準(zhǔn)備、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等端到端流程。

RAPIDS cuML 的機(jī)器學(xué)習(xí)算法和數(shù)學(xué)基元遵循熟悉的類似于 scikit-learn 的 API。單塊 GPU 和大型數(shù)據(jù)中心部署均支持 XGBoost 等主流算法。針對大型數(shù)據(jù)集,相較于同等功效的 CPU,這些基于 GPU 的實(shí)施方案能夠以 10 到 50 倍的速度更快地完成任務(wù)。

RAPIDS 支持在許多熱門數(shù)據(jù)科學(xué)庫之間共享設(shè)備內(nèi)存。這樣可將數(shù)據(jù)保留在 GPU 上,并省去了來回復(fù)制主機(jī)內(nèi)存的高昂成本。

9c988a44-9305-11ee-939d-92fbcf53809c.png

*與NVIDIA產(chǎn)品相關(guān)的圖片或視頻(完整或部分)的版權(quán)均歸NVIDIA Corporation所有。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2552

    文章

    51359

    瀏覽量

    755675
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    806

    瀏覽量

    37998
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8437

    瀏覽量

    132892
  • 智能汽車
    +關(guān)注

    關(guān)注

    30

    文章

    2885

    瀏覽量

    107444
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5871

原文標(biāo)題:麗臺科普丨什么是流處理?

文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI工作自動化是做什么的

    AI工作自動化是指利用人工智能技術(shù),對工作流程中的重復(fù)性、規(guī)則明確的任務(wù)進(jìn)行自動化處理的過程。那么,AI工作自動化是做什么的呢?接下來,AI部落小編為您分享。
    的頭像 發(fā)表于 01-06 17:57 ?119次閱讀

    控芯片鍵合技術(shù)

    控芯片鍵合技術(shù)的重要性 微控芯片的鍵合技術(shù)是實(shí)現(xiàn)其功能的關(guān)鍵步驟之一,特別是在密封技術(shù)方面。鍵合技術(shù)的選擇直接影響到微控芯片的整體性能和可靠性。 不同材料的鍵合方式 玻璃材料:
    的頭像 發(fā)表于 12-30 13:56 ?109次閱讀

    控技術(shù)的生物學(xué)應(yīng)用

    取得了一定進(jìn)展,但在樣品引入和處理一定體積范圍的流體方面仍然存在一些挑戰(zhàn)。納米技術(shù)的最新發(fā)展則有助于提升微控技術(shù)。微系統(tǒng)已經(jīng)徹底改變了可用于分析復(fù)雜樣品的高靈敏度生物分析系統(tǒng)的發(fā)展。這些器件可用于多種領(lǐng)域
    的頭像 發(fā)表于 12-01 21:50 ?187次閱讀

    數(shù)據(jù)科學(xué)工作原理

    數(shù)據(jù)科學(xué)工作包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓(xùn)練、模型評估與優(yōu)化、結(jié)果解釋與報(bào)告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?217次閱讀

    控陣列芯片和普通芯片的區(qū)別

    控陣列芯片與普通芯片在設(shè)計(jì)與應(yīng)用上存在顯著差異 設(shè)計(jì)原理:微控陣列芯片以微米級通道操控流體,集成多種實(shí)驗(yàn)功能;普通芯片則通?;诰w管,用于電子信號處理。 應(yīng)用領(lǐng)域:微控陣列芯
    的頭像 發(fā)表于 10-30 15:10 ?301次閱讀

    二極管的工作原理和應(yīng)用

    二極管,也稱為恒晶體管,是一種具有恒定電流輸出特性的半導(dǎo)體器件。它在電子電路中具有廣泛的應(yīng)用,如電源管理、信號處理、光電子學(xué)等領(lǐng)域。以下是對恒二極管及其工作原理的詳細(xì)闡述。
    的頭像 發(fā)表于 09-26 17:48 ?831次閱讀

    保護(hù)片的型號選擇要考慮哪些參數(shù)

    保護(hù)片,也稱為過電流保護(hù)片或電流限制片,是一種用于電路中保護(hù)電子設(shè)備免受過大電流損害的元件。選擇合適的過保護(hù)片對于確保電路的可靠性和安全性至關(guān)重要。以下是在選擇
    的頭像 發(fā)表于 09-20 15:45 ?467次閱讀

    UV LED供電為什么要選擇使用恒驅(qū)動電源

    LED為何一定要恒供電? 在討論此議題之前,什么是電源的恒恒壓?
    的頭像 發(fā)表于 08-25 14:55 ?643次閱讀

    PMMA微控芯片的鍵合介紹

    控芯片 鍵合前PMMA的表面處理 在粘合之前對被粘接物表面進(jìn)行處理是粘合工藝中最重要的環(huán)節(jié)之一。初始的粘接強(qiáng)度和耐久性完全取決于膠粘劑接觸的表面類型。被粘接物處理的程度和使用環(huán)境與
    的頭像 發(fā)表于 08-13 15:20 ?338次閱讀

    如何有效解決固耦合問題

    固耦合問題的基本概念 固耦合問題是指在流體和固體相互作用的過程中,流體的運(yùn)動受到固體邊界的影響,同時(shí)固體的變形和應(yīng)力狀態(tài)也受到流體的作用。固耦合問題具有以下特點(diǎn): 1.1 多學(xué)科性:
    的頭像 發(fā)表于 08-09 15:16 ?820次閱讀

    LED恒驅(qū)動芯片:升壓恒和降壓恒的區(qū)別和應(yīng)用場景

    LED恒驅(qū)動芯片主要用于LED燈珠的供電和驅(qū)動控制。 升壓恒和降壓恒是兩種常見的LED恒驅(qū)動方式: 1. 升壓恒(Boost Co
    的頭像 發(fā)表于 08-09 13:47 ?2338次閱讀

    繼電器的工作原理及作用 熱過載繼電器和過繼電器的區(qū)別

    繼電器的工作原理 過繼電器的作用 熱過載繼電器和過繼電器的區(qū)別? 過繼電器的工作原理: 過繼電器是一種用來檢測電路中的過
    的頭像 發(fā)表于 03-06 15:17 ?1510次閱讀

    仿生超構(gòu)微控微針貼片,用于高效傷口管理

    在過去的幾十年中,微控芯片作為處理微小液滴或小體積液體樣品的小型實(shí)驗(yàn)室裝置,具有快速分析、小容量處理和成本效益高等優(yōu)點(diǎn)。
    的頭像 發(fā)表于 02-19 15:52 ?1657次閱讀
    仿生超構(gòu)微<b class='flag-5'>流</b>控微針貼片,用于高效傷口管理

    如何選擇pcb表面處理方法

    PCB的表面處理選擇是PCB制造過程中最關(guān)鍵的步驟,因?yàn)樗苯佑绊懙焦に嚠a(chǎn)量、返工數(shù)量、現(xiàn)場故障率、測試能力、廢品率和成本。那么如何選擇pcb表面處理方法呢?
    的頭像 發(fā)表于 02-16 17:09 ?1990次閱讀
    如何<b class='flag-5'>選擇</b>pcb表面<b class='flag-5'>處理</b>方法

    BUCK電路元件的過值該如何正確選擇?

    BUCK電路元件的過值該如何正確選擇? BUCK(降壓)電路是一種常用的DC-DC轉(zhuǎn)換器,廣泛應(yīng)用于各種電子設(shè)備中。為了確保Buck電路的正常運(yùn)行和安全性,合理選擇電路元件的過值非
    的頭像 發(fā)表于 01-31 17:03 ?837次閱讀