亚洲精品无码不卡在线播放,伊人婷婷,国产欧美丝袜在线二蜜芽TV

1.背景介紹

Apache Spark（以下簡稱Spark）是一個開源的分布式計算框架，由UC Berkeley AMP Lab開發(fā)，可用于批處理、交互式查詢（Spark SQL）、實時流處理（Spark Streaming）、機器學習（Spark MLlib）和圖計算（GraphX）。Spark使用內(nèi)存加載保存數(shù)據(jù)并進行迭代計算，減少磁盤溢寫，同時支持 Java、Scala、Python和 R等多種高級編程語言，這使得Spark可以應(yīng)對各種復雜的大數(shù)據(jù)應(yīng)用場景，例如金融、電商、社交媒體等。

Spark 經(jīng)過多年發(fā)展，作為基礎(chǔ)的計算框架，不管是在穩(wěn)定性還是可擴展性方面，以及生態(tài)建設(shè)都得到了業(yè)界廣泛認可。盡管Apache社區(qū)對Spark逐步引入了諸如鎢絲計劃、向量化 Parquet Reader等一系列優(yōu)化，整體的計算性能也有兩倍左右的提升，但在 3.0版本以后，整體計算性能的提升有所減緩，并且隨著存儲、網(wǎng)絡(luò)以及IO技術(shù)的提升，CPU也逐漸成為Spark計算性能的瓶頸。如何在Spark現(xiàn)有框架上，增強大數(shù)據(jù)計算能力，提高CPU利用率，成為近年來業(yè)界的研究方向。

2.開源優(yōu)化方案

Spark本身使用scala語言編寫，整體架構(gòu)基于 JVM開發(fā)，只能利用到一些比較基礎(chǔ)的 CPU指令集。雖然有JIT的加持，但相比目前市面上的Native向量化計算引擎而言，性能還是有較大差距。因此考慮如何將具有高性能計算能力的Native向量引擎引用到 Spark里來，提升 Spark的計算性能，突破 CPU瓶頸，成為一種可行性較高的解決方案。

隨著Meta在2022年超大型數(shù)據(jù)庫國際會議（VLDB）上發(fā)表論文《Velox:Meta's Unified Execution Engine》，并且Intel創(chuàng)建的Gluten項目基于Apache Arrow數(shù)據(jù)格式和Substrait查詢計劃的JNI API將Spark JVM和執(zhí)行引擎解耦，從而將Velox集成到Spark中，這使得使用Spark框架+Native向量引擎的大數(shù)據(jù)加速方案成為現(xiàn)實。

3.DPU計算卡與軟件開發(fā)平臺

AI大模型的發(fā)展，金融、電商等領(lǐng)域數(shù)據(jù)處理需求的增加，生活應(yīng)用虛擬化程度的加深，都對現(xiàn)代化數(shù)據(jù)中心提出嚴峻的考驗。未來數(shù)據(jù)中心的發(fā)展趨勢，逐步演變成CPU + DPU + GPU三足鼎立的情況，CPU用于通用計算，GPU用于加速計算，DPU則進行數(shù)據(jù)處理。將大數(shù)據(jù)計算卸載到具有高度定制化和數(shù)據(jù)處理優(yōu)化架構(gòu)的大規(guī)模數(shù)據(jù)計算DPU卡上，可以有效提高計算密集型應(yīng)用場景下數(shù)據(jù)中心的性能和效率，降低其成本和能耗。

中科馭數(shù)CONFLUX?-2200D大數(shù)據(jù)計算DPU卡主要應(yīng)用于大數(shù)據(jù)計算場景。CONFLUX?-2200D通過計算DPU卸載加速，存儲DPU卸載加速和網(wǎng)絡(luò)DPU卸載加速實現(xiàn)大數(shù)據(jù)計算性能3-6倍提升。CONFLUX?-2200D是基于中科馭數(shù)自主知識產(chǎn)權(quán)的KPU（Kernel Processing Unit）架構(gòu)、DOE（Data Offloading Engine）硬件數(shù)據(jù)庫運算卸載引擎和LightningDMA中科馭數(shù)自主知識產(chǎn)權(quán)的基于DMA的直接內(nèi)存寫入技術(shù)提出的領(lǐng)域?qū)Ｓ肈PU卡。能夠滿足無侵入適配、自主可控、安全可靠，支持存算一體、存算分離等不同場景。

中科馭數(shù)HADOS是中科馭數(shù)推出的專用計算敏捷異構(gòu)軟件開發(fā)平臺。HADOS?數(shù)據(jù)查詢加速庫通過提供基于列式數(shù)據(jù)的查詢接口，供數(shù)據(jù)查詢應(yīng)用，目前Spark、PostgreSQL已通過插件的形式適配。支持Java、Scala、C和C++語言的函數(shù)調(diào)用，主要包括列數(shù)據(jù)管理、數(shù)據(jù)查詢運行時函數(shù)、任務(wù)調(diào)度引擎、函數(shù)運算代價評估、內(nèi)存管理、存儲管理、硬件管理、DMA引擎、日志引擎等模塊，目前對外提供數(shù)據(jù)管理、查詢函數(shù)、硬件管理、文件存儲相關(guān)功能API。

4.Spark框架+Gluten-Velox向量化執(zhí)行引擎+DPU加速卡

4.1方案簡介

隨著SSD和萬兆網(wǎng)卡普及以及I/O技術(shù)的提升，Spark用戶的數(shù)據(jù)負載計算能力逐漸受到CPU性能瓶頸的約束。由于Spark本身基于JVM的Task計算模型的CPU指令優(yōu)化，要遠遠遜色于其他的Native語言（C++等），再加上開源社區(qū)的Native引擎已經(jīng)發(fā)展得比較成熟，具備優(yōu)秀的量化執(zhí)行能力，這就使得那些現(xiàn)有的Spark用戶，如果想要獲得這些高性能計算能力就需要付出大量的遷移和運維成本。

Gluten解決了這一關(guān)鍵性問題，讓Spark用戶無需遷移，就能享受這些成熟的Native引擎帶來的性能優(yōu)勢。Gluten最核心的能力就是通過Spark Plugin的機制，把Spark查詢計劃攔截并下發(fā)給Native引擎來執(zhí)行，跳過原生Spark不高效的執(zhí)行路徑。整體的執(zhí)行框架仍沿用Spark既有實現(xiàn)，并且對于Native引擎無法承接的算子，Gluten安排Fallback回正常的Spark執(zhí)行路徑進行計算，從而保證Spark任務(wù)執(zhí)行的穩(wěn)定性。同時Gluten還實現(xiàn)了Fallback、本地內(nèi)存管理等功能，使得Spark可以更好利用Native引擎帶來的高性能計算能力。

Velox是一個集合了現(xiàn)有各種計算引擎優(yōu)化的新穎的C++數(shù)據(jù)加速庫，其重新設(shè)計了數(shù)據(jù)模型以支持復雜數(shù)據(jù)類型的高效計算，并且提供可重用、可擴展、高性能且與上層軟件無關(guān)的數(shù)據(jù)處理組件，用于構(gòu)建執(zhí)行引擎和增強數(shù)據(jù)管理系統(tǒng)。

由于Velox只接收完全優(yōu)化的查詢計劃作為輸入，不提供 SQL解析器、dataframe層、其他 DSL或全局查詢優(yōu)化器，專注于成為大數(shù)據(jù)計算的執(zhí)行引擎。這就使得Gluten+Velox架構(gòu)可以各司其職，從而實現(xiàn)數(shù)據(jù)庫組件模塊化。

要將Gluten+Velox優(yōu)化過的Spark計算任務(wù)卸載到DPU卡，還缺少一個異構(gòu)中間層，為此中科馭數(shù)研發(fā)了HADOS異構(gòu)執(zhí)行庫，該庫提供列數(shù)據(jù)管理、數(shù)據(jù)查詢運行時函數(shù)、任務(wù)調(diào)度引擎、函數(shù)運算代價評估、內(nèi)存管理等多種DPU能力的API接口，并且支持Java，C++等多種大數(shù)據(jù)框架語言的調(diào)用，擁有極強的拓展性，以及與現(xiàn)有生態(tài)的適配性。HADOS敏捷異構(gòu)軟件平臺可以適應(yīng)復雜的大數(shù)據(jù)軟件生態(tài)，在付出較小成本的情況下為多種計算場景提供DPU算力加速。Spark框架集成Gluten+Velox向量化執(zhí)行引擎，然后使用HADOS平臺，就可以將經(jīng)過向量化優(yōu)化的計算任務(wù)，利用DPU執(zhí)行，從而徹底釋放CPU，實現(xiàn)DPU高性能計算。

4.2 DPU算力卸載

velox是由C++實現(xiàn)的向量化計算引擎，其核心執(zhí)行框架涵蓋了任務(wù)（Task）、驅(qū)動（Driver）和操作器（Operator）等組件。velox將Plan轉(zhuǎn)換為由PlanNode組成的一棵樹，然后將PlanNode轉(zhuǎn)換為Operator。Operator作為基礎(chǔ)的算子，是實際算法執(zhí)行的邏輯框架，也是實現(xiàn)DPU計算卸載的關(guān)鍵。

4.2.1邏輯框架

Operator作為實際算法的邏輯框架，承載著各種表達式的抽象，每一個Operator中包含一個或多個表達式來實現(xiàn)一個復雜完整的計算邏輯塊，表達式的底層是由function來具體實現(xiàn)。Velox向開發(fā)人員提供了API可以實現(xiàn)自定義scalar function，通過實現(xiàn)一個異構(gòu)計算版本的function，然后將這個function注冊到Velox的函數(shù)系統(tǒng)中，就可以將計算任務(wù)卸載到DPU卡上。任務(wù)執(zhí)行過程如下圖：

中科馭數(shù)的CONFLUX?-2200DS大數(shù)據(jù)計算加速DPU卡可以實現(xiàn)列式計算，并且HADOS平臺支持C++語言，所以可以直接解析Velox的向量化參數(shù)。對于列式存儲的數(shù)據(jù)，經(jīng)過對數(shù)據(jù)類型的簡單處理之后，可以直接交給DPU執(zhí)行計算任務(wù)，免去了數(shù)據(jù)行列轉(zhuǎn)換的性能損失，同時也降低了DPU計算資源集成的運維難度，大大提高了Velox異構(gòu)開發(fā)的效率。

4.2.2算子卸載

以我們實現(xiàn)卸載的Filter算子為例，對于cast(A as bigint)>1這一具體的表達式，來探究如何實現(xiàn)”>”這一二元運算符的卸載。

Filter算子的Operator中會使用有一個 std::unique_ptr exprs_的變量，用來執(zhí)行過濾和投影的計算。ExprSet是Filter算子計算的核心，其本質(zhì)是一顆表達式樹。cast(A as bigint)>1的表達式樹以及表達式樹的靜態(tài)節(jié)點類型如下：

節(jié)點類型	作用
FieldAccessTypedExpr	表示RowVector中的某一列，作為表達式的葉子節(jié)點
ConstantTypedExpr	表示常量值，作為表達式的葉子節(jié)點
CallTypedExpr	表示函數(shù)調(diào)用表達式，子節(jié)點表示輸入?yún)?shù) 表示特殊類型表達式，包括 if/and/or/switch/cast/try/coalesce等
CastTypedExpr	類型轉(zhuǎn)換
LambdaTypedExpr	Lambda表達式，作為葉子節(jié)點

在表達式的所有子節(jié)點執(zhí)行完后，會執(zhí)行applyFunction，說明當前表達式節(jié)點是一個函數(shù)調(diào)用，然后調(diào)用vectorFunction_的apply來對結(jié)果進行處理，輸入是inputValues_數(shù)組，該數(shù)組長度與函數(shù)的表達式葉子節(jié)點數(shù)相等（文中示例表達式的葉子節(jié)點為2），作為函數(shù)的參數(shù)，result為輸出，結(jié)果為VectorPtr，程序流程圖如下：

4.2.3 Fallback

現(xiàn)階段我們只實現(xiàn)了Filter算子的部分表達式，后續(xù)還會繼續(xù)支持更多的算子和表達式。對于一些無法執(zhí)行的算子和表達式，還是需要退回給Velox，交由CPU執(zhí)行，從而保證SQL的正常執(zhí)行。由于處理的是列式數(shù)據(jù)，所以回退的執(zhí)行計劃可以不需要任何處理，就可以直接從HADOS退還給Velox，幾乎無性能損失。

4.2.4 DPU資源管理

HADOS平臺會對服務(wù)器的DPU資源進行統(tǒng)一管理。對于卸載的計算任務(wù)根據(jù)現(xiàn)有的DPU資源進行動態(tài)分配，從而實現(xiàn)計算資源的高效利用。同時HADOS平臺還會對計算任務(wù)中所需的內(nèi)存進行合理的分配，動態(tài)申請和釋放系統(tǒng)內(nèi)存，從而減少額外的內(nèi)存開銷。

4.3加速效果

單機單線程local模式，使用1G數(shù)據(jù)集，僅卸載Filter算子的部分表達式的場景下，TPC-DS語句中有5條SQL語句，可以將使用開源方案的加速效果提升15-20%左右。q70語句，在開源方案提升100%的基礎(chǔ)上，提升了15%；q89語句，在開源方案提升50%的基礎(chǔ)上，提升了27%；q06在開源方案提升170%的基礎(chǔ)上，提升了13%。

單一運算符場景下（SELECT a FROM t WHERE a = 100），使用DPU運算符相比 Spark原生的運算符的加速比最高達到12.7。

5.不足和展望

中科馭數(shù)HADOS敏捷異構(gòu)軟件平臺可以十分輕松地與現(xiàn)有開源大數(shù)據(jù)加速框架相結(jié)合，并且為開源框架提供豐富的算力卸載功能。HADOS平臺在完美發(fā)揮開源加速框架優(yōu)勢的前提下，為大數(shù)據(jù)任務(wù)提供硬件加速能力。由于現(xiàn)在我們只實現(xiàn)了較小部分算子卸載的驗證，在執(zhí)行具有復雜算子操作的SQL時無法發(fā)揮出DPU的全部實力，并且因為開源方案在設(shè)計之處并沒有考慮到使用DPU硬件，所以在磁盤IO，算子優(yōu)化等方面的性能還有待優(yōu)化。后續(xù)我們也會從一下幾個方面來進一步做特定優(yōu)化：

開發(fā)更多較復雜的算子，例如重量級的聚合算子會消耗CPU大量的計算能力從而影響Spark作業(yè)，通過將聚合算子卸載到DPU硬件來解放CPU能力，從而使得加速效果更加明顯；

優(yōu)化DPU的磁盤讀寫，讓DPU可以直接讀取硬盤數(shù)據(jù)，省去數(shù)據(jù)在服務(wù)器內(nèi)部的傳輸時間，可以減少數(shù)據(jù)準備階段的性能損耗；

RDMA技術(shù)，可以直讀取遠端內(nèi)存數(shù)據(jù)，數(shù)據(jù)傳輸內(nèi)容直接卸載到網(wǎng)卡，減少數(shù)據(jù)在系統(tǒng)內(nèi)核中額外的數(shù)據(jù)復制與移動，可以減少大數(shù)據(jù)任務(wù)計算過程中的性能損耗。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
11006

瀏覽量
215063
DPU

DPU

+關(guān)注

關(guān)注
0

文章
386

瀏覽量
24570
SPARK

SPARK

+關(guān)注

關(guān)注
1

文章
105

瀏覽量
20295

DPU232—高度集成USB到UART橋接控制器國產(chǎn)替代方案

DPU232是一款高度集成的USB到UART橋接控制器，提供了一種簡單的解決方案，可以使用最少的元器件和PCB空間，將RS232接口轉(zhuǎn)換為USB接口。DPU232包括一個USB2.0全速功能控制器

發(fā)表于 04-01 10:53

hyper 卸載，Hyper卸載：如何徹底卸載hyper-v并恢復系統(tǒng)設(shè)置

? ? 隨著企業(yè)規(guī)模的不斷擴大，數(shù)據(jù)和任務(wù)的管理變得愈發(fā)復雜。傳統(tǒng)的管理方式已經(jīng)無法滿足高效運營的需求，而批量管理工具的出現(xiàn)，為企業(yè)提供了一種全新的解決方案。今天就為大家介紹Hyper卸載：如何徹底

發(fā)表于 01-24 14:17 ?4987次閱讀

hyper <b class='flag-5'>卸載</b>，Hyper<b class='flag-5'>卸載</b>：如何徹底<b class='flag-5'>卸載</b>hyper-v并恢復系統(tǒng)設(shè)置

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優(yōu)勢

WEKA是可擴展軟件定義數(shù)據(jù)平臺的先驅(qū)，NVIDIA 正在與其合作，將 WEKA 先進的數(shù)據(jù)平臺解決方案與功能強大的NVIDIA BlueField DPU相結(jié)合。

發(fā)表于 01-07 09:43 ?488次閱讀

在NVIDIA BlueField-3 <b class='flag-5'>DPU</b>上運行WEKA客戶端的實際優(yōu)勢

AFE4403 EVM的GUI打不開，顯示labview運行時引擎找不到是哪里出了問題？

最開始下載是可以打開的，后來卸載重裝過，卸載的時候手工強制刪除過NI文件夾，就是national instrument那個；再重新安裝就不能打開了，強制刪除的文件重裝貌似也回不來了，怎么辦。。下載了運行引擎2011版安裝了也不

發(fā)表于 12-31 06:39

基于 DSP5509 進行數(shù)字圖像處理中 Sobel 算子邊緣檢測的硬件連接電路圖

以下是基于 DSP5509 進行數(shù)字圖像處理中 Sobel 算子邊緣檢測的硬件設(shè)計方案：一、總體架構(gòu) 圖像采集：使用合適的圖像傳感器，如 CMOS 傳感器，通過相應(yīng)的接口（如 SPI、I2C 等

發(fā)表于 09-25 15:25

服務(wù)網(wǎng)格DPU卸載解決方案

服務(wù)網(wǎng)格（Service Mesh）是微服務(wù)架構(gòu)中的一種重要技術(shù)，它主要處理服務(wù)之間的通信，為服務(wù)間的信息交換提供更安全、更快速且更可靠的基礎(chǔ)設(shè)施層。服務(wù)網(wǎng)格將服務(wù)治理從業(yè)務(wù)邏輯中剝離出來，拆解為獨立的進程，實現(xiàn)異構(gòu)系統(tǒng)的統(tǒng)一治理和增強網(wǎng)絡(luò)安全。

發(fā)表于 09-20 16:25 ?544次閱讀

服務(wù)網(wǎng)格<b class='flag-5'>DPU</b><b class='flag-5'>卸載</b>解決<b class='flag-5'>方案</b>

視頻引擎初始化失敗怎么回事

其他視頻軟件診斷方法：檢查系統(tǒng)中是否安裝了其他視頻播放或編輯軟件，這些軟件可能會與當前視頻引擎沖突。解決方法：嘗試卸載或禁用這些軟件，然后重新啟動視頻引擎。 1.2 系統(tǒng)更新診斷方法：檢查系統(tǒng)是否最近進行了更新，這

發(fā)表于 09-18 18:18 ?2293次閱讀

spark為什么比mapreduce快？

spark為什么比mapreduce快？首先澄清幾個誤區(qū)： 1：兩者都是基于內(nèi)存計算的，任何計算框架都肯定是基于內(nèi)存的，所以網(wǎng)上說的spark是基于內(nèi)存計算所以快，顯然是錯誤的 2;DAG計算模型

發(fā)表于 09-06 09:45 ?416次閱讀

中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用

CCF Chip 2024，精彩不能停！7月21日下午，中科馭數(shù)在第二屆中國計算機學會（CCF）芯片大會的“馭數(shù)專屬時刻”仍在繼續(xù)，馭數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中

發(fā)表于 08-02 11:21 ?965次閱讀

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

、VMware、Palo Alto 等公司紛紛推出相關(guān)解決方案。這些方案背后共同的本質(zhì)思想是：將云計算的 IaaS 層組件從服務(wù)器側(cè)卸載后圍繞 DPU 構(gòu)筑高性能算力底座，與 AWS、

發(fā)表于 07-24 15:32

spark運行的基本流程

前言：由于最近對spark的運行流程非常感興趣，所以閱讀了《Spark大數(shù)據(jù)處理：技術(shù)、應(yīng)用與性能優(yōu)化》一書。通過這本書的學習，了解了spark的核心技術(shù)、實際應(yīng)用場景以及性能優(yōu)化的方法。本文旨在

發(fā)表于 07-02 10:31 ?599次閱讀

中科馭數(shù)CEO鄢貴海：從計算系統(tǒng)的三個視角重新審視DPU的核心價值

在信息技術(shù)日新月異的浪潮中，DPU正逐漸嶄露頭角。當前，DPU發(fā)展的核心驅(qū)動力來自于什么？DPU技術(shù)是否已經(jīng)足夠成熟到廣泛應(yīng)用？市場上頭部玩家參與到這一創(chuàng)新技術(shù)的市場角逐之中？在算力時代，DP

發(fā)表于 06-28 14:27 ?675次閱讀

中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

在信息技術(shù)領(lǐng)域，每一次芯片技術(shù)的突破都代表著行業(yè)的一次飛躍。近日，DPU領(lǐng)域的領(lǐng)軍企業(yè)中科馭數(shù)宣布，成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布，標志著中科馭數(shù)在DPU領(lǐng)域的技術(shù)實力達到了新的高度。

發(fā)表于 06-21 11:41 ?1059次閱讀

“Spark+Hive”在DPU環(huán)境下的性能測評 | OLAP數(shù)據(jù)庫引擎選型白皮書（24版）DPU部分節(jié)選

在奇點云2024年版《OLAP數(shù)據(jù)庫引擎選型白皮書》中，中科馭數(shù)聯(lián)合奇點云針對Spark+Hive這類大數(shù)據(jù)計算場景下的主力引擎，測評DPU環(huán)境下對比CPU環(huán)境下的性能提升效果。特此節(jié)

發(fā)表于 05-30 16:09 ?711次閱讀

鴻蒙ArkTS聲明式開發(fā)：跨平臺支持列表【掛載卸載事件】

掛載卸載事件指組件從組件樹上掛載、卸載時觸發(fā)的事件。

發(fā)表于 05-27 14:42 ?534次閱讀

搜索歷史

Spark基于DPU的Native引擎算子卸載方案

評論