電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>Taier分布式可視化DAG任務調度系統(tǒng)

Taier分布式可視化DAG任務調度系統(tǒng)

2022-06-14 | zip | 11.01 MB | 次下載 | 2積分

資料介紹

授權協(xié)議 Apache 2.0
開發(fā)語言 Java TypeScript
軟件類型 開源軟件

軟件簡介

Taier是袋鼠云數(shù)棧大數(shù)據(jù)家族的開源項目之一 ,它是一個分布式可視化的DAG任務調度系統(tǒng),旨在降低ETL開發(fā)成本、提高大數(shù)據(jù)平臺穩(wěn)定性,讓大數(shù)據(jù)開發(fā)人員可以在Taier直接進行業(yè)務邏輯的開發(fā),而不用關心任務錯綜復雜的依賴關系與底層的大數(shù)據(jù)平臺的架構實現(xiàn),將工作的重心更多地聚焦在業(yè)務之中。

一、架構設計和功能詳解

在架構設計與功能特點上,Taier整體架構是使用插件式的開發(fā)模式,在任務開發(fā)下面有調度模塊和各項組件,也包括數(shù)棧開源家族的Chunjun等等。

poYBAGKhzbSAZhb7AAEyVzhN-a0307.png

(一)Taier功能特點

Taier的功能特點有下面幾個比較重要的方面:

1.任務類型Spark SQL、數(shù)據(jù)同步(流計算任務);

2.控制臺:包括隊列管理、資源管理、多集群管理等;

3.運維中心比如任務管理、周期調度、補數(shù)據(jù)等;

4.插件化開發(fā):具體包括 taier-plugin、、DatasourceX、Chunjun等幾個插件。

poYBAGKhzbaAD5AOAAJJa2jHggI230.png

(二)Taier功能特征

隨著不斷更新完善,現(xiàn)在的Taier已經(jīng)具有以下的幾種特性:

1、拓展性

  • 單點故障:去中心化的分布式模式

  • 高可用方式:Zookeeper

  • 過載處理∶分布式節(jié)點+兩級存儲策略+隊列機制。每個節(jié)點都可以處理任務調度與提交;任務多時會優(yōu)先緩存在內存隊列,超出可配置的隊列最大數(shù)量值后會全部落數(shù)據(jù)庫;任務處理以隊列方式消費,隊列異步從數(shù)據(jù)庫獲取可執(zhí)行實例

  • 實戰(zhàn)檢驗:得到數(shù)百家企業(yè)客戶生產環(huán)境實戰(zhàn)檢驗

2、易用性

  • 支持大數(shù)據(jù)作業(yè)Spark、Flink的調度;

  • 支持眾多的任務類型,目前支持Spark SQL、Chunjun

  • 可視化工作流配置︰支持封裝工作流、支持單任務運行,不必封裝工作流、支持拖拽模式繪制;

  • DAG監(jiān)控界面:運維中心、支持集群資源查看,了解當前集群資源的剩余情況、支持對調度隊列中的任務批量停止、任務狀態(tài)、任務類型、重試次數(shù)、任務運行機器、可視化變量等關鍵信息一目了然;

  • 調度時間配置:可視化配置;

  • 多集群連接:支持一套調度系統(tǒng)連接多套Hadoop集群。

3、多版本引擎

  • 支持Spark 、Flink等引擎的多個版本共存,例如可同時支持Flink1.10、Flink1.12(后續(xù)開源)

  • Kerberos支持Spark、Flink

  • 豐富,支持3種時間基準,且可以靈活設置輸出格式。

4、拓展性

  • 設計之處就考慮分布式模式,目前支持整體Taier 水平擴容方式;調度能力也隨集群線性增長。

?

二、Taier重要概念

下面從原理和操作層面給大家進一步介紹Taier,還有一些具體概念的解釋。

pYYBAGKhzbiAW8B2AAI784FywuE674.png

(一)任務與實例

方便起見,數(shù)棧在Taier中提出“任務”和“實例”兩個概念,例如數(shù)據(jù)開發(fā)的數(shù)據(jù)同步這項工作稱之為“任務”,而已經(jīng)提交并且配置了周期屬性的任就稱之為“實例”。

poYBAGKhzbmAceE6AAD5Qt5iQVQ003.png

(二)實例具體操作

在Taier中,實例有這幾種構建的方式:

1.基于Zookeeper選舉Master節(jié)點參與Job 實例構建,T+1構建JobGraph

2. JobGraph構建前check &clean DirtyData

3.依據(jù)Task、TaskTask的數(shù)據(jù)(JobGraph)生成Job .JobJob實例數(shù)據(jù)

4.Master節(jié)點控制實例數(shù)據(jù)的負載均衡持久化入數(shù)據(jù)庫

pYYBAGKhzbyAPx6IAAEzl6MA0IE084.png

構建完畢后,實例處理的幾種方式如下圖所示:

pYYBAGKhzb2AIY0mAAD7YKXUZFA720.png

其中:

1.三種任務類型:周期任務、補數(shù)據(jù)任務、重跑任務,統(tǒng)一調度方式

2. Job 優(yōu)先入隊列(1),隊列容量不足入DB (2)

3.當隊列容量空余時,異步線程從DB加載數(shù)據(jù)入隊列(3)

4. Job出隊列后進行任務提交

?

處理完成后,實例提交我們也做了思考,具體設計:

1.內存優(yōu)先級隊列,控制Job有序執(zhí)行

2.多線程并發(fā)提交(可配置)

3. Job 執(zhí)行超時判斷(可配置)

4. Job資源不足/失敗重試進入延遲隊列(可配置)﹔避免長時間占用提交權

poYBAGKhzb-AOZHoAACV21hxTVU818.png

?

Taier 的實例狀態(tài)大家主要應該關注標志停止的幾個,具體有下面幾種:

1.?WaitEngine:內存隊列中的Job、內存容量不足存儲在DB中的Job(默認500 )

2.?Lacking:資源不足暫時等待的Job(默認2min)

3. Restarting:失敗重試的Job(默認2min )

4. Finshed、FailedCanceled、Killed:結束狀態(tài)

pYYBAGKhzcCATMO_AADlEQhvU2I219.png

Taier的整個控制臺設計分為公共組件、調度組件、存儲組件和計劃組件。通過一個租戶ID,拿到這個集群下common, YARN-conf等的四個配置信息,組成包含一個任務插件所有信息的pluginlnfo。將它解析之后,一些資源初始化上傳,以便我們緩存對應的客戶端。?

poYBAGKhzcKAe_HOAAEILxVE-JE322.png

Taier Client Plugin這里,要快速開發(fā)一個插件要注意以下幾點:

  • 一種任務類型對應一個插件,即一個jar包

  • 自定義類加載器(Classloader) 破壞雙親委派優(yōu)先加載( Child-First)插件

  • 插件實現(xiàn)IClient接口方法

  • SPI: 在classpath 下的META-INF/services/目錄下,創(chuàng)建以接口IClient 全限定名命名的文件,內容是上一步中實現(xiàn)類的全限定名

poYBAGKhzcOANQdAAAEP79vEVRQ798.png

?

?

?

?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

请按住滑块,拖动到最右边
了解新功能

查看更多

广告

下載排行

本周

  1. 1PC212線性恒流LED驅動芯片中文手冊
  2. 1.08 MB   |  3次下載  |  免費
  3. 2Python從入門到精通背記手冊
  4. 18.77 MB   |  3次下載  |  1 積分
  5. 3SW6306V AACC四口多協(xié)議升降壓移動電源SOC中文手冊
  6. 1.20 MB   |  2次下載  |  1 積分
  7. 4LT8822SS共漏N溝道增強型場效應晶體管規(guī)格書
  8. 1.22 MB   |  1次下載  |  免費
  9. 5實際測量三相直流無刷電機反電動勢波形(可下載)
  10. 1.03 MB  |  1次下載  |  免費
  11. 6直流無刷電機SPWM正弦波控制原理(可下載)
  12. 619.62 KB  |  1次下載  |  免費
  13. 7HT7712 4.5V~18V輸入,2.5A同步降壓變換器中文手冊
  14. 1.27 MB   |  1次下載  |  免費
  15. 8單電源板1875電路圖
  16. 0.06 MB   |  1次下載  |  免費

本月

  1. 1EN60335-1安規(guī)標準 中文版本
  2. 1.86 MB   |  54次下載  |  1 積分
  3. 2DeepSeek從入門到精通
  4. 5.07 MB   |  49次下載  |  免費
  5. 3第十一屆 藍橋杯 單片機設計與開發(fā)項目 省賽 程序設計試題及源碼
  6. 90.88KB   |  23次下載  |  3 積分
  7. 4NR-E531TX-XN冰箱說明書
  8. 8.64 MB   |  23次下載  |  免費
  9. 5STM32單片機無人機設計
  10. 8.81 MB   |  11次下載  |  免費
  11. 6華為硬件工程師手冊目前最全版本
  12. 1.02 MB   |  10次下載  |  2 積分
  13. 7OV9734數(shù)據(jù)手冊
  14. 7.42 MB   |  6次下載  |  5 積分
  15. 8MAX9295電路圖
  16. 0.14 MB   |  6次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935126次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
  4. 1.48MB  |  420063次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233088次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191377次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183336次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81584次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73814次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65988次下載  |  10 積分