資料介紹
軟件簡介
Taier是袋鼠云數(shù)棧大數(shù)據(jù)家族的開源項目之一 ,它是一個分布式可視化的DAG任務調度系統(tǒng),旨在降低ETL開發(fā)成本、提高大數(shù)據(jù)平臺穩(wěn)定性,讓大數(shù)據(jù)開發(fā)人員可以在Taier直接進行業(yè)務邏輯的開發(fā),而不用關心任務錯綜復雜的依賴關系與底層的大數(shù)據(jù)平臺的架構實現(xiàn),將工作的重心更多地聚焦在業(yè)務之中。
一、架構設計和功能詳解
在架構設計與功能特點上,Taier整體架構是使用插件式的開發(fā)模式,在任務開發(fā)下面有調度模塊和各項組件,也包括數(shù)棧開源家族的Chunjun等等。
(一)Taier功能特點
Taier的功能特點有下面幾個比較重要的方面:
1.任務類型:Spark SQL、數(shù)據(jù)同步(流計算任務);
2.控制臺:包括隊列管理、資源管理、多集群管理等;
3.運維中心:比如任務管理、周期調度、補數(shù)據(jù)等;
4.插件化開發(fā):具體包括 taier-plugin、、DatasourceX、Chunjun等幾個插件。
(二)Taier功能特征
隨著不斷更新完善,現(xiàn)在的Taier已經(jīng)具有以下的幾種特性:
1、拓展性
-
單點故障:去中心化的分布式模式
-
高可用方式:Zookeeper
-
過載處理∶分布式節(jié)點+兩級存儲策略+隊列機制。每個節(jié)點都可以處理任務調度與提交;任務多時會優(yōu)先緩存在內存隊列,超出可配置的隊列最大數(shù)量值后會全部落數(shù)據(jù)庫;任務處理以隊列方式消費,隊列異步從數(shù)據(jù)庫獲取可執(zhí)行實例
-
實戰(zhàn)檢驗:得到數(shù)百家企業(yè)客戶生產環(huán)境實戰(zhàn)檢驗
2、易用性
-
支持大數(shù)據(jù)作業(yè)Spark、Flink的調度;
-
支持眾多的任務類型,目前支持Spark SQL、Chunjun
-
可視化工作流配置︰支持封裝工作流、支持單任務運行,不必封裝工作流、支持拖拽模式繪制;
-
DAG監(jiān)控界面:運維中心、支持集群資源查看,了解當前集群資源的剩余情況、支持對調度隊列中的任務批量停止、任務狀態(tài)、任務類型、重試次數(shù)、任務運行機器、可視化變量等關鍵信息一目了然;
-
調度時間配置:可視化配置;
-
多集群連接:支持一套調度系統(tǒng)連接多套Hadoop集群。
3、多版本引擎
-
支持Spark 、Flink等引擎的多個版本共存,例如可同時支持Flink1.10、Flink1.12(后續(xù)開源)
-
Kerberos支持Spark、Flink
-
豐富,支持3種時間基準,且可以靈活設置輸出格式。
4、拓展性
-
設計之處就考慮分布式模式,目前支持整體Taier 水平擴容方式;調度能力也隨集群線性增長。
?
二、Taier重要概念
下面從原理和操作層面給大家進一步介紹Taier,還有一些具體概念的解釋。
(一)任務與實例
方便起見,數(shù)棧在Taier中提出“任務”和“實例”兩個概念,例如數(shù)據(jù)開發(fā)的數(shù)據(jù)同步這項工作稱之為“任務”,而已經(jīng)提交并且配置了周期屬性的任就稱之為“實例”。
(二)實例具體操作
在Taier中,實例有這幾種構建的方式:
1.基于Zookeeper選舉Master節(jié)點參與Job 實例構建,T+1構建JobGraph
2. JobGraph構建前check &clean DirtyData
3.依據(jù)Task、TaskTask的數(shù)據(jù)(JobGraph)生成Job .JobJob實例數(shù)據(jù)
4.Master節(jié)點控制實例數(shù)據(jù)的負載均衡持久化入數(shù)據(jù)庫
構建完畢后,實例處理的幾種方式如下圖所示:
其中:
1.三種任務類型:周期任務、補數(shù)據(jù)任務、重跑任務,統(tǒng)一調度方式
2. Job 優(yōu)先入隊列(1),隊列容量不足入DB (2)
3.當隊列容量空余時,異步線程從DB加載數(shù)據(jù)入隊列(3)
4. Job出隊列后進行任務提交
?
處理完成后,實例提交我們也做了思考,具體設計:
1.內存優(yōu)先級隊列,控制Job有序執(zhí)行
2.多線程并發(fā)提交(可配置)
3. Job 執(zhí)行超時判斷(可配置)
4. Job資源不足/失敗重試進入延遲隊列(可配置)﹔避免長時間占用提交權
?
Taier 的實例狀態(tài)大家主要應該關注標志停止的幾個,具體有下面幾種:
1.?WaitEngine:內存隊列中的Job、內存容量不足存儲在DB中的Job(默認500 )
2.?Lacking:資源不足暫時等待的Job(默認2min)
3. Restarting:失敗重試的Job(默認2min )
4. Finshed、Failed、Canceled、Killed:結束狀態(tài)
Taier的整個控制臺設計分為公共組件、調度組件、存儲組件和計劃組件。通過一個租戶ID,拿到這個集群下common, YARN-conf等的四個配置信息,組成包含一個任務插件所有信息的pluginlnfo。將它解析之后,一些資源初始化上傳,以便我們緩存對應的客戶端。?
Taier Client Plugin這里,要快速開發(fā)一個插件要注意以下幾點:
-
一種任務類型對應一個插件,即一個jar包
-
SPI: 在classpath 下的META-INF/services/目錄下,創(chuàng)建以接口IClient 全限定名命名的文件,內容是上一步中實現(xiàn)類的全限定名
?
?
?
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
- 基于Simulink的電子對抗分布式仿真系統(tǒng) 26次下載
- 異構環(huán)境下的多DAG任務調度算法綜述 13次下載
- 面向聯(lián)邦學習的分布式與隱私安全性綜述 3次下載
- 一種分布式網(wǎng)絡掃描架構和任務調度算法 19次下載
- 如何通過YARN設計分布式資源動態(tài)調度協(xié)同分配系統(tǒng) 12次下載
- 如何設計液壓式雙足機器人運動數(shù)據(jù)可視化系統(tǒng) 6次下載
- 分布式智能電網(wǎng)控制系統(tǒng)的設計與實現(xiàn) 2次下載
- 電力系統(tǒng)分布式經(jīng)濟調度 10次下載
- SCADA過程可視化系統(tǒng)用戶手冊 2次下載
- 分布式系統(tǒng)進程調度方法研究
- 基于GIS的配電網(wǎng)調度可視化研究 16次下載
- 三層分布式計算網(wǎng)格任務調度系統(tǒng) 25次下載
- 基于Multi-Agent的分布式測控系統(tǒng)任務調度算法
- 基于實數(shù)編碼免疫算法的分布式任務調度
- 基于擴展的隨機DAG的EST估算與任務調度
- 分布式SCADA系統(tǒng)的特點的組成 581次閱讀
- 任務調度系統(tǒng)設計的核心邏輯 935次閱讀
- 訊維分布式可視化控制系統(tǒng)的功能特點 500次閱讀
- Java手寫分布式鎖的實現(xiàn) 612次閱讀
- tldb提供分布式鎖使用方法 923次閱讀
- 訊維分布式智慧指揮系統(tǒng)有哪些“黑科技”? 633次閱讀
- 如何使用分布式存儲系統(tǒng)促進AI模型訓練 608次閱讀
- 利用NI VeriStand 2010實現(xiàn)分布式同步系統(tǒng)的設計 3437次閱讀
- 詳談分布式系統(tǒng)的定義及屬性 3897次閱讀
- 關于騰訊的開源分布式存儲系統(tǒng)DCache 2028次閱讀
- 分布式可視化管理系統(tǒng)的關鍵技術到底有哪些呢?詳細資料分析 7147次閱讀
- 存儲分布式系統(tǒng)中如何從CAP轉到PACELC 2780次閱讀
- AS:可視化的調試工具--FreeRTOS+Trace 6896次閱讀
- 深度解讀分布式存儲技術之分布式剪枝系統(tǒng) 1861次閱讀
- 基于CAN總線的分布式網(wǎng)架健康狀態(tài)監(jiān)測系統(tǒng)的設計 1027次閱讀
下載排行
本周
- 1PC212線性恒流LED驅動芯片中文手冊
- 1.08 MB | 3次下載 | 免費
- 2Python從入門到精通背記手冊
- 18.77 MB | 3次下載 | 1 積分
- 3SW6306V AACC四口多協(xié)議升降壓移動電源SOC中文手冊
- 1.20 MB | 2次下載 | 1 積分
- 4LT8822SS共漏N溝道增強型場效應晶體管規(guī)格書
- 1.22 MB | 1次下載 | 免費
- 5實際測量三相直流無刷電機反電動勢波形(可下載)
- 1.03 MB | 1次下載 | 免費
- 6直流無刷電機SPWM正弦波控制原理(可下載)
- 619.62 KB | 1次下載 | 免費
- 7HT7712 4.5V~18V輸入,2.5A同步降壓變換器中文手冊
- 1.27 MB | 1次下載 | 免費
- 8單電源板1875電路圖
- 0.06 MB | 1次下載 | 免費
本月
- 1EN60335-1安規(guī)標準 中文版本
- 1.86 MB | 54次下載 | 1 積分
- 2DeepSeek從入門到精通
- 5.07 MB | 49次下載 | 免費
- 3第十一屆 藍橋杯 單片機設計與開發(fā)項目 省賽 程序設計試題及源碼
- 90.88KB | 23次下載 | 3 積分
- 4NR-E531TX-XN冰箱說明書
- 8.64 MB | 23次下載 | 免費
- 5STM32單片機無人機設計
- 8.81 MB | 11次下載 | 免費
- 6華為硬件工程師手冊目前最全版本
- 1.02 MB | 10次下載 | 2 積分
- 7OV9734數(shù)據(jù)手冊
- 7.42 MB | 6次下載 | 5 積分
- 8MAX9295電路圖
- 0.14 MB | 6次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935126次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191377次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81584次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論