0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)計(jì)算框架簡(jiǎn)介

RG15206629988 ? 來(lái)源:行業(yè)學(xué)習(xí)與研究 ? 2023-03-20 11:46 ? 次閱讀

一、Hadoop框架

Hadoop是目前世界上應(yīng)用最廣泛的大數(shù)據(jù)工具。Hadoop具有高容錯(cuò)率,且其硬件價(jià)格低,可以使用普通PC服務(wù)器(個(gè)人理解:普通PC服務(wù)器的具體形式包括個(gè)人計(jì)算機(jī)等)構(gòu)成大數(shù)據(jù)集群。

Hadoop的Map和Reduce函數(shù)(Map和Reduce函數(shù)是大數(shù)據(jù)主要編程模型)的計(jì)算模式簡(jiǎn)潔,且開(kāi)發(fā)人員可以通過(guò)多種編程語(yǔ)言編寫(xiě)Map和Reduce函數(shù)。Hadoop的生態(tài)圈(個(gè)人理解:此處的生態(tài)圈指可以使用Hadoop的開(kāi)發(fā)工具集合)包含大量算法和組件。

Hadoop的數(shù)據(jù)吞吐量超過(guò)其他大數(shù)據(jù)計(jì)算框架,但速度稍慢于其他大數(shù)據(jù)計(jì)算框架。

二、Storm框架

Storm框架采用的是流計(jì)算框架(根據(jù)網(wǎng)絡(luò)資料理解:流計(jì)算框架可處理實(shí)時(shí)且持續(xù)進(jìn)入流計(jì)算框架數(shù)據(jù)的計(jì)算),也可被稱為實(shí)時(shí)大數(shù)據(jù)處理框架,在數(shù)據(jù)處理延時(shí)(根據(jù)網(wǎng)絡(luò)資料理解:數(shù)據(jù)處理延遲的原因是存儲(chǔ)或檢索數(shù)據(jù)包需要時(shí)間)方面具有較大優(yōu)勢(shì)。

但Storm框架只能進(jìn)行數(shù)據(jù)處理,不能進(jìn)行數(shù)據(jù)存儲(chǔ),因此,Storm框架需借助Hadoop框架的HDFS(分布式文件系統(tǒng))存儲(chǔ)數(shù)據(jù)。

Storm框架由Twitter(推特)開(kāi)發(fā),為開(kāi)源框架,并托管于GitHub(根據(jù)百度百科:GitHub是一個(gè)面向開(kāi)源及私有軟件項(xiàng)目的托管平臺(tái)),Storm框架可被免費(fèi)使用。Storm框架支持的編程語(yǔ)言包括:Java、Ruby、Python

三、Spark框架

Spark框架包含實(shí)時(shí)流處理工具,Spark框架沒(méi)有存儲(chǔ)數(shù)據(jù)功能。Spark框架可以與Hadoop框架集成,代替Hadoop框架的Map和Reduce函數(shù);也可以將Spark框架單獨(dú)部署集群(根據(jù)網(wǎng)絡(luò)資料理解:部署集群的含義是在集群內(nèi)的所有電腦或服務(wù)器中安裝同一應(yīng)用),但需要借助HDFS等分布式存儲(chǔ)系統(tǒng)存儲(chǔ)數(shù)據(jù)。

Spark框架是基于內(nèi)存的框架,因此,Spark框架的運(yùn)算速度快,其速度約為Hadoop框架的100倍。

四、Flink框架

(1)與Spark框架相同,F(xiàn)link框架也是基于內(nèi)存的實(shí)時(shí)計(jì)算框架。

(2)Flink框架的數(shù)據(jù)處理速度快于Spark框架的數(shù)據(jù)處理速度。Flink框架支持毫秒級(jí)的流計(jì)算,Spark框架支持秒級(jí)的流計(jì)算。

(3)相比于Spark框架,F(xiàn)link框架與Hadoop框架具有更好的兼容性。

(4)Flink框架支持API(根據(jù)百度百科理解:API一般指應(yīng)用程序編程接口,可將此處接口理解為服務(wù)的傳遞者。API可使開(kāi)發(fā)人員訪問(wèn)其他系統(tǒng)對(duì)外提供的功能接口或服務(wù),且開(kāi)發(fā)人員無(wú)需訪問(wèn)該功能接口或服務(wù)的源代碼或理解該功能接口或服務(wù)的內(nèi)部工作機(jī)制細(xì)節(jié))接口數(shù)量與Spark框架支持API接口數(shù)量相近(此句由網(wǎng)絡(luò)資料總結(jié)),但Flink框架對(duì)SQL的支持相較于Spark框架對(duì)SQL的支持較差。

f5c86d02-c3f1-11ed-bfe3-dac502259ad0.png

圖片來(lái)源:網(wǎng)絡(luò)資料

(5)因?yàn)镕link框架較新,使用Flink框架的開(kāi)發(fā)人員較少,所以Flink框架的社區(qū)活躍度低于Spark框架,即有關(guān)Spark框架的問(wèn)題更容易得到解答。

五、Yarn架構(gòu)

Yarn架構(gòu)屬于Hadoop2.0的分支。如圖一所示,Yarn架構(gòu)處于HDFS和MapReduce之間。

f5e40e04-c3f1-11ed-bfe3-dac502259ad0.png

圖一,圖片來(lái)源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》

Yarn架構(gòu)主要由ResourceManager、NodeManager、ApplicationMaster(根據(jù)網(wǎng)絡(luò)資料:ApplicationMaster負(fù)責(zé)與ResourceManager協(xié)商資源,并與NodeManager協(xié)同來(lái)執(zhí)行和監(jiān)控Container) 、Container(根據(jù)網(wǎng)絡(luò)資料:Container可被理解為單個(gè)節(jié)點(diǎn)RAM、CPU、磁盤(pán)的集合)組件構(gòu)成。

Yarn架構(gòu)的結(jié)構(gòu)是master/slave結(jié)構(gòu)(master的中文含義是主人,slave的中文含義是奴隸,master/slave結(jié)構(gòu)即為主從結(jié)構(gòu))。如圖二所示,ResourceManager是master,即主節(jié)點(diǎn);NodeManager是slave,即從節(jié)點(diǎn)。

f5f66da6-c3f1-11ed-bfe3-dac502259ad0.png

圖二,圖片來(lái)源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • JAVA
    +關(guān)注

    關(guān)注

    19

    文章

    2980

    瀏覽量

    105720
  • PC服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    7609
  • 編程語(yǔ)言
    +關(guān)注

    關(guān)注

    10

    文章

    1952

    瀏覽量

    35279
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    16123
  • HDFS
    +關(guān)注

    關(guān)注

    1

    文章

    30

    瀏覽量

    9703

原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(21)——大數(shù)據(jù)計(jì)算框架簡(jiǎn)介

文章出處:【微信號(hào):行業(yè)學(xué)習(xí)與研究,微信公眾號(hào):行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    [5.1.1]--5-1大數(shù)據(jù)計(jì)算框架簡(jiǎn)介

    大數(shù)據(jù)
    jf_75936199
    發(fā)布于 :2023年03月14日 01:40:28

    大數(shù)據(jù)計(jì)算框架簡(jiǎn)介(1)#大數(shù)據(jù)分析

    大數(shù)據(jù)分析
    學(xué)習(xí)硬聲知識(shí)
    發(fā)布于 :2023年07月13日 18:14:55

    大數(shù)據(jù)計(jì)算框架簡(jiǎn)介(2)#大數(shù)據(jù)分析

    大數(shù)據(jù)分析
    學(xué)習(xí)硬聲知識(shí)
    發(fā)布于 :2023年07月13日 18:15:35

    計(jì)算、大數(shù)據(jù)處理技術(shù)交流

    計(jì)算大數(shù)據(jù)處理技術(shù)交流圖形圖像是數(shù)據(jù)處理量最大的版塊之一,也是當(dāng)今云計(jì)算的重要課題之一,圖形圖像處理大會(huì)給大家?guī)?lái)諸多名家方案,探究大數(shù)據(jù)
    發(fā)表于 09-16 14:18

    【GoKit申請(qǐng)】基于大數(shù)據(jù)和云計(jì)算的環(huán)境監(jiān)測(cè)系統(tǒng)

    申請(qǐng)理由:最近剛剛申請(qǐng)了一款物聯(lián)網(wǎng)的板子,而且項(xiàng)目的基本環(huán)境已經(jīng)搭建完畢了,目前云計(jì)算大數(shù)據(jù)都是潮流,所以現(xiàn)在準(zhǔn)備研究下云服務(wù),因?yàn)檎也坏胶玫闹С制脚_(tái),也就有點(diǎn)進(jìn)度很慢了,正好這里看到了這個(gè)板子
    發(fā)表于 11-02 10:47

    大數(shù)據(jù)運(yùn)用的技術(shù)

    大數(shù)據(jù)開(kāi)發(fā)的重要框架,其核心是HDFS和MapReduce,HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),MapReduce為海量的數(shù)據(jù)提供了計(jì)算,因此
    發(fā)表于 04-08 16:50

    大數(shù)據(jù)數(shù)據(jù)類型

    大數(shù)據(jù)不僅僅是一個(gè)數(shù)據(jù),它是大數(shù)據(jù)集的集合,不能使用傳統(tǒng)的計(jì)算技術(shù)來(lái)處理,宏觀上來(lái)講,它不僅包括需處理的數(shù)據(jù),還包括各種工具、技術(shù)和
    發(fā)表于 05-11 15:57

    2019國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)跟大數(shù)據(jù)一起賽跑大數(shù)據(jù)應(yīng)用云計(jì)算電子商務(wù)

    增長(zhǎng)2.3%。國(guó)家副***在全國(guó)人大二次會(huì)議上作***工作報(bào)告時(shí)說(shuō),要設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺(tái),在新一代移動(dòng)通信、大數(shù)據(jù)、云計(jì)算、新能源等方面趕超先進(jìn),引領(lǐng)未來(lái)產(chǎn)業(yè)發(fā)展。這是“大數(shù)據(jù)”首次進(jìn)入
    發(fā)表于 10-10 13:55

    DKHadoop大數(shù)據(jù)開(kāi)發(fā)框架的構(gòu)成模塊

    ,必然要回歸到大數(shù)據(jù)開(kāi)發(fā)所使用的框架! 國(guó)內(nèi)的大數(shù)據(jù)開(kāi)發(fā)起步較晚于國(guó)外,所有關(guān)于大數(shù)據(jù)大開(kāi)發(fā)的各種標(biāo)準(zhǔn)和規(guī)則都是采用國(guó)外的那一套。國(guó)內(nèi)做大數(shù)據(jù)
    發(fā)表于 10-19 15:12

    DKhadoop大數(shù)據(jù)平臺(tái)基礎(chǔ)框架方案概述

    也不是特別長(zhǎng)。僅以我熟悉的DKhadoop為例給大家分享一些小知識(shí),往對(duì)初學(xué)者有點(diǎn)小幫助就可以了。大數(shù)據(jù)平臺(tái)基礎(chǔ)框架是很多初學(xué)者必然要掌握的內(nèi)容,大數(shù)據(jù)太過(guò)抽象,有時(shí)候?qū)懛窒淼臅r(shí)候難免感覺(jué)寫(xiě)的很多困難
    發(fā)表于 10-31 13:58

    大數(shù)據(jù)應(yīng)用開(kāi)發(fā)如何入門(mén)需要知道這些

    `前幾天和三個(gè)學(xué)計(jì)算機(jī)專業(yè)的學(xué)生聊天時(shí)聊到了大數(shù)據(jù)開(kāi)發(fā)方面的話題,他們?nèi)齻€(gè)人中,有兩個(gè)已經(jīng)進(jìn)入企業(yè)開(kāi)始工作,另外一個(gè)還是大二學(xué)生,但已經(jīng)開(kāi)設(shè)了自己的工作室。他們都是從事程序開(kāi)發(fā)方面工作的。大數(shù)據(jù)開(kāi)發(fā)
    發(fā)表于 11-26 14:49

    大數(shù)據(jù)計(jì)算服務(wù)MaxCompute的使用教程

    阿里云大數(shù)據(jù)計(jì)算服務(wù)MaxCompute使用教程
    發(fā)表于 04-30 07:57

    大數(shù)據(jù)與云計(jì)算介紹

    大數(shù)據(jù)與云計(jì)算相關(guān)技術(shù)資料,值得擁有大數(shù)據(jù)與云計(jì)算
    發(fā)表于 03-24 16:54 ?0次下載

    基于大數(shù)據(jù)的流式計(jì)算

    流式計(jì)算大數(shù)據(jù)的一種重要計(jì)算模式,大數(shù)據(jù)流式計(jì)算已成為研究熱點(diǎn)。任務(wù)管理是大數(shù)據(jù)流式
    發(fā)表于 11-22 17:34 ?1次下載
    基于<b class='flag-5'>大數(shù)據(jù)</b>的流式<b class='flag-5'>計(jì)算</b>

    計(jì)算環(huán)境中流行的大數(shù)據(jù)框架介紹

    在本文中,我們將介紹云計(jì)算環(huán)境中流行的大數(shù)據(jù)框架,并確定這些大數(shù)據(jù)框架的某些屬性,并探討與之相關(guān)的一些最大障礙和問(wèn)題。本文將按資源管理
    的頭像 發(fā)表于 01-09 11:35 ?4156次閱讀
    云<b class='flag-5'>計(jì)算</b>環(huán)境中流行的<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>框架</b>介紹