0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)分析技術(shù)架構(gòu)的通用模塊

h1654155282.3538 ? 來源:加米谷大數(shù)據(jù)張衡 ? 作者:加米谷大數(shù)據(jù)張衡 ? 2020-10-29 15:13 ? 次閱讀

對(duì)于企業(yè)而言,坐擁龐大的數(shù)據(jù)資源,想要實(shí)現(xiàn)大數(shù)據(jù)分析,首要的就是要搭建起自身的大數(shù)據(jù)系統(tǒng)平臺(tái),而每個(gè)公司都有自己特定的業(yè)務(wù)場景,因此在大數(shù)據(jù)平臺(tái)上的需求是不一樣的。今天我們僅從通用的角度,來聊聊大數(shù)據(jù)分析需要什么技術(shù)架構(gòu)?

我們熟悉的以BAT為首的互聯(lián)網(wǎng)大廠,都擁有自身的大數(shù)據(jù)系統(tǒng)平臺(tái),但是各自面臨的業(yè)務(wù)場景是不同的,比如說騰訊,主要是社交業(yè)務(wù)場景;百度,主要是搜索業(yè)務(wù)場景;而阿里,主要是電商業(yè)務(wù)場景。

這樣不同的業(yè)務(wù)場景下,需要根據(jù)實(shí)際的業(yè)務(wù)需求,選擇適合自己的技術(shù)框架,來搭建自己的大數(shù)據(jù)架構(gòu)體系。但是從技術(shù)架構(gòu)體系的共性來說,是可以從通用的技術(shù)模塊去理解,來幫助我們更好地學(xué)習(xí)和掌握大數(shù)據(jù)技術(shù)架構(gòu)的。

數(shù)據(jù)收集模塊:主要負(fù)責(zé)收集各種數(shù)據(jù)源的數(shù)據(jù),包括日志文件、網(wǎng)絡(luò)請(qǐng)求、數(shù)據(jù)庫、消息隊(duì)列等,并將這些數(shù)據(jù)轉(zhuǎn)換為文件或者消息向后傳遞。

數(shù)據(jù)轉(zhuǎn)存模塊:主要負(fù)責(zé)將數(shù)據(jù)定時(shí)傳遞到分布式存儲(chǔ)或者實(shí)時(shí)傳遞給下游的數(shù)據(jù)處理程序。

ETL模塊:主要負(fù)責(zé)數(shù)據(jù)的清洗、格式和內(nèi)容的處理和轉(zhuǎn)換、數(shù)據(jù)分級(jí)分揀、加載至數(shù)據(jù)倉庫等。

數(shù)據(jù)倉庫模塊:這是整個(gè)架構(gòu)的核心,數(shù)據(jù)倉庫是數(shù)據(jù)有組織的集中存儲(chǔ)的地方,負(fù)責(zé)數(shù)據(jù)的存取和管理。

元數(shù)據(jù)管理模塊:主要負(fù)責(zé)記錄和約束數(shù)據(jù)倉庫中數(shù)據(jù)的含義和格式,控制著數(shù)據(jù)的生命周期和數(shù)據(jù)質(zhì)量。

分析引擎模塊:數(shù)據(jù)分析師交互最多的模塊,主要負(fù)責(zé)執(zhí)行各種分析語句或代碼,完成各種分析任務(wù)。

作業(yè)管理與調(diào)度模塊:負(fù)責(zé)分析作業(yè)的管理和定時(shí)調(diào)度,包括作業(yè)的增刪改查、查看修改歷史、設(shè)置調(diào)度定時(shí)和執(zhí)行引擎等。

資源分配與調(diào)度模塊:主要負(fù)責(zé)在多作業(yè)同時(shí)運(yùn)行的場景下,有效協(xié)調(diào)和分配集群的資源,使資源利用率最大化。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關(guān)系

    在當(dāng)今這個(gè)信息爆炸的時(shí)代,數(shù)據(jù)無處不在。無論是企業(yè)運(yùn)營、科學(xué)研究還是個(gè)人決策,我們都需要從海量的數(shù)據(jù)中提取有價(jià)值的信息。數(shù)據(jù)分析數(shù)據(jù)可視化作為兩個(gè)關(guān)鍵的工具,它們幫助我們理解、解釋和
    的頭像 發(fā)表于 12-06 17:09 ?341次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關(guān)鍵工具。數(shù)據(jù)科學(xué)家和分析師需要從海量數(shù)據(jù)中提取有價(jià)值的信息,以支持業(yè)務(wù)決策。在這個(gè)過
    的頭像 發(fā)表于 11-19 15:35 ?283次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    的具體應(yīng)用: 一、提高性能 并行讀寫 :RAID技術(shù)通過并行讀寫多個(gè)磁盤,可以顯著提高數(shù)據(jù)的讀寫速度。在大數(shù)據(jù)分析環(huán)境中,數(shù)據(jù)讀寫速度是影響分析
    的頭像 發(fā)表于 11-12 09:44 ?251次閱讀

    emc技術(shù)大數(shù)據(jù)分析中的角色

    大數(shù)據(jù)分析通常涉及來自多個(gè)來源和格式的數(shù)據(jù)。這些數(shù)據(jù)可能包括結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫中的表格數(shù)據(jù)
    的頭像 發(fā)表于 11-01 15:22 ?282次閱讀

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲(chǔ)、計(jì)算、分析和預(yù)測的強(qiáng)大能力。以下是對(duì)云計(jì)算在大數(shù)據(jù)分析中應(yīng)用的介紹: 一、存儲(chǔ)和處理海量數(shù)據(jù) 云計(jì)算提供了強(qiáng)大的存儲(chǔ)和計(jì)算能力
    的頭像 發(fā)表于 10-24 09:18 ?456次閱讀

    IP 地址大數(shù)據(jù)分析如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    一、大數(shù)據(jù)分析在網(wǎng)絡(luò)優(yōu)化中的作用 1.流量分析 大數(shù)據(jù)分析可以對(duì)網(wǎng)絡(luò)中的流量進(jìn)行實(shí)時(shí)監(jiān)測和分析,了解網(wǎng)絡(luò)的使用情況和流量趨勢。通過對(duì)流量數(shù)據(jù)
    的頭像 發(fā)表于 10-09 15:32 ?235次閱讀
    IP 地址<b class='flag-5'>大數(shù)據(jù)分析</b>如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    數(shù)據(jù)分析除了spss還有什么

    數(shù)據(jù)分析是當(dāng)今世界中一個(gè)非常重要的領(lǐng)域,它涉及到從大量數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)模式和趨勢,并為決策提供支持。SPSS(Statistical Package for the Social
    的頭像 發(fā)表于 07-05 15:01 ?624次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個(gè)涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個(gè)過程中,使用正確的工具至關(guān)重要。以下是一些主要的數(shù)據(jù)分析工具,以及它們的功能和用途的介紹。 Excel Exc
    的頭像 發(fā)表于 07-05 14:54 ?858次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價(jià)值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性分析、診斷性
    的頭像 發(fā)表于 07-05 14:51 ?585次閱讀

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的
    的頭像 發(fā)表于 07-02 11:22 ?631次閱讀

    大數(shù)據(jù)分析平臺(tái)網(wǎng)站

    大數(shù)據(jù)分析平臺(tái)是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價(jià)值的信息和洞察。以下是大數(shù)據(jù)分析平臺(tái)的主要功能和應(yīng)用場景: 主
    的頭像 發(fā)表于 06-28 15:46 ?668次閱讀

    求助,關(guān)于AD采集到的數(shù)據(jù)分析問題

    問題描述:使用AD采集一個(gè)10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時(shí)間,幅值和占空比。 備注:在分析的時(shí)候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    態(tài)勢數(shù)據(jù)分析系統(tǒng)軟件

    智慧華盛恒輝態(tài)勢分析軟件系統(tǒng)的功能描述、部署環(huán)境、界面使用、技術(shù)支持及一些常見問題及其解決辦法等。為數(shù)據(jù)態(tài)勢分析軟件系統(tǒng)的管理人員和使用人員提供說明。 智慧華盛恒輝態(tài)勢
    的頭像 發(fā)表于 04-22 11:36 ?450次閱讀

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放 隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場需求,而大數(shù)據(jù)分析則為廣告投放帶來了精準(zhǔn)、高效
    的頭像 發(fā)表于 04-11 11:23 ?954次閱讀

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)有哪些

    的核心技術(shù),包括數(shù)據(jù)采集、存儲(chǔ)與管理、處理與分析等方面。 一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景 隨著互聯(lián)網(wǎng)
    的頭像 發(fā)表于 01-31 11:07 ?3468次閱讀