0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云計算環(huán)境中流行的大數(shù)據(jù)框架介紹

h1654155282.3538 ? 來源:全球物聯(lián)網(wǎng)資訊 ? 作者:全球物聯(lián)網(wǎng)資訊 ? 2021-01-09 11:35 ? 次閱讀

在本文中,我們將介紹云計算環(huán)境中流行的大數(shù)據(jù)框架,并確定這些大數(shù)據(jù)框架的某些屬性,并探討與之相關(guān)的一些最大障礙和問題。本文將按資源管理大數(shù)據(jù)框架的主要屬性進行分類,將它們與具有類似性質(zhì)的其他框架進行比較,并提出與使用它們相關(guān)的推薦最佳實踐。

介紹

盡管遷移到云計算的好處是眾所周知的,但在大數(shù)據(jù)分析的背景下,其好處更為明顯。大數(shù)據(jù)所固有的是使用PB(即將成為EB和ZB)數(shù)據(jù)。業(yè)務(wù)分析要求使用數(shù)據(jù)密集型應(yīng)用程序,而云環(huán)境的可伸縮性對于使它們的部署可行是必不可少的。利用云還可以促進整個組織之間更輕松的協(xié)作和連接,簡化數(shù)據(jù)共享并授予更多員工訪問相關(guān)分析的權(quán)限。

IT領(lǐng)導(dǎo)者當然認識到將大數(shù)據(jù)轉(zhuǎn)移到云中的好處,但是要讓主要利益相關(guān)者和高層管理人員購買該概念會更加復(fù)雜。但是,利用云和大數(shù)據(jù)的組合確實具有商業(yè)上的實際意義,因為它將允許對業(yè)務(wù)進行優(yōu)化查看,并將促進基于相關(guān)數(shù)據(jù)的決策。

例如,生產(chǎn)實物產(chǎn)品公司的首席運營官可以極大地受益于訪問有關(guān)供應(yīng)鏈優(yōu)化的數(shù)據(jù)以及跟蹤缺陷的有效機制。同樣,尋求提高客戶忠誠度和參與度的CMO,以及尋求增加收入,降低成本和進行戰(zhàn)略投資的新途徑的CFO,也都依賴數(shù)據(jù)來制定決策。無論從哪個角度來看,基于云的敏捷平臺和大數(shù)據(jù)的利用將驅(qū)動貴公司的運營和實現(xiàn)目標。

如2020-2025年大數(shù)據(jù)市場報告所述,全球大數(shù)據(jù)市場規(guī)模將從2020年的1389億美元增加到2025年的2294億美元。

pIYBAF_5JJKAFn_yAAFWpdEac1E844.png

大數(shù)據(jù)和云計算的歷史

龐大的分析項目高度依賴有效的資源管理,因為數(shù)據(jù)平臺利用大量可視化的硬件資源來降低成本并優(yōu)化結(jié)果。架構(gòu)的復(fù)雜性使得這種管理或資源具有挑戰(zhàn)性。因此,應(yīng)認真考慮將要處理多少數(shù)據(jù),并設(shè)計出既有利于當前應(yīng)用,又有利于未來應(yīng)用的最佳性能的體系結(jié)構(gòu)。

直到最近,網(wǎng)格,計算機集群和其他高性能超級計算機仍被用作高計算項目的資源。群集計算是

此類框架的主要環(huán)境。網(wǎng)格計算環(huán)境(或其他分布式HPC環(huán)境)中的虛擬組織管理專用于應(yīng)用程序需求的資源(外部和內(nèi)部),盡管近年來有關(guān)將此執(zhí)行轉(zhuǎn)移到云的討論一直是討論的熱門話題。出于安全原因,吸引本地存儲敏感數(shù)據(jù)不足為奇,但是當存儲量變得無法內(nèi)部存儲(例如企業(yè)中的數(shù)據(jù))時,組織發(fā)現(xiàn)必須遷移到云存儲解決方案。

盡管云計算可能是增長大數(shù)據(jù)的核心,但是針對大數(shù)據(jù)應(yīng)用程序的基于云的解決方案與常見的解決方案有很大不同。傳統(tǒng)的云解決方案提供了一些松散相關(guān)的應(yīng)用程序,其細粒度的體系結(jié)構(gòu)旨在為大量用戶提供服務(wù)。這些用戶通常在不同的位置獨立運行,并且通常擁有非共享或私有數(shù)據(jù)。該數(shù)據(jù)可能主要是面向批處理的,并且包含許多交互。通常會對其進行重新定位,以適應(yīng)高度動態(tài)的資源需求。話雖如此,大數(shù)據(jù)與常規(guī)擴展解決方案共享一些共同的屬性,以及對資源自動管理的要求。

云計算企業(yè)的成長和成熟正在完善和改善云環(huán)境,以使其更加敏捷和高效。云提供商也在擴展其服務(wù),其中通常包括數(shù)據(jù)湖架構(gòu)。該平臺提供了增強的生產(chǎn)力套件,可用于BI,云操作,數(shù)據(jù)庫,OLAP,數(shù)據(jù)倉庫和其他開發(fā)工具。

大數(shù)據(jù)云計算中的資源管理框架

已經(jīng)在不同的應(yīng)用領(lǐng)域中使用了各種計算基礎(chǔ)結(jié)構(gòu),以利用商品計算資產(chǎn)以批處理模式處理大型數(shù)據(jù)庫。在這里,我們旨在探索云計算環(huán)境中使用的一些流行的大數(shù)據(jù)資源管理框架。下圖有助于直觀地繪制出大數(shù)據(jù)管理結(jié)構(gòu)樣式的分類。

pIYBAF_5JJeABInBAAFbiHTZ07M784.png

比較大數(shù)據(jù)框架

當代企業(yè),研究社區(qū)和IT行業(yè)都在感受到大數(shù)據(jù)云計算的影響,涌現(xiàn)出一些變革性和顛覆性的大數(shù)據(jù)解決方案和技術(shù),以促進許多企業(yè)的創(chuàng)新和數(shù)據(jù)驅(qū)動的運營決策?,F(xiàn)代數(shù)據(jù)云計算服務(wù)提供了基礎(chǔ)架構(gòu),技術(shù)和大數(shù)據(jù)分析,可幫助加快大數(shù)據(jù)分析的步伐并降低其成本。

盡管有許多選項可用,但關(guān)鍵在于選擇最適合特定業(yè)務(wù)的框架。這種選擇往往會歸結(jié)為應(yīng)用需求,并權(quán)衡每種情況的優(yōu)點和缺點。其中許多是基于應(yīng)用程序使用場景的,并且可能涉及一些折衷。在云中部署大數(shù)據(jù)應(yīng)用程序之前,需要確定幾個關(guān)鍵因素。現(xiàn)在,我們將討論選擇每種主要管理框架類型的利弊。

1.處理速度

在評估不同資源管理結(jié)構(gòu)的功效時,處理速度是一項重要的性能衡量工具,它基于對內(nèi)存或磁盤的數(shù)據(jù)傳輸讀寫(I / O)的便利性。它還測量特定時間段內(nèi)兩個通信單元之間的數(shù)據(jù)傳輸速率。有理由認為某些資源管理框架會表現(xiàn)更好。但是,研究發(fā)現(xiàn),盡管某些框架在執(zhí)行較小的任務(wù)時表現(xiàn)出更好的性能,但其他框架在處理更大的數(shù)據(jù)源集時卻要快得多。但是,隨著數(shù)據(jù)集輸入的增加,所有框架的“加速”比率都降低了。

2.容錯

測量一個組件發(fā)生故障時系統(tǒng)的其余部分如何繼續(xù)運行稱為容錯。在高性能計算系統(tǒng)中執(zhí)行特定任務(wù)時,將評估數(shù)百個錯綜復(fù)雜的互連節(jié)點。一個導(dǎo)致失敗的結(jié)果應(yīng)該對整個計算的影響很小或沒有影響。一些框架比其他框架具有更高的容錯能力,其中某些框架在涉及大量數(shù)據(jù)傳輸?shù)那闆r下會超出容錯范圍。使用PageRank算法進行的研究已用于對多種框架的性能進行實驗,發(fā)現(xiàn)在較小的數(shù)據(jù)集中,性能可以很好地衡量,但是隨著數(shù)據(jù)集的增長,“加速”性能下降。某些數(shù)據(jù)集可能變得如此之大,以至于某些系統(tǒng)無法處理它們而不會崩潰。

3.可擴展性

企業(yè)依靠及時處理數(shù)據(jù)來解決高價值業(yè)務(wù)問題。通過能夠同時大規(guī)模執(zhí)行多個計算,可以減少與業(yè)務(wù)相關(guān)的計算的工作量,總體時間和復(fù)雜性。通過在運行時分配額外的資源來適應(yīng)大負載或工作量(或大小)變化的情況稱為可伸縮性??缮炜s性可用于增加所需的資源(按比例放大)或減少所需的資源(按比例縮小)。因此,可伸縮性涉及將多個條件組合到單個算法中。研究表明,框架也可以在不同級別上產(chǎn)生可伸縮的性能。

4.安全性

大多數(shù)大數(shù)據(jù)應(yīng)用程序都不再使用內(nèi)部數(shù)據(jù)存儲,而是選擇遷移到云環(huán)境中,使不同的用戶可以訪問或記錄相同的隱私,從而輕松獲得信息。數(shù)據(jù)完整性和安全性一直是最重要的,但是隨著大數(shù)據(jù)平臺廣泛采用云計算服務(wù),這一方面會進一步擴大。由于暴露給出于自身原因而尋求數(shù)據(jù)的多個用戶,這反過來又增加了數(shù)據(jù)所面臨的隱私和安全性的風(fēng)險級別。

安全性分為幾類,每一種都需要通過各種級別的加密對身份驗證和授權(quán)進行不同級別的訪問。某些框架在其訪問示意圖中使用加密機制,而其他框架則允許對其訪問和加密進行密碼控制。盡管如此,其他人仍未提供任何系統(tǒng)級內(nèi)置安全性。

結(jié)論

在速度和數(shù)據(jù)量方面的增長速度可能是驚人的,特別是對于年輕的組織。但是,利用云計算可以從根本上改變?nèi)魏芜\營的效率和數(shù)據(jù)驅(qū)動的組織。

您的組織是否已將大數(shù)據(jù)遷移到云?我們很想聽聽此舉如何影響您的數(shù)據(jù)分析質(zhì)量和速度。請與我們分享這如何幫助您改善組織運作。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7835

    瀏覽量

    137518
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8895

    瀏覽量

    137503
收藏 人收藏

    評論

    相關(guān)推薦

    計算環(huán)境下的IP地址分配方式

    之前我們聊過在計算環(huán)境下IP地址的分配方式,但在計算環(huán)境下,IP地址的分配方式更加靈活,可以根據(jù)實際需求進行配置,用來滿足不同企業(yè)和應(yīng)用
    的頭像 發(fā)表于 12-19 14:02 ?160次閱讀

    人工智能計算大數(shù)據(jù)三者關(guān)系

    人工智能、計算大數(shù)據(jù)之間的關(guān)系是緊密相連、相互促進的。大數(shù)據(jù)為人工智能提供了豐富的訓(xùn)練資源和驗證環(huán)境
    的頭像 發(fā)表于 11-06 10:03 ?465次閱讀

    計算數(shù)據(jù)中心的關(guān)系

    設(shè)備,以及冗余的數(shù)據(jù)通信連接、環(huán)境控制設(shè)備、監(jiān)控設(shè)備和各種安全裝置。數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),基于互聯(lián)網(wǎng)的相關(guān)服務(wù)增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源。
    的頭像 發(fā)表于 10-24 16:15 ?474次閱讀

    邊緣計算計算的區(qū)別

    邊緣計算計算是兩種不同的計算模式,它們在計算資源的分布、應(yīng)用場景和特點上存在顯著差異。以下是對兩者的對比: 一、
    的頭像 發(fā)表于 10-24 14:08 ?451次閱讀

    計算遷移的步驟與注意事項

    計算遷移是一個復(fù)雜且關(guān)鍵的過程,需要細致的規(guī)劃和執(zhí)行。以下是計算遷移的一般步驟及注意事項: 一、
    的頭像 發(fā)表于 10-24 09:20 ?622次閱讀

    計算與邊緣計算的結(jié)合

    計算與邊緣計算的結(jié)合是當前信息技術(shù)發(fā)展的重要趨勢,這種結(jié)合能夠充分發(fā)揮兩者的優(yōu)勢,實現(xiàn)更高效、更可靠的數(shù)據(jù)處理和分析。以下是對
    的頭像 發(fā)表于 10-24 09:19 ?588次閱讀

    計算大數(shù)據(jù)分析中的應(yīng)用

    計算大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲、計算、分析和預(yù)測的強大能力。以下是對計算
    的頭像 發(fā)表于 10-24 09:18 ?499次閱讀

    計算的優(yōu)勢與應(yīng)用

    計算是一種基于互聯(lián)網(wǎng)的計算方式,通過互聯(lián)網(wǎng)將算力以按需使用、按量付費的形式提供給用戶,包括計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫、
    的頭像 發(fā)表于 10-24 09:12 ?572次閱讀

    數(shù)據(jù)輕松上——明達Mbox邊緣計算網(wǎng)關(guān)

    隨著工業(yè)4.0時代的到來,工廠數(shù)字化轉(zhuǎn)型已成為提升生產(chǎn)效率、優(yōu)化資源配置、增強企業(yè)競爭力的關(guān)鍵。明達技術(shù)憑借其先進的邊緣計算網(wǎng)關(guān)與平臺技術(shù),為工廠提供了高效、穩(wěn)定的數(shù)據(jù)采集與上解決
    的頭像 發(fā)表于 10-18 16:47 ?200次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>輕松上<b class='flag-5'>云</b>——明達Mbox邊緣<b class='flag-5'>計算</b>網(wǎng)關(guān)

    物聯(lián) 智慧電梯數(shù)據(jù)先行:電梯大數(shù)據(jù)平臺構(gòu)建安全生態(tài)

    在現(xiàn)代化城市的摩天大樓中,電梯作為垂直交通的動脈,其安全性與效率直接關(guān)系到居民的生活質(zhì)量和社會運行的順暢。隨著物聯(lián)網(wǎng)、大數(shù)據(jù)計算等技術(shù)的飛速發(fā)展,智慧電梯的概念應(yīng)運而生,而梯物聯(lián)
    的頭像 發(fā)表于 08-23 09:57 ?401次閱讀

    如何理解計算?

    和硬件資源。 在數(shù)字化時代,互聯(lián)網(wǎng)已經(jīng)成為基礎(chǔ)設(shè)施。計算使得數(shù)據(jù)中心能夠像一臺計算機一樣去工作。通過互聯(lián)網(wǎng)將算力以按需使用、按量付費的形式提供給用戶,包括:
    發(fā)表于 08-16 17:02

    淺談存內(nèi)計算生態(tài)環(huán)境搭建以及軟件開發(fā)

    環(huán)境搭建 (一)背景介紹 存內(nèi)計算環(huán)境搭建是一種高效的數(shù)據(jù)處理方法,它涉及在計算機內(nèi)存中配置和管
    發(fā)表于 05-16 16:40

    分布式運維管理平臺在計算環(huán)境中的實施案例分析

    一、案例背景 隨著計算技術(shù)的快速發(fā)展,越來越多的企業(yè)開始將業(yè)務(wù)遷移到上,以實現(xiàn)資源的靈活調(diào)配和成本的降低。然而,計算
    的頭像 發(fā)表于 03-26 16:16 ?565次閱讀

    基于物聯(lián)網(wǎng)、大數(shù)據(jù)、計算等現(xiàn)代信息技術(shù)高速公路智慧消防平臺解決方案

    安科瑞 程瑜 系統(tǒng)簡介 1、概述 智慧消防平臺基于物聯(lián)網(wǎng)、大數(shù)據(jù)、計算等現(xiàn)代信息技術(shù),將分散的火災(zāi)自動報警設(shè)備、電氣火災(zāi)監(jiān)控設(shè)備、智慧煙感探測器、智慧消防用水等設(shè)備連接形成網(wǎng)絡(luò),并
    的頭像 發(fā)表于 03-15 14:20 ?442次閱讀
    基于物聯(lián)網(wǎng)、<b class='flag-5'>大數(shù)據(jù)</b>、<b class='flag-5'>云</b><b class='flag-5'>計算</b>等現(xiàn)代信息技術(shù)高速公路智慧消防平臺解決方案

    阿里在海外市場發(fā)布一系列AI大數(shù)據(jù)產(chǎn)品

    近日,阿里宣布面向海外市場發(fā)布一系列AI計算大數(shù)據(jù)產(chǎn)品,進一步擴大其在全球市場的份額。這一系列新產(chǎn)品涵蓋了serverless模式的AI服務(wù)平臺、整合向量引擎技術(shù)的大數(shù)據(jù)產(chǎn)品等,旨
    的頭像 發(fā)表于 02-05 11:30 ?1078次閱讀