0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)的主要特征有哪些

汽車玩家 ? 來源:個(gè)人圖書館、百度服務(wù)商 ? 作者:個(gè)人圖書館、百度 ? 2022-02-07 10:43 ? 次閱讀

從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù),明白這一點(diǎn)至關(guān)重要,也正是這一點(diǎn)促使該技術(shù)具備走向眾多企業(yè)的潛力。

在萊尼的理論基礎(chǔ)上,IBM提出大數(shù)據(jù)的4V特征得到了業(yè)界的廣泛認(rèn)可:第一,數(shù)量,即數(shù)據(jù)巨大,從TB級(jí)別躍升到PB級(jí)別;第二,多樣性,即數(shù)據(jù)類型繁多,不僅包括傳統(tǒng)的格式化數(shù)據(jù),還包括來自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;第三,速度,即處理速度快;第四,真實(shí)性,即追求高質(zhì)量的數(shù)據(jù)。

數(shù)據(jù)體量巨大

容量大是大數(shù)據(jù)的首要特征,隨著網(wǎng)絡(luò)的發(fā)展,迫切的需要足夠大的容量去統(tǒng)計(jì)分析以及預(yù)測大規(guī)模的數(shù)據(jù)。最開始的mp3時(shí)代僅僅只是mb級(jí)的存儲(chǔ),但是已經(jīng)能滿足很多人的要求了。隨著信息技術(shù)的高度發(fā)展,存儲(chǔ)單位也慢慢的發(fā)生了演變。從大家耳熟能詳?shù)?**存儲(chǔ)到了tb存儲(chǔ),乃至現(xiàn)在有了pb,eb等存儲(chǔ)。

數(shù)據(jù)速度快

大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生、處理和分析的速度在持續(xù)加快。加速的原因是數(shù)據(jù)創(chuàng)建的實(shí)時(shí)性特點(diǎn),以及將流數(shù)據(jù)結(jié)合到業(yè)務(wù)流程和決策過程中的需求。數(shù)據(jù)處理速度快,處理模式已經(jīng)開始從批處理轉(zhuǎn)向流處理。業(yè)界對(duì)大數(shù)據(jù)的處理能力有一個(gè)稱謂——“1秒定律”,也就是說,可以從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息。大數(shù)據(jù)的快速處理能力充分體現(xiàn)出它與傳統(tǒng)的數(shù)據(jù)處理技術(shù)的本質(zhì)區(qū)別。

數(shù)據(jù)類型繁多

大數(shù)據(jù)的數(shù)據(jù)類型繁多,傳統(tǒng)IT產(chǎn)業(yè)產(chǎn)生和處理的數(shù)據(jù)類型較為單一,大部分是結(jié)構(gòu)化數(shù)據(jù)。隨著傳感器、智能設(shè)備、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動(dòng)計(jì)算、在線廣告等新的渠道和技術(shù)不斷涌現(xiàn),產(chǎn)生的數(shù)據(jù)類型無以計(jì)數(shù)。

現(xiàn)在的數(shù)據(jù)類型不再只是格式化數(shù)據(jù),更多的是半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù),如XML、郵件、博客、即時(shí)消息、視頻、照片、點(diǎn)擊流、日志文件等。企業(yè)需要整合、存儲(chǔ)和分析來自復(fù)雜的傳統(tǒng)和非傳統(tǒng)信息源的數(shù)據(jù),包括企業(yè)內(nèi)部和外部的數(shù)據(jù)。因?yàn)榇髷?shù)據(jù)的來源非常廣泛,所以多樣性成為了大數(shù)據(jù)的另一大特點(diǎn)。在任何形式下,所獲取的來源都是可以使用的,目前為止應(yīng)用比較廣泛的有淘寶,網(wǎng)易云,頭條等等。這些平臺(tái)通過對(duì)用戶的數(shù)據(jù)進(jìn)行分析,從而對(duì)應(yīng)的推薦一些用戶比較喜歡的東西。

真實(shí)性

數(shù)據(jù)的重要性就在于對(duì)決策的支持,數(shù)據(jù)的規(guī)模并不能決定其能否為決策提供幫助,數(shù)據(jù)的真實(shí)性和質(zhì)量才是獲得真知和思路最重要的因素,是制定成功決策最堅(jiān)實(shí)的基礎(chǔ)。追求高數(shù)據(jù)質(zhì)量是一項(xiàng)重要的大數(shù)據(jù)要求和挑戰(zhàn),即使最優(yōu)秀的數(shù)據(jù)清理方法也無法消除某些數(shù)據(jù)固有的不可預(yù)測性。

在處理這些類型的數(shù)據(jù)時(shí),數(shù)據(jù)清理無法修正這種不確定性,然而,盡管存在不確定性,數(shù)據(jù)仍然包含寶貴的信息。我們必須承認(rèn)、接受大數(shù)據(jù)的不確定性,并確定如何充分利用這一點(diǎn)。

文章整合自:個(gè)人圖書館、百度服務(wù)商點(diǎn)亮工場、螞蚜網(wǎng)

審核編輯:鄢孟繁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 格式化
    +關(guān)注

    關(guān)注

    2

    文章

    39

    瀏覽量

    9116
  • 智能設(shè)備
    +關(guān)注

    關(guān)注

    5

    文章

    1057

    瀏覽量

    50599
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8889

    瀏覽量

    137444
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    緩存對(duì)大數(shù)據(jù)處理的影響分析

    緩存對(duì)大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個(gè)方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲(chǔ)通常采用分布式存儲(chǔ)系統(tǒng),
    的頭像 發(fā)表于 12-18 09:45 ?135次閱讀

    ADS1675最大數(shù)據(jù)吞吐率是是多少?

    ADS1675 24bit的ADC的采樣率最大是4Msps,請問這款adc的最大數(shù)據(jù)吞吐率是是多少?怎么算的,在datasheet中有明確寫出來嗎
    發(fā)表于 11-28 07:56

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲(chǔ)系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析中
    的頭像 發(fā)表于 11-12 09:44 ?251次閱讀

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對(duì)智慧城市建設(shè)的支撐和推動(dòng)作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用需求。 大數(shù)據(jù)
    的頭像 發(fā)表于 10-24 15:27 ?666次閱讀

    dct變換的主要優(yōu)點(diǎn)哪些

    中的少數(shù)幾個(gè)系數(shù)中,從而實(shí)現(xiàn)高效的壓縮。以下是DCT變換的一些主要優(yōu)點(diǎn): 能量壓縮 :DCT的一個(gè)顯著優(yōu)點(diǎn)是它能夠?qū)D像的能量集中在變換后的低頻系數(shù)中。這意味著圖像中最重要的信息(通常是圖像的主要特征)被保留在少數(shù)幾個(gè)系數(shù)中,
    的頭像 發(fā)表于 09-30 16:30 ?497次閱讀

    電氣設(shè)備或電氣線路故障引起的火災(zāi)主要特征

    1 主要特征 ? 電氣火災(zāi)是由電氣設(shè)備或電氣線路故障引起的火災(zāi)。這類火災(zāi)具有一定的特殊性,主要特征如下: 1)突發(fā)性強(qiáng) 突發(fā)性:電氣火災(zāi)往往在沒有明顯征兆的情況下突然發(fā)生,不易被及時(shí)察覺。 瞬間爆發(fā)
    的頭像 發(fā)表于 09-12 18:00 ?526次閱讀
    電氣設(shè)備或電氣線路故障引起的火災(zāi)<b class='flag-5'>主要特征</b>

    工業(yè)互聯(lián)網(wǎng)安全所具備的主要特征不包括哪些

    和管理。隨著工業(yè)互聯(lián)網(wǎng)的快速發(fā)展,安全問題也日益凸顯。工業(yè)互聯(lián)網(wǎng)安全主要關(guān)注以下幾個(gè)方面: 設(shè)備安全:確保工業(yè)設(shè)備在生產(chǎn)過程中的穩(wěn)定性和可靠性,防止設(shè)備故障或被惡意攻擊。 數(shù)據(jù)安全:保護(hù)工業(yè)生產(chǎn)過程中產(chǎn)生的大量數(shù)據(jù)
    的頭像 發(fā)表于 07-02 09:32 ?650次閱讀

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲(chǔ)數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集方法和應(yīng)用場景,
    的頭像 發(fā)表于 07-01 15:44 ?1528次閱讀

    大數(shù)據(jù)在軍事方面的應(yīng)用哪些

    智慧華盛恒輝大數(shù)據(jù)在軍事方面的應(yīng)用涵蓋了多個(gè)方面,這些應(yīng)用不僅提高了軍事管理的效率和水平,也極大地提升了軍隊(duì)的作戰(zhàn)能力和情報(bào)獲取能力。以下是大數(shù)據(jù)在軍事方面的主要應(yīng)用: 智慧華盛恒輝戰(zhàn)爭決策輔助
    的頭像 發(fā)表于 06-23 10:34 ?1028次閱讀

    大數(shù)據(jù)在軍事訓(xùn)練領(lǐng)域的應(yīng)用哪些

    智慧華盛恒輝大數(shù)據(jù)在軍事訓(xùn)練領(lǐng)域的應(yīng)用廣泛且深入,以下是具體的應(yīng)用點(diǎn)及其歸納: 智慧華盛恒輝個(gè)性化訓(xùn)練計(jì)劃: 通過收集和分析每個(gè)士兵的訓(xùn)練數(shù)據(jù),如射擊命中率、行軍速度、體能訓(xùn)練成績等,可以為每個(gè)士兵
    的頭像 發(fā)表于 06-23 10:21 ?639次閱讀

    大數(shù)據(jù)在部隊(duì)管理中的運(yùn)用哪些

    智慧華盛恒輝大數(shù)據(jù)在部隊(duì)管理中的運(yùn)用主要體現(xiàn)在以下幾個(gè)方面: 決策支持: 智慧華盛恒輝部隊(duì)管理可以利用大數(shù)據(jù)技術(shù),對(duì)海量的數(shù)據(jù)進(jìn)行分析,為決策提供有力的
    的頭像 發(fā)表于 06-23 09:53 ?1134次閱讀

    電容器擊穿的特征是什么

    電容器擊穿是指電容器的介質(zhì)層失去絕緣能力,導(dǎo)致電流突然大幅增加的現(xiàn)象。了解電容器擊穿的特征有助于正確使用電容器,并在設(shè)計(jì)電路時(shí)采取適當(dāng)?shù)念A(yù)防措施。以下是電容器擊穿的幾個(gè)主要特征: 電容器的擊穿
    的頭像 發(fā)表于 06-09 17:17 ?2134次閱讀

    CYBT-343026傳輸大數(shù)據(jù)時(shí)會(huì)丟數(shù)據(jù)的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模塊。 我根據(jù) SPP 樣本制作了一個(gè)操作 SPP 的應(yīng)用程序。 但是,傳輸大數(shù)據(jù)時(shí)有時(shí)會(huì)丟失數(shù)據(jù)。 它從
    發(fā)表于 03-01 15:04

    SiC功率元器件特征哪些

    碳化硅(SiC)功率元器件是一種半導(dǎo)體器件,具有許多獨(dú)特的特性,使其在高性能電力電子應(yīng)用中具有優(yōu)勢。以下是SiC功率元器件的一些主要特征: 碳化硅(SiC)的絕緣擊穿場強(qiáng)大約是硅(Si)的10倍
    的頭像 發(fā)表于 02-04 16:25 ?759次閱讀

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)哪些

    大數(shù)據(jù)技術(shù)是指用來處理和存儲(chǔ)海量、多類型、高速的數(shù)據(jù)的一系列技術(shù)和工具?,F(xiàn)如今,大數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)和領(lǐng)域,對(duì)企業(yè)決策和業(yè)務(wù)發(fā)展起到了重要作用。本文將詳細(xì)介紹大數(shù)據(jù)技術(shù)的概念、發(fā)展
    的頭像 發(fā)表于 01-31 11:07 ?3474次閱讀