0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)的主要特征有哪些

汽車玩家 ? 來源:個(gè)人圖書館、百度服務(wù)商 ? 作者:個(gè)人圖書館、百度 ? 2022-02-07 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡(jiǎn)言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù),明白這一點(diǎn)至關(guān)重要,也正是這一點(diǎn)促使該技術(shù)具備走向眾多企業(yè)的潛力。

在萊尼的理論基礎(chǔ)上,IBM提出大數(shù)據(jù)的4V特征得到了業(yè)界的廣泛認(rèn)可:第一,數(shù)量,即數(shù)據(jù)巨大,從TB級(jí)別躍升到PB級(jí)別;第二,多樣性,即數(shù)據(jù)類型繁多,不僅包括傳統(tǒng)的格式化數(shù)據(jù),還包括來自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;第三,速度,即處理速度快;第四,真實(shí)性,即追求高質(zhì)量的數(shù)據(jù)。

數(shù)據(jù)體量巨大

容量大是大數(shù)據(jù)的首要特征,隨著網(wǎng)絡(luò)的發(fā)展,迫切的需要足夠大的容量去統(tǒng)計(jì)分析以及預(yù)測(cè)大規(guī)模的數(shù)據(jù)。最開始的mp3時(shí)代僅僅只是mb級(jí)的存儲(chǔ),但是已經(jīng)能滿足很多人的要求了。隨著信息技術(shù)的高度發(fā)展,存儲(chǔ)單位也慢慢的發(fā)生了演變。從大家耳熟能詳?shù)?**存儲(chǔ)到了tb存儲(chǔ),乃至現(xiàn)在有了pb,eb等存儲(chǔ)。

數(shù)據(jù)速度快

大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生、處理和分析的速度在持續(xù)加快。加速的原因是數(shù)據(jù)創(chuàng)建的實(shí)時(shí)性特點(diǎn),以及將流數(shù)據(jù)結(jié)合到業(yè)務(wù)流程和決策過程中的需求。數(shù)據(jù)處理速度快,處理模式已經(jīng)開始從批處理轉(zhuǎn)向流處理。業(yè)界對(duì)大數(shù)據(jù)的處理能力有一個(gè)稱謂——“1秒定律”,也就是說,可以從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息。大數(shù)據(jù)的快速處理能力充分體現(xiàn)出它與傳統(tǒng)的數(shù)據(jù)處理技術(shù)的本質(zhì)區(qū)別。

數(shù)據(jù)類型繁多

大數(shù)據(jù)的數(shù)據(jù)類型繁多,傳統(tǒng)IT產(chǎn)業(yè)產(chǎn)生和處理的數(shù)據(jù)類型較為單一,大部分是結(jié)構(gòu)化數(shù)據(jù)。隨著傳感器、智能設(shè)備、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動(dòng)計(jì)算、在線廣告等新的渠道和技術(shù)不斷涌現(xiàn),產(chǎn)生的數(shù)據(jù)類型無以計(jì)數(shù)。

現(xiàn)在的數(shù)據(jù)類型不再只是格式化數(shù)據(jù),更多的是半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù),如XML、郵件、博客、即時(shí)消息、視頻、照片、點(diǎn)擊流、日志文件等。企業(yè)需要整合、存儲(chǔ)和分析來自復(fù)雜的傳統(tǒng)和非傳統(tǒng)信息源的數(shù)據(jù),包括企業(yè)內(nèi)部和外部的數(shù)據(jù)。因?yàn)榇髷?shù)據(jù)的來源非常廣泛,所以多樣性成為了大數(shù)據(jù)的另一大特點(diǎn)。在任何形式下,所獲取的來源都是可以使用的,目前為止應(yīng)用比較廣泛的有淘寶,網(wǎng)易云,頭條等等。這些平臺(tái)通過對(duì)用戶的數(shù)據(jù)進(jìn)行分析,從而對(duì)應(yīng)的推薦一些用戶比較喜歡的東西。

真實(shí)性

數(shù)據(jù)的重要性就在于對(duì)決策的支持,數(shù)據(jù)的規(guī)模并不能決定其能否為決策提供幫助,數(shù)據(jù)的真實(shí)性和質(zhì)量才是獲得真知和思路最重要的因素,是制定成功決策最堅(jiān)實(shí)的基礎(chǔ)。追求高數(shù)據(jù)質(zhì)量是一項(xiàng)重要的大數(shù)據(jù)要求和挑戰(zhàn),即使最優(yōu)秀的數(shù)據(jù)清理方法也無法消除某些數(shù)據(jù)固有的不可預(yù)測(cè)性。

在處理這些類型的數(shù)據(jù)時(shí),數(shù)據(jù)清理無法修正這種不確定性,然而,盡管存在不確定性,數(shù)據(jù)仍然包含寶貴的信息。我們必須承認(rèn)、接受大數(shù)據(jù)的不確定性,并確定如何充分利用這一點(diǎn)。

文章整合自:個(gè)人圖書館、百度服務(wù)商點(diǎn)亮工場(chǎng)、螞蚜網(wǎng)

審核編輯:鄢孟繁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 格式化
    +關(guān)注

    關(guān)注

    2

    文章

    39

    瀏覽量

    9322
  • 智能設(shè)備
    +關(guān)注

    關(guān)注

    5

    文章

    1097

    瀏覽量

    52010
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8953

    瀏覽量

    139789
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PD快充芯片U8766的主要特征

    芯片工作頻率指芯片內(nèi)部時(shí)鐘信號(hào)的振蕩速率,是芯片性能的重要基礎(chǔ)。晶體管導(dǎo)通電阻越小、切換速度越快,信號(hào)傳輸效率越高。PD快充芯片U8766的工作頻率最高可達(dá)220kHz,可全范圍工作在準(zhǔn)諧振模式。芯片集成峰值電流抖動(dòng)功能和驅(qū)動(dòng)電流配置功能,可極大的優(yōu)化系統(tǒng)EMI性能。U8766內(nèi)置Boost供電電路,非常適用于寬輸出電壓的應(yīng)用場(chǎng)景。
    的頭像 發(fā)表于 06-18 16:47 ?303次閱讀

    大數(shù)據(jù)與云計(jì)算是干嘛的?

    大數(shù)據(jù)與云計(jì)算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲(chǔ)、分析與價(jià)值挖掘;云計(jì)算通過虛擬化資源池提供彈性計(jì)算、存儲(chǔ)及服務(wù)能力。兩者結(jié)合,共同賦能企業(yè)決策、業(yè)務(wù)創(chuàng)新和效率提升。下面UU云小編將詳細(xì)剖析
    的頭像 發(fā)表于 02-20 14:48 ?546次閱讀

    同步整流芯片U7612的主要特征

    同步整流芯片與主控配合,使整流元件與主開關(guān)管同步工作,避免了二極管反向恢復(fù)時(shí)間產(chǎn)生的電流諧波,能有效減少電磁干擾,使產(chǎn)品更易通過電磁兼容性測(cè)試。同步整流芯片U7612是一款帶快速關(guān)斷功能的高性能副邊同步整流功率開關(guān),可以替代肖特基整流二極管以提高系統(tǒng)效率。
    的頭像 發(fā)表于 02-17 16:13 ?521次閱讀

    電源管理IC U6018的主要特征

    DIP-8 封裝的電源管理ic引腳布局相對(duì)簡(jiǎn)單,信號(hào)傳輸路徑較為直接,有利于減少信號(hào)傳輸過程中的干擾和延遲,適合于一些對(duì)電氣性能要求不是特別苛刻的低頻、低功率電路應(yīng)用。電源管理ic U6018采用DIP-8封裝,內(nèi)置通用初級(jí)側(cè)CC控制,簡(jiǎn)化了隔離電源設(shè)計(jì),是一款高性能電流模式PWM電源開關(guān),適用于離線反激式轉(zhuǎn)換器應(yīng)用。
    的頭像 發(fā)表于 02-12 15:57 ?560次閱讀

    開關(guān)柜機(jī)械特征監(jiān)控主要參數(shù)哪些?如何實(shí)現(xiàn)?

    蜀瑞創(chuàng)新為大家科普:開關(guān)柜機(jī)械特征監(jiān)控是指對(duì)電力系統(tǒng)中使用的開關(guān)設(shè)備的機(jī)械性能進(jìn)行監(jiān)測(cè),以確保其正常運(yùn)行并預(yù)防故障。開關(guān)柜機(jī)械特征監(jiān)控是確保電力系統(tǒng)安全穩(wěn)定運(yùn)行的重要環(huán)節(jié)。其實(shí)現(xiàn)方式主要依賴于多種技術(shù)手段的綜合運(yùn)用。
    的頭像 發(fā)表于 12-21 16:35 ?496次閱讀
    開關(guān)柜機(jī)械<b class='flag-5'>特征</b>監(jiān)控<b class='flag-5'>主要</b>參數(shù)哪些?如何實(shí)現(xiàn)?

    緩存對(duì)大數(shù)據(jù)處理的影響分析

    緩存對(duì)大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個(gè)方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲(chǔ)通常采用分布式存儲(chǔ)系統(tǒng),
    的頭像 發(fā)表于 12-18 09:45 ?713次閱讀

    ADS1675最大數(shù)據(jù)吞吐率是是多少?

    ADS1675 24bit的ADC的采樣率最大是4Msps,請(qǐng)問這款adc的最大數(shù)據(jù)吞吐率是是多少?怎么算的,在datasheet中有明確寫出來嗎
    發(fā)表于 11-28 07:56

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲(chǔ)系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析中
    的頭像 發(fā)表于 11-12 09:44 ?686次閱讀

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對(duì)智慧城市建設(shè)的支撐和推動(dòng)作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用需求。 大數(shù)據(jù)
    的頭像 發(fā)表于 10-24 15:27 ?1251次閱讀

    dct變換的主要優(yōu)點(diǎn)哪些

    中的少數(shù)幾個(gè)系數(shù)中,從而實(shí)現(xiàn)高效的壓縮。以下是DCT變換的一些主要優(yōu)點(diǎn): 能量壓縮 :DCT的一個(gè)顯著優(yōu)點(diǎn)是它能夠?qū)D像的能量集中在變換后的低頻系數(shù)中。這意味著圖像中最重要的信息(通常是圖像的主要特征)被保留在少數(shù)幾個(gè)系數(shù)中,
    的頭像 發(fā)表于 09-30 16:30 ?1217次閱讀

    電氣設(shè)備或電氣線路故障引起的火災(zāi)主要特征

    1 主要特征 ? 電氣火災(zāi)是由電氣設(shè)備或電氣線路故障引起的火災(zāi)。這類火災(zāi)具有一定的特殊性,主要特征如下: 1)突發(fā)性強(qiáng) 突發(fā)性:電氣火災(zāi)往往在沒有明顯征兆的情況下突然發(fā)生,不易被及時(shí)察覺。 瞬間爆發(fā)
    的頭像 發(fā)表于 09-12 18:00 ?1257次閱讀
    電氣設(shè)備或電氣線路故障引起的火災(zāi)<b class='flag-5'>主要特征</b>

    使用CYW20829的BLE進(jìn)行最大數(shù)據(jù)發(fā)送應(yīng)用,BLE丟失數(shù)據(jù)如何解決?

    我目前正在使用 CYW20829 的 BLE 進(jìn)行最大數(shù)據(jù)發(fā)送應(yīng)用,我使用的是 FREERTOS(例程 Bluetooth_LE_GATT_Throughput_Server 是我的參考),藍(lán)牙被
    發(fā)表于 07-23 07:56

    工業(yè)互聯(lián)網(wǎng)安全所具備的主要特征不包括哪些

    和管理。隨著工業(yè)互聯(lián)網(wǎng)的快速發(fā)展,安全問題也日益凸顯。工業(yè)互聯(lián)網(wǎng)安全主要關(guān)注以下幾個(gè)方面: 設(shè)備安全:確保工業(yè)設(shè)備在生產(chǎn)過程中的穩(wěn)定性和可靠性,防止設(shè)備故障或被惡意攻擊。 數(shù)據(jù)安全:保護(hù)工業(yè)生產(chǎn)過程中產(chǎn)生的大量數(shù)據(jù)
    的頭像 發(fā)表于 07-02 09:32 ?1048次閱讀

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲(chǔ)數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集方法和應(yīng)用場(chǎng)景,
    的頭像 發(fā)表于 07-01 15:44 ?2281次閱讀

    大數(shù)據(jù)分析平臺(tái)網(wǎng)站

    大數(shù)據(jù)分析平臺(tái)是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價(jià)值的信息和洞察。以下是大數(shù)據(jù)分析平臺(tái)的主要功能和應(yīng)用場(chǎng)景:
    的頭像 發(fā)表于 06-28 15:46 ?1382次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品