0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

工業(yè)大數(shù)據(jù)的范疇,為什么大數(shù)據(jù)上云要輕量化?

工業(yè)互聯(lián)網(wǎng)前線 ? 來源:未知 ? 作者:李倩 ? 2018-08-06 17:07 ? 次閱讀

一、工業(yè)大數(shù)據(jù)的范疇

工業(yè)大數(shù)據(jù)包括制造企業(yè)信息化數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)數(shù)據(jù),以及外部跨界數(shù)據(jù)。信息化數(shù)據(jù)包括了ERP中的客戶訂單、生產(chǎn)計劃等信息,工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)主要是從生產(chǎn)設備上采集到的各種產(chǎn)質(zhì)耗數(shù)據(jù)和智能產(chǎn)品上獲得的運維數(shù)據(jù),而外部跨界數(shù)據(jù)包括環(huán)境數(shù)據(jù)、市場數(shù)據(jù)和競品數(shù)據(jù)等,而其中從機器設備上得到的數(shù)據(jù)比重將越來越大。

工業(yè)大數(shù)據(jù)的特征除了大數(shù)據(jù)的4V(數(shù)據(jù)量大、類型多、價值密度低、速度快)以外,還有專業(yè)性、關(guān)聯(lián)性、和時序性特征。工業(yè)大數(shù)據(jù)應該注意特征背后的物理意義以及特征之間關(guān)聯(lián)性的機理邏輯,互聯(lián)網(wǎng)上的大數(shù)據(jù)可以只針對數(shù)據(jù)本身進行挖掘和關(guān)聯(lián),而不考慮數(shù)據(jù)本身的意義,挖掘到什么結(jié)果就是什么結(jié)果。工業(yè)大數(shù)據(jù)的挖掘必須要有明確的挖掘目標,針對應用的功能在此基礎上逐步擴展挖掘的方向。

二、為什么大數(shù)據(jù)上云要輕量化?

制造企業(yè)在構(gòu)建大數(shù)據(jù)分析系統(tǒng)時,除了采用傳統(tǒng)的自建數(shù)據(jù)中心架構(gòu)以外,還可以采用數(shù)據(jù)存儲和分析構(gòu)建在公有云平臺,采用離線訓練模型,結(jié)合邊緣計算在生產(chǎn)現(xiàn)場利用實時數(shù)據(jù)和已經(jīng)訓練好的模型進行業(yè)務應用的兩級架構(gòu)。

兩級架構(gòu)的優(yōu)點主要體現(xiàn)在以下四個方面:

1、降低存儲成本:從設備傳感器上采集的數(shù)據(jù)點往往是時序連續(xù)的過程量,隨著采集頻率的提高和周期延長,數(shù)據(jù)量是非常大的,如果考慮對海量的數(shù)據(jù)的存儲、備份和還原全生命周期的管理,往往在公有云上成本更低。

2、提高彈性:在公有云上處理大數(shù)據(jù),空間和時間靈活性約高,對數(shù)據(jù)存儲和計算資源的要求會隨著項目時間越來越長而要求越來越高,而公有云基本能做到想什么時候要就什么時候要,想要多少就要多少。

3、提高容災性:傳統(tǒng)的數(shù)據(jù)中心的容災備份往往采用兩地三中心的方式,為保證7*24的系統(tǒng)高可用性對系統(tǒng)的要求高,而公有云的IaaS和PaaS的容災備份機制能實現(xiàn)低成本的低數(shù)據(jù)丟失率和更短恢復間隔。

4、數(shù)據(jù)共享更便利:企業(yè)應該把自身看成“大數(shù)據(jù)”價值鏈中的一部分,那么企業(yè)既是貢獻者也是受益者,工業(yè)大數(shù)據(jù)的價值可以共享給企業(yè)上下游使用, 采用統(tǒng)一的公有云平臺,促進數(shù)據(jù)資源的融會貫通,使得數(shù)據(jù)共享更方便。

大數(shù)據(jù)上云以后由于網(wǎng)絡帶寬的限制、對數(shù)據(jù)處理的時效性要求高、數(shù)據(jù)存儲成本以及模型訓練復雜程度多方面的原因,也要求在企業(yè)邊緣層對原始數(shù)據(jù)進行一些輕量化處理,在不損失大數(shù)據(jù)價值性的基礎上減少原始數(shù)據(jù)量。

三、輕量化的方法

輕量化是在不損失大數(shù)據(jù)價值性的基礎上減少網(wǎng)絡傳輸、存儲和訓練的數(shù)據(jù)量,并不是要剔除異常數(shù)據(jù)。在傳統(tǒng)的儀表數(shù)據(jù)采集的時候都有一個過濾異常數(shù)據(jù)的操作,會設定一定的閾值去除儀表讀數(shù)的異常跳變,而輕量化的方法不是采用這樣的方法去除異常數(shù)據(jù),因為異常的數(shù)據(jù)有可能對業(yè)務分析是有價值的。輕量化的方法是在業(yè)務分析人員以價值需求為導向去發(fā)現(xiàn)數(shù)據(jù)和提取數(shù)據(jù),主要是通過采樣中的特征選取和數(shù)據(jù)壓縮兩種方法。

特征選取是在可采集的樣本特征集合中選擇預測能力強的最佳子集,剔除重復,簡化多個特征之間的相互關(guān)聯(lián)。首先可以對多個特征做相關(guān)性分析,如果特征的相關(guān)性為1,表示兩個特征的變化是完全相同的,通過找出兩個特征的線性關(guān)系,能夠通過一個特征還原另外一個特征,一個簡單的例子如果產(chǎn)品的中文名稱要求是唯一的,那么這個產(chǎn)品的中文名稱和它的編碼相關(guān)性就是1,不存在多個編碼的產(chǎn)品取相同的名稱,那么在做數(shù)據(jù)采集、傳輸、存儲和訓練的時候只需要保留產(chǎn)品編碼,只需要在結(jié)果展示的時候通過對應表的方式找出產(chǎn)品名稱。如果在訓練樣本的時候?qū)μ卣骶S度有明確的要求,也可以采用PCA方法對特征進行降維,PCA把原先的n個特征用數(shù)目更少的m個特征取代,從舊特征到新特征的映射捕獲數(shù)據(jù)中的固有變異性,盡量使新的m個特征互不相關(guān)。還有一些特征之間是有特殊規(guī)律可循,比如說某個機臺生產(chǎn)的班次和班組的關(guān)系是完全按照四班三運轉(zhuǎn)模式來排班,這個時候只需要確認班次就可以推導出執(zhí)行班組信息,這樣的規(guī)則如果是固定不變的話,可以在模型訓練時候直接處理特征,而不需要另外做采集和儲存。

采用壓縮算法也是常用的輕量化手段,在帶有時間戳的時序性連續(xù)變量采集中,隨著采集頻率的提高數(shù)據(jù)量也成級數(shù)上升,可以通過偏差檢測處理和羅旋門壓縮過濾,既能反映數(shù)據(jù)實際趨勢,所需要采集、傳輸和保存的數(shù)據(jù)也顯著減少。 下面的三張圖簡單展示了數(shù)據(jù)壓縮的過程。

而自編碼神經(jīng)網(wǎng)絡是結(jié)合了以上兩種方式,采用自編碼神經(jīng)網(wǎng)絡既可以對特征維度進行降維,也會通過編碼方式對數(shù)據(jù)進行壓縮。自編碼神經(jīng)網(wǎng)絡是一種無監(jiān)督學習算法,它使用了反向傳播算法,并讓目標值等于輸入值,可以通過設定神經(jīng)網(wǎng)絡的隱藏層節(jié)點數(shù)量來達到數(shù)據(jù)壓縮的目的。比如我們有100個輸入特征,可以設定隱藏層節(jié)點數(shù)量為50,最終輸出層還是還原100個輸入特征。模型訓練完成后,我們可以用模型的輸入層到隱藏層作為壓縮算法,把模型的隱藏層到輸出層作為解壓算法,這樣在邊緣層進行模型部署進行壓縮,在公有云利用模型進行解壓。自編碼神經(jīng)網(wǎng)絡相對PCA來說可以更好的處理特征之間的非線性關(guān)系。

四、結(jié)語

在越來越多的制造業(yè)把大數(shù)據(jù)放在云端進行處理的時候,在網(wǎng)絡、存儲和計算能力有效的情況下,采用對數(shù)據(jù)進行壓縮和對數(shù)據(jù)特征進行選取的方法進行數(shù)據(jù)輕量化處理,以滿足數(shù)據(jù)業(yè)務分析需求和處理效率的高效。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2551

    文章

    51099

    瀏覽量

    753606
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11155

    瀏覽量

    103315
  • 工業(yè)大數(shù)據(jù)

    關(guān)注

    0

    文章

    72

    瀏覽量

    7842

原文標題:企業(yè)實戰(zhàn)專家:工業(yè)大數(shù)據(jù)如何輕量化上云

文章出處:【微信號:IndustryIOT,微信公眾號:工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    工業(yè)大數(shù)據(jù)

    工業(yè)大數(shù)據(jù)是未來工業(yè)在全球市場競爭中發(fā)揮優(yōu)勢的關(guān)鍵。無論是德國工業(yè)4.0、美國工業(yè)互聯(lián)網(wǎng)還是《中國制造2025》,各國制造業(yè)創(chuàng)新戰(zhàn)略的實施基礎都是
    發(fā)表于 06-19 17:43

    基于阿里數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設思路

    摘要:數(shù)加大數(shù)據(jù)直播系列課程主要以基于阿里數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設思路為主題分享阿里巴巴的大數(shù)據(jù)是怎么演變以及怎樣利用大數(shù)
    發(fā)表于 03-15 12:43

    工業(yè)大數(shù)據(jù)分析平臺的應用價值探討

    一條很有意思的娛樂新聞——警方在某歌手的演唱會上抓捕了好幾個被網(wǎng)上追逃的人。這同樣是大數(shù)據(jù)技術(shù)的應用······工業(yè)大數(shù)據(jù)分析平臺是利用大數(shù)據(jù)技術(shù)開發(fā)搭建的為工業(yè)企業(yè)服務的一體化信息平
    發(fā)表于 11-12 15:56

    WitSight工業(yè)大數(shù)據(jù)云平臺如何在技術(shù)和架構(gòu)層面上運作?

    WitSight是什么?WitSight提供了哪些核心功能和優(yōu)勢?WitSight工業(yè)大數(shù)據(jù)云平臺如何在技術(shù)和架構(gòu)層面上運作?
    發(fā)表于 06-16 09:29

    如何成功實施工業(yè)大數(shù)據(jù)

    如何成功實施工業(yè)大數(shù)據(jù)?
    發(fā)表于 09-30 08:45

    工業(yè)大數(shù)據(jù)技術(shù)綜述

    工業(yè)大數(shù)據(jù)工業(yè)數(shù)據(jù)的總稱,包括信息化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及跨界數(shù)據(jù),是
    發(fā)表于 03-27 16:10 ?14次下載

    制造大數(shù)據(jù)大數(shù)據(jù)制造,工業(yè)大數(shù)據(jù)有什么特點?

    第三點是實時性。工業(yè)大數(shù)據(jù)是實時的監(jiān)控和預警,工業(yè)大數(shù)據(jù)需要實時的達到分析和應用。另外行業(yè)性。消費的數(shù)據(jù)一般來講是比較好理解的,工業(yè)數(shù)據(jù)
    的頭像 發(fā)表于 05-17 15:37 ?1.9w次閱讀

    工業(yè)大數(shù)據(jù)的概念

    工業(yè)大數(shù)據(jù)是指在工業(yè)領(lǐng)域中,圍繞典型智能制造模式,從客戶需求到銷售、訂單、計劃、研發(fā)、設計、工藝、制造、采購、供應、庫存、發(fā)貨和交付、售后服務、運維、報廢或回收再制造等整個產(chǎn)品全生命周期各個環(huán)節(jié)所
    的頭像 發(fā)表于 03-05 15:18 ?4063次閱讀

    工業(yè)大數(shù)據(jù)應用前景

    打破數(shù)據(jù)孤島壁壘,實現(xiàn)人與機器、機器與機器的互聯(lián)互通,為工業(yè)數(shù)據(jù)的自由匯聚奠定基礎,另一方面進 一步增強了工業(yè)大數(shù)據(jù)的應用需求,使得工業(yè)大數(shù)據(jù)
    的頭像 發(fā)表于 03-05 15:21 ?6016次閱讀

    工業(yè)大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù)區(qū)別

    工業(yè)大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)最大的區(qū)別在于工業(yè)大數(shù)據(jù)有非常強的目的性,而互聯(lián)網(wǎng)大數(shù)據(jù)更多的是一種關(guān)聯(lián)的挖掘,是更加發(fā)散的一種分析。除此之外,兩者在數(shù)據(jù)
    的頭像 發(fā)表于 03-28 14:08 ?1.1w次閱讀

    工業(yè)大數(shù)據(jù)前景

    工業(yè)大數(shù)據(jù)正以一種革命風暴的姿態(tài)闖入人們視野,其技術(shù)和市場在快速發(fā)展,而駕馭工業(yè)大數(shù)據(jù)的呼聲則一浪高過一浪。于是有人說中國大數(shù)據(jù)產(chǎn)業(yè)有炒作“過熱”之嫌,也有人認為大數(shù)據(jù)投資正當時。隨著
    的頭像 發(fā)表于 03-28 14:08 ?3851次閱讀

    工業(yè)大數(shù)據(jù)如何管理

    從需求側(cè)看,隨著智能制造、工業(yè)互聯(lián)網(wǎng)等國家戰(zhàn)略的逐一推進,個性化定制、網(wǎng)絡化延伸以及智能化設計、生產(chǎn)、服務等新模式不斷出現(xiàn),對于工業(yè)大數(shù)據(jù)技術(shù)、產(chǎn)品、平臺的需求不斷增大,為工業(yè)大數(shù)據(jù)提供了充足的應用場景。
    的頭像 發(fā)表于 04-21 16:55 ?2899次閱讀

    工業(yè)大數(shù)據(jù)的技術(shù)與應用

    產(chǎn)生的各類數(shù)據(jù)及相關(guān)技術(shù)和應用的總稱。工業(yè)大數(shù)據(jù)是智能制造的核心,以大數(shù)據(jù)+工業(yè)互聯(lián)網(wǎng)為基礎,用計算、
    的頭像 發(fā)表于 11-23 14:37 ?5574次閱讀

    工業(yè)大數(shù)據(jù)在制造企業(yè)的應用場景

    工業(yè)大數(shù)據(jù)是一個新的概念,從字面上理解,工業(yè)大數(shù)據(jù)是指在工業(yè)領(lǐng)域信息化應用中所產(chǎn)生的大數(shù)據(jù)。
    的頭像 發(fā)表于 01-17 12:05 ?4944次閱讀

    智慧農(nóng)業(yè)大數(shù)據(jù)

    智慧農(nóng)業(yè),作為未來農(nóng)業(yè)的發(fā)展方向,其實現(xiàn)基于種植環(huán)境、生長管理、農(nóng)機設備等數(shù)據(jù)。農(nóng)業(yè)大數(shù)據(jù)核心在于技術(shù),包括獲取技術(shù)和處理數(shù)據(jù)技術(shù)。相比工業(yè)大數(shù)據(jù)技術(shù),獲取技術(shù)的多樣性和復雜程度更高,
    的頭像 發(fā)表于 07-10 16:18 ?1038次閱讀