0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向工程師和科學(xué)家的大數(shù)據(jù)

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Dave Oswill ? 2022-10-06 07:52 ? 次閱讀

使用大數(shù)據(jù)正迅速成為科學(xué)發(fā)現(xiàn)和工程過(guò)程中的關(guān)鍵步驟。隨著智能傳感器物聯(lián)網(wǎng)IoT) 等技術(shù)能夠從科學(xué)儀器、制造系統(tǒng)、聯(lián)網(wǎng)汽車和飛機(jī)中收集大量詳細(xì)數(shù)據(jù),這種情況正在發(fā)生。

這些數(shù)據(jù)具有重要價(jià)值,因?yàn)樗梢燥@示重要的物理現(xiàn)象或提供有關(guān)系統(tǒng)運(yùn)行環(huán)境、效率和健康狀況的信息。借助適當(dāng)?shù)墓ぞ吆图夹g(shù),這些數(shù)據(jù)可用于進(jìn)行快速的科學(xué)發(fā)現(xiàn),并在您的產(chǎn)品、服務(wù)和制造過(guò)程中開發(fā)和整合更多智能。這可以使您的公司以性能更好的產(chǎn)品或服務(wù)脫穎而出,并有助于符合法規(guī)要求(例如滿足發(fā)動(dòng)機(jī)燃油效率標(biāo)準(zhǔn)或提供輔助駕駛能力)。

獲得訪問(wèn)權(quán)和使用數(shù)據(jù)可能聽(tīng)起來(lái)很有趣,但也很艱巨。由于這些數(shù)據(jù)的價(jià)值和大小,它通常在大型文件共享、數(shù)據(jù)庫(kù)或 Hadoop 或 Spark 等大數(shù)據(jù)系統(tǒng)中存儲(chǔ)和管理。不久前,為了將機(jī)器學(xué)習(xí)等先進(jìn)技術(shù)應(yīng)用于大量數(shù)據(jù),具有 IT 系統(tǒng)經(jīng)驗(yàn)的計(jì)算機(jī)科學(xué)家將與工程和科學(xué)專家一起工作。該團(tuán)隊(duì)將共同支持一個(gè)工作流程,其中包括:

訪問(wèn)文件、數(shù)據(jù)庫(kù)或 Hadoop 分布式文件系統(tǒng) (HDFS) 中的大數(shù)據(jù)

在專門的計(jì)算集群上探索、處理和分析這些數(shù)據(jù)

創(chuàng)建用于嵌入式系統(tǒng)、業(yè)務(wù)應(yīng)用程序和其他服務(wù)的算法

如今,MATLAB等軟件分析和建模工具已通過(guò)處理大數(shù)據(jù)的新功能得到增強(qiáng)。這使具有領(lǐng)域知識(shí)和經(jīng)驗(yàn)的工程師和科學(xué)家能夠利用這些數(shù)據(jù)做出設(shè)計(jì)和業(yè)務(wù)決策。然后,工程師和科學(xué)家無(wú)論身在何處都可以方便地訪問(wèn)這些數(shù)據(jù),并使用熟悉的語(yǔ)法和功能輕松使用它。

讓我們看一個(gè)工程師如何使用大數(shù)據(jù)的實(shí)際示例。貝克休斯的工程師為石油和天然氣運(yùn)營(yíng)商提供服務(wù)的供應(yīng)商,需要開發(fā)一種預(yù)測(cè)性維護(hù)系統(tǒng),以降低泵設(shè)備成本和石油和天然氣開采卡車的停機(jī)時(shí)間。如果活動(dòng)現(xiàn)場(chǎng)的卡車出現(xiàn)泵故障,貝克休斯必須立即更換卡車以確保連續(xù)運(yùn)行。向每個(gè)站點(diǎn)發(fā)送備用卡車會(huì)使公司損失數(shù)千萬(wàn)美元的收入,如果它們?cè)诹硪粋€(gè)站點(diǎn)積極使用,這些收入可能會(huì)在其他地方產(chǎn)生。無(wú)法準(zhǔn)確預(yù)測(cè)閥門和泵何時(shí)需要維護(hù)是其他成本的基礎(chǔ)。過(guò)于頻繁的維護(hù)會(huì)浪費(fèi)精力,并導(dǎo)致零件在仍然可用時(shí)被更換,而過(guò)于不頻繁的維護(hù)可能會(huì)損壞泵而無(wú)法修復(fù)。

從石油和天然氣開采卡車上收集了數(shù) TB 的數(shù)據(jù),這些數(shù)據(jù)用于開發(fā)一個(gè)應(yīng)用程序,該應(yīng)用程序可以預(yù)測(cè)設(shè)備何時(shí)需要維護(hù)或更換。MATLAB 為 Baker Hughes 的工程師提供了開發(fā)預(yù)測(cè)模型和將多種數(shù)據(jù)(包括來(lái)自專有文件格式的傳感器數(shù)據(jù))合并到一個(gè)分析應(yīng)用程序中所需的功能。

訪問(wèn)大量數(shù)據(jù)

處理大數(shù)據(jù)的第一個(gè)挑戰(zhàn)是確定如何訪問(wèn)大型數(shù)據(jù)集,因?yàn)樗鼈冇卸喾N不同的形式并存儲(chǔ)在各種類型的系統(tǒng)中。

文件

許多大型工程和科學(xué)數(shù)據(jù)集由大量中小型文件組成,盡管文件變得越來(lái)越大,并且無(wú)法放入單臺(tái)計(jì)算機(jī)的內(nèi)存中。這些文件通常位于共享驅(qū)動(dòng)器上的一個(gè)或多個(gè)目錄中,可能包含分隔文本、電子表格、圖像、視頻和各種專有格式。

數(shù)據(jù)庫(kù)

有多種數(shù)據(jù)庫(kù)類型可用于存儲(chǔ)和管理大量數(shù)據(jù):

關(guān)系型 (SQL):廣泛用于業(yè)務(wù)應(yīng)用程序,在 IT 開發(fā)人員中很受歡迎。

數(shù)據(jù)倉(cāng)庫(kù):基于關(guān)系 (SQL) 數(shù)據(jù)庫(kù),存儲(chǔ)關(guān)鍵業(yè)務(wù)數(shù)據(jù),并為關(guān)鍵業(yè)務(wù)應(yīng)用程序提供分析能力和快速訪問(wèn)。

NoSQL:針對(duì)不適合關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行了優(yōu)化。

數(shù)據(jù)歷史學(xué)家:針對(duì)通常從工業(yè)設(shè)備收集的基于時(shí)間的生產(chǎn)和過(guò)程數(shù)據(jù)進(jìn)行了優(yōu)化。

物聯(lián)網(wǎng)數(shù)據(jù)聚合器:通常包括基于云的服務(wù),用于聚合來(lái)自連接的傳感器和設(shè)備的時(shí)間序列數(shù)據(jù)。這些服務(wù)通常通過(guò) Web 服務(wù)調(diào)用來(lái)訪問(wèn)。

Hadoop

Hadoop是一種基于分布式計(jì)算和存儲(chǔ)原理的大數(shù)據(jù)集存儲(chǔ)和處理系統(tǒng)。它由在計(jì)算服務(wù)器集群上共存的兩個(gè)主要子系統(tǒng)組成:

HDFS:一種大型、抗故障的文件系統(tǒng),稱為 Hadoop 分布式文件系統(tǒng)。

YARN:管理在 Hadoop 上運(yùn)行的應(yīng)用程序,包括批處理框架,例如 MapReduce 和 Spark,以及 SQL 接口,例如 Hive 和 Impala。

為了有效地利用大數(shù)據(jù)的優(yōu)勢(shì),工程師和科學(xué)家需要一個(gè)可擴(kuò)展的工具,例如 MATLAB,以提供對(duì)用于存儲(chǔ)和管理數(shù)據(jù)的各種系統(tǒng)和格式的訪問(wèn)。這在可能使用不止一種類型的系統(tǒng)和格式的情況下尤其重要。存儲(chǔ)在共享驅(qū)動(dòng)器文件中的傳感器或圖像數(shù)據(jù)可能需要與存儲(chǔ)在數(shù)據(jù)庫(kù)中的元數(shù)據(jù)相結(jié)合;就貝克休斯而言,許多不同格式的數(shù)據(jù)必須一起使用,以了解系統(tǒng)的行為并開發(fā)預(yù)測(cè)模型。

處理大數(shù)據(jù)的能力正迅速成為科學(xué)發(fā)現(xiàn)和工程的一個(gè)重要方面。這些數(shù)據(jù)集中包含寶貴的數(shù)據(jù),提供了區(qū)分您的產(chǎn)品和服務(wù)的方法。作為科學(xué)家或工程師,您擁有使用這些數(shù)據(jù)做出設(shè)計(jì)和業(yè)務(wù)決策的領(lǐng)域知識(shí)和經(jīng)驗(yàn),但可能需要易于使用的軟件分析和建模工具。使用 MATLAB 等工具可提供可擴(kuò)展性和效率,同時(shí)為您的公司提供在全球市場(chǎng)上的競(jìng)爭(zhēng)優(yōu)勢(shì)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2560

    文章

    52158

    瀏覽量

    761456
  • matlab
    +關(guān)注

    關(guān)注

    187

    文章

    2990

    瀏覽量

    232753
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8941

    瀏覽量

    139083
收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    問(wèn),成為硬件工程師需要幾只手?#硬件工程師 #YXC晶振 #揚(yáng)興科技 #搞笑

    硬件工程師
    揚(yáng)興科技
    發(fā)布于 :2025年04月25日 17:15:37

    硬件工程師:回答我!#回答我 #硬件工程師 #YXC晶振 #揚(yáng)興科技

    硬件工程師
    揚(yáng)興科技
    發(fā)布于 :2025年03月25日 18:46:59

    一招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點(diǎn)在西湖大學(xué)的科研項(xiàng)目中已得到體現(xiàn)。 成立于2018年的西湖大學(xué)是由施一公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵(lì)科學(xué)家們探索AI與各學(xué)科交叉融合,為科研創(chuàng)新提速。為此,西湖大學(xué)在浪潮信息等企業(yè)助力下打造
    的頭像 發(fā)表于 12-12 15:59 ?400次閱讀
    西湖大學(xué):<b class='flag-5'>科學(xué)家</b>+AI,科研新范式的樣本

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息
    發(fā)表于 10-14 09:21

    正是拼的年紀(jì)|65歲電子工程師上班VLOG #65歲退休 #電子工程師 #搞笑 #上班vlog

    電子工程師
    安泰小課堂
    發(fā)布于 :2024年07月25日 11:31:02

    新華社:突破性成果!祝賀我國(guó)科學(xué)家成功研發(fā)這一傳感器!

    6月25日,新華社以《突破性成果!祝賀我國(guó)科學(xué)家》為標(biāo)題,報(bào)道了由我國(guó)科學(xué)家研發(fā)的傳感器成果。 我國(guó)科學(xué)家研發(fā)高通道神經(jīng)探針實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè) 神經(jīng)探針是一種用來(lái)記錄神經(jīng)活動(dòng)的針狀電傳
    的頭像 發(fā)表于 06-27 18:03 ?731次閱讀
    新華社:突破性成果!祝賀我國(guó)<b class='flag-5'>科學(xué)家</b>成功研發(fā)這一傳感器!

    前OpenAI首席科學(xué)家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因?yàn)樘K茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學(xué)家,并在去年在OpenAI董事會(huì)上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?683次閱讀

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    通常需要具備強(qiáng)大的問(wèn)題解決能力,以及對(duì)新技術(shù)的學(xué)習(xí)和應(yīng)用能力。他們的工作通常涉及到多個(gè)領(lǐng)域,如計(jì)算機(jī)科學(xué)、電子工程、機(jī)械工程等。 嵌入式硬件工程師 嵌入式硬件
    發(fā)表于 05-16 11:00

    本源量子參與的國(guó)家重點(diǎn)研發(fā)計(jì)劃青年科學(xué)家項(xiàng)目啟動(dòng)會(huì)順利召開

    2024年4月23日,國(guó)家重點(diǎn)研發(fā)計(jì)劃“先進(jìn)計(jì)算與新興軟件”重點(diǎn)專項(xiàng)“面向復(fù)雜物理系統(tǒng)求解的量子科學(xué)計(jì)算算法、軟件、應(yīng)用與驗(yàn)證”青年科學(xué)家項(xiàng)目啟動(dòng)會(huì)暨實(shí)施方案論證會(huì)在合肥順利召開。該項(xiàng)目由合肥綜合性國(guó)家
    的頭像 發(fā)表于 05-11 08:22 ?1087次閱讀
    本源量子參與的國(guó)家重點(diǎn)研發(fā)計(jì)劃青年<b class='flag-5'>科學(xué)家</b>項(xiàng)目啟動(dòng)會(huì)順利召開

    大廠電子工程師常見(jiàn)面試題#電子工程師 #硬件工程師 #電路知識(shí) #面試題

    電子工程師電路
    安泰小課堂
    發(fā)布于 :2024年04月30日 17:33:15

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品