0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)管道的重要性

星星科技指導(dǎo)員 ? 來源:embedded ? 作者:V Srinivas Durga Pras ? 2023-05-04 09:55 ? 次閱讀

機(jī)器學(xué)習(xí) (ML) 管道用于協(xié)助機(jī)器學(xué)習(xí)過程的自動化。它們的工作原理是允許在模型中轉(zhuǎn)換和關(guān)聯(lián)一系列數(shù)據(jù),該模型可以進(jìn)行測試和評估以實(shí)現(xiàn)積極或消極的結(jié)果。

從數(shù)據(jù)提取和預(yù)處理到模型訓(xùn)練和調(diào)優(yōu),模型和部署的分析將在主流設(shè)計(jì)中的單個(gè)實(shí)體中運(yùn)行。這意味著將使用相同的腳本提取、清理、準(zhǔn)備、建模和部署數(shù)據(jù)。由于機(jī)器學(xué)習(xí)模型通常比其他軟件應(yīng)用程序包含的代碼少得多,因此將所有資源保存在一個(gè)地方非常有意義。由于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法的進(jìn)步,全球市場有望獲得牽引力。

此外,許多公司正在加強(qiáng)其深度學(xué)習(xí)能力以推動創(chuàng)新,預(yù)計(jì)將推動汽車、消費(fèi)電子、媒體和娛樂等行業(yè)的ML市場增長。根據(jù)優(yōu)先研究小組的數(shù)據(jù),15 年全球 ML 即服務(wù)市場價(jià)值為 47.2021 億美元,預(yù)計(jì)到 305 年將達(dá)到 62.2030 億美元,39 年至 3 年的復(fù)合年增長率為 2022.2030%。

機(jī)器學(xué)習(xí)管道概述

機(jī)器學(xué)習(xí)管道是一種完全自動化機(jī)器學(xué)習(xí)任務(wù)工作流的方法。這可以通過允許在模型中轉(zhuǎn)換和關(guān)聯(lián)一系列數(shù)據(jù)來實(shí)現(xiàn),該模型可以檢查以確定輸出。常規(guī) ML 管道由數(shù)據(jù)輸入、數(shù)據(jù)模型、參數(shù)和預(yù)測結(jié)果組成??梢允褂脵C(jī)器學(xué)習(xí)管道對創(chuàng)建機(jī)器學(xué)習(xí)模型的過程進(jìn)行編碼和自動化。執(zhí)行 ML 流程時(shí)可能會出現(xiàn)同一模型的不同版本的部署、模型擴(kuò)展和工作流設(shè)置困難,必須手動處理。我們可以利用機(jī)器學(xué)習(xí)管道來解決上述所有問題。工作流的每個(gè)步驟都使用 ML 管道獨(dú)立運(yùn)行。因此,可以選擇該模塊,并根據(jù)需要進(jìn)行任何階段的任何更新。

ML 管道概述

數(shù)據(jù)輸入

數(shù)據(jù)輸入步驟是每個(gè) ML 管道中的第一步。在此階段組織和處理數(shù)據(jù),以便可以將其應(yīng)用于后續(xù)步驟。

數(shù)據(jù)驗(yàn)證

數(shù)據(jù)驗(yàn)證是下一步,必須在訓(xùn)練新模型之前完成。新數(shù)據(jù)的統(tǒng)計(jì),如范圍、分類數(shù)量、子組分布等,是數(shù)據(jù)驗(yàn)證的主要關(guān)注點(diǎn)。我們可以比較各種數(shù)據(jù)集,使用各種數(shù)據(jù)驗(yàn)證工具(如 Python、R、Python Pandas 等)來查找異常。

數(shù)據(jù)的預(yù)處理

每個(gè) ML 生命周期以及管道中最重要的階段之一是數(shù)據(jù)預(yù)處理。由于它可能會產(chǎn)生突然和意外的結(jié)果,因此如果不先處理它,我們就無法直接輸入收集的數(shù)據(jù)來訓(xùn)練模型。預(yù)處理階段需要為 ML 模型準(zhǔn)備好原始數(shù)據(jù)。該過程分為幾個(gè)部分,例如屬性縮放、數(shù)據(jù)清理、信息質(zhì)量評估和數(shù)據(jù)縮減??捎糜谀P陀?xùn)練和測試的最終數(shù)據(jù)集是數(shù)據(jù)預(yù)處理過程的結(jié)果。在機(jī)器學(xué)習(xí)中,各種方法,如規(guī)范化、聚合、數(shù)量減少等??捎糜陬A(yù)處理數(shù)據(jù)。

數(shù)據(jù)模型訓(xùn)練

每個(gè) ML 管道的核心步驟是模型訓(xùn)練。在此步驟中,訓(xùn)練模型以盡可能準(zhǔn)確地預(yù)測給定輸入(預(yù)處理數(shù)據(jù)集)的輸出。然而,較大的模型或訓(xùn)練數(shù)據(jù)集可能會帶來一些挑戰(zhàn)。因此,為此需要高效的模型訓(xùn)練或模型調(diào)優(yōu)分布。由于管道是可伸縮的,并且可以一次處理多個(gè)模型,因此它們可以解決模型訓(xùn)練階段的問題。不同類型的 ML 算法(如監(jiān)督、無監(jiān)督和強(qiáng)化學(xué)習(xí))可用于構(gòu)建數(shù)據(jù)模型。

模型的部署

是時(shí)候在訓(xùn)練和分析后部署模型了。部署 ML 模型有三種方法:通過模型服務(wù)器、瀏覽器和邊緣設(shè)備。但是,使用模型服務(wù)器是模型的典型部署方法。ML 管道可確保 ML 推理在邊緣級設(shè)備上平穩(wěn)運(yùn)行,其中數(shù)據(jù)生成起著至關(guān)重要的作用,并提供降低成本、實(shí)時(shí)處理和增強(qiáng)隱私等功能。對于云服務(wù),ML 管道可確保正確利用資源需求,降低處理能力并減少數(shù)據(jù)存儲空間消耗。在模型服務(wù)器上同時(shí)托管不同版本的能力使得對模型進(jìn)行A / B測試成為可能,并且可以為模型改進(jìn)提供有見地的反饋。

機(jī)器學(xué)習(xí)管道的優(yōu)勢包括。

通過映射包含各種專業(yè)輸入的復(fù)雜過程,提供整個(gè)系列階段的全面視圖。

一次專注于序列中的特定步驟可以實(shí)現(xiàn)各個(gè)階段的自動化??梢约蓹C(jī)器學(xué)習(xí)管道,提高生產(chǎn)力并實(shí)現(xiàn)流程自動化。

它提供了輕松調(diào)試整個(gè)代碼并跟蹤特定步驟中的問題的靈活性。

易于部署,根據(jù)需要升級模塊化機(jī)器學(xué)習(xí)管道組件。

提供使用多個(gè)管道的靈活性,這些管道在異構(gòu)系統(tǒng)資源以及不同的存儲位置上可靠協(xié)調(diào)。

每個(gè)機(jī)器學(xué)習(xí)管道將略有不同,具體取決于模型的用例和使用它的組織。但是,由于管道經(jīng)常遵循典型的機(jī)器學(xué)習(xí)生命周期,因此在開發(fā)任何機(jī)器學(xué)習(xí)管道時(shí)必須考慮相同的因素??紤]機(jī)器學(xué)習(xí)的各個(gè)階段,并將每個(gè)階段劃分為不同的模塊,作為該過程的第一步。模塊化方法有助于逐步增強(qiáng)機(jī)器學(xué)習(xí)管道的每個(gè)組件,并更容易專注于管道的各個(gè)部分。

Softnautics憑借其AI工程和機(jī)器學(xué)習(xí)服務(wù),幫助企業(yè)在計(jì)算機(jī)視覺,認(rèn)知計(jì)算,人工智能FPGA加速領(lǐng)域構(gòu)建智能解決方案。我們有能力處理涉及數(shù)據(jù)集、模型開發(fā)、優(yōu)化、測試和部署的完整機(jī)器學(xué)習(xí) (ML) 管道。我們與組織合作開發(fā)高性能的云到邊緣機(jī)器學(xué)習(xí)解決方案,例如面部/手勢識別、人數(shù)統(tǒng)計(jì)、物體/車道檢測、武器檢測、食品分類等,跨越各種平臺。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269365
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132744
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797

    瀏覽量

    84787
收藏 人收藏

    評論

    相關(guān)推薦

    求助,ADC接地的重要性?

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    BGA焊接溫度控制重要性

    `請問BGA焊接溫度控制重要性有哪些?`
    發(fā)表于 03-26 16:41

    Syncer模塊的重要性是什么?

    我在我的項(xiàng)目中使用25G以太網(wǎng)IP。通過打開此IP的示例設(shè)計(jì),我們可以看到許多SYNCER模塊,一個(gè)FSM模塊和一個(gè)流量生成器模塊。我想問一下這些Syncer模塊的重要性是什么,我是否需要在我的最終設(shè)計(jì)中使用所有syncer模塊。
    發(fā)表于 05-18 09:25

    代碼規(guī)范的重要性是什么

    論代碼規(guī)范的重要性
    發(fā)表于 05-19 13:07

    什么是網(wǎng)絡(luò)拓?fù)?,它?b class='flag-5'>重要性是什么?

    什么是網(wǎng)絡(luò)拓?fù)?,它?b class='flag-5'>重要性是什么?
    發(fā)表于 03-17 06:50

    機(jī)器人控制技術(shù)有哪些重要性?

    PID控制的優(yōu)點(diǎn)有哪些?機(jī)器人控制技術(shù)有哪些重要性?
    發(fā)表于 06-18 08:02

    操作系統(tǒng)的重要性如何?

    明白你學(xué)習(xí)操作系統(tǒng)的目的是什么?操作系統(tǒng)的重要性如何?學(xué)習(xí)操作系統(tǒng)會給我?guī)硎裁??下面我會從這幾個(gè)方面為你回答下。操作系統(tǒng)也是一種軟件,但是操作系統(tǒng)是一種非常復(fù)雜的軟件。操作系統(tǒng)提供了幾種抽象模型文件:對 I/O 設(shè)備的抽象虛擬
    發(fā)表于 07-23 08:26

    時(shí)鐘服務(wù)器的重要性是什么?

    時(shí)鐘服務(wù)器的重要性是什么?
    發(fā)表于 11-08 08:31

    UPS的重要性

    中心機(jī)房的UPS太重要了,前不久就出現(xiàn)過停電壞了一個(gè)磁盤陳列硬盤的事故,一個(gè)2T的硬盤壞了,還好有一個(gè)備用的硬盤使用,否則磁盤陳列里的資料就岌岌可危了。服務(wù)器多了,UPS的重要性尤其重要,學(xué)校周邊
    發(fā)表于 11-16 09:09

    arm匯編的重要性是什么?

    arm匯編的重要性是什么?
    發(fā)表于 11-30 08:03

    POE浪涌保護(hù)的重要性是什么?

    POE浪涌保護(hù)的重要性是什么?
    發(fā)表于 01-14 06:07

    學(xué)好VHDL的重要性

    學(xué)好VHDL的重要性,好東西,喜歡的朋友可以下載來學(xué)習(xí)。
    發(fā)表于 01-18 17:04 ?14次下載

    Python如何進(jìn)行特征重要性分析

    特征重要性分析用于了解每個(gè)特征(變量或輸入)對于做出預(yù)測的有用或價(jià)值。目標(biāo)是確定對模型輸出影響最大的最重要的特征,它是機(jī)器學(xué)習(xí)中經(jīng)常使用的
    發(fā)表于 10-13 12:32 ?383次閱讀
    Python如何進(jìn)行特征<b class='flag-5'>重要性</b>分析

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    任務(wù)的解決方法。機(jī)器學(xué)習(xí)重要性體現(xiàn)在幾個(gè)方面數(shù)據(jù)處理能力:在當(dāng)今數(shù)字化時(shí)代,我們產(chǎn)生了大量的數(shù)據(jù)。機(jī)器學(xué)習(xí)能夠處理和分析這些龐大的數(shù)據(jù)集,
    的頭像 發(fā)表于 01-05 08:27 ?1630次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的<b class='flag-5'>重要性</b>體現(xiàn)在哪

    魯棒機(jī)器學(xué)習(xí)中的重要性

    機(jī)器學(xué)習(xí)領(lǐng)域,模型的魯棒是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r(shí),仍能保持性能的能力。隨著人工智能技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-11 10:19 ?422次閱讀