0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)增強(qiáng)及其在機(jī)器學(xué)習(xí)中的重要性

星星科技指導(dǎo)員 ? 來(lái)源:VOLANSYS ? 作者:Aekam Parmar ? 2022-12-05 17:26 ? 次閱讀

數(shù)據(jù)的數(shù)量和變化對(duì)于大多數(shù) ML 模型(例如深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型)的性能非常重要。因此,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練需要一個(gè)非常大的數(shù)據(jù)集。只有它才能達(dá)到生產(chǎn)就緒模型中預(yù)期的精度。

假設(shè)您有少量可用的數(shù)據(jù)集,不足以訓(xùn)練模型,并且您不知道如何生成具有所需數(shù)據(jù)變體的足夠數(shù)據(jù)集。這正是“數(shù)據(jù)增強(qiáng)”有助于實(shí)現(xiàn)的目標(biāo)。

什么是數(shù)據(jù)增強(qiáng)?

數(shù)據(jù)增強(qiáng)是一種通過(guò)向現(xiàn)有數(shù)據(jù)集添加某些變體并將其添加到原始數(shù)據(jù)集以生成“略微修改和乘法”數(shù)據(jù)來(lái)人為增加數(shù)據(jù)集體積的技術(shù)。您可以獲取數(shù)據(jù)集中的所有可用樣本,并以不同的方式對(duì)其進(jìn)行多次修改,以獲得更大的數(shù)據(jù)集。

數(shù)據(jù)集在模型訓(xùn)練中的重要性

機(jī)器學(xué)習(xí)管道的第一階段是生成或獲取用于訓(xùn)練機(jī)器學(xué)習(xí)模型所需的數(shù)據(jù)集。機(jī)器學(xué)習(xí)模型足夠智能,可以識(shí)別訓(xùn)練的對(duì)象。但是,如果他們不是培訓(xùn)的一部分,他們就不那么聰明,無(wú)法處理不同的場(chǎng)景。

例如,如果訓(xùn)練模型時(shí)所有訓(xùn)練圖像僅在一個(gè)特定方向上對(duì)齊,則它可能無(wú)法識(shí)別水平和/或垂直翻轉(zhuǎn)圖像中的對(duì)象。這樣做的原因是它產(chǎn)生的特征與它在訓(xùn)練期間學(xué)習(xí)的特征不同,即使它們屬于同一個(gè)對(duì)象。

在大多數(shù)情況下,高質(zhì)量數(shù)據(jù)的可用性始終是一個(gè)大問(wèn)題。它可能少量可用,也可能根本不可用。在這種情況下,收集足以達(dá)到所需精度的數(shù)據(jù)集將是一個(gè)挑戰(zhàn)。如果數(shù)據(jù)集的數(shù)量不足或變化程度不高,則可能導(dǎo)致擬合不足或過(guò)度擬合。

為什么數(shù)據(jù)增強(qiáng)很重要?

在機(jī)器學(xué)習(xí)模型中,收集和標(biāo)記數(shù)據(jù)是一個(gè)繁瑣且成本高昂的過(guò)程。數(shù)據(jù)增強(qiáng)可以轉(zhuǎn)換為數(shù)據(jù)集,幫助組織降低運(yùn)營(yíng)成本。同時(shí),它解決了數(shù)據(jù)集大小有限和數(shù)據(jù)變化有限的問(wèn)題。這提高了模型在各種方案中的整體性能。

它是如何工作的?

根據(jù)數(shù)據(jù)集的類型,可以使用不同的數(shù)據(jù)增強(qiáng)技術(shù)。有許多數(shù)據(jù)增強(qiáng)技術(shù)可用于圖像/視頻音頻和文本數(shù)據(jù)。我們將詳細(xì)探討圖像/視頻數(shù)據(jù)增強(qiáng)方法。

圖像/視頻中的數(shù)據(jù)增強(qiáng)技術(shù)

圖像/視頻將 RGB 信息存儲(chǔ)在 2D 數(shù)組中。主要的數(shù)據(jù)增強(qiáng)技術(shù)可能是改變圖像的方向、改變圖像的分辨率/大小以及改變 RGB(像素)值。

這些選項(xiàng)的不同組合可以導(dǎo)致更多的增強(qiáng)方法。imgaug庫(kù)提供了許多不同的圖像數(shù)據(jù)增強(qiáng)選項(xiàng),如下所示。

算術(shù):-此類操作更改整個(gè)圖像或其某些部分的像素值。加法和乘法選項(xiàng)將像素值相加和相乘一個(gè)隨機(jī)數(shù)(在預(yù)定義范圍內(nèi)生成)。對(duì)于所有像素,此數(shù)字可能相同,對(duì)于相鄰像素,此數(shù)字可能不同。有一些選項(xiàng)可以將隨機(jī)像素或像素簇設(shè)置為常量值。類似的選項(xiàng)是為整個(gè)圖像添加某些噪點(diǎn)。此外,還可以反轉(zhuǎn)像素值

藝術(shù)的:-此類別提供了將圖像樣式轉(zhuǎn)換為卡通圖像的選項(xiàng)

模糊:-此類別提供了不同的選項(xiàng)來(lái)模糊圖像內(nèi)容??赡艿倪x項(xiàng)是GaussianBlur,AverageBlur,MedianBlur,BilateralBlur,MotionBlur,MeanShiftBlur

顏色:-此類操作針對(duì)色彩空間、亮度、色調(diào)和飽和度。色彩空間選項(xiàng)的一個(gè)示例是將 RGB 轉(zhuǎn)換為 HSV,然后將隨機(jī)值(每個(gè)圖像均勻采樣)添加到 Hue 通道,并轉(zhuǎn)換回 RGB。有一些選項(xiàng)可以對(duì)亮度、飽和度和色調(diào)執(zhí)行加法和乘法運(yùn)算。

反差:-此類操作專用于對(duì)比度處理??捎眠x項(xiàng)包括伽馬對(duì)比度、Sigmoid 對(duì)比度、對(duì)數(shù)對(duì)比度、線性對(duì)比度

卷 積:-顧名思義,此類操作與具有預(yù)定義矩陣值的卷積圖像有關(guān)。它提供了更改清晰度、添加浮雕效果和檢測(cè)圖像邊緣的選項(xiàng)

空翻:-這是一個(gè)廣泛使用的選項(xiàng),它具有水平和/或垂直翻轉(zhuǎn)圖像的選項(xiàng)

幾何:-此類操作可以縮放圖像(如放大和縮小),移動(dòng)圖像(水平和/或垂直)并向圖像的另一端添加填充,以及旋轉(zhuǎn)圖像

Imgcorruptlike:-此類選項(xiàng)會(huì)向圖像添加不同的噪點(diǎn),例如高斯噪點(diǎn)、散粒噪點(diǎn)、脈沖噪點(diǎn)、散斑噪點(diǎn)。它還提供不同的圖像模糊選項(xiàng),如高斯模糊、玻璃模糊、散焦模糊、運(yùn)動(dòng)模糊、縮放模糊。此外,還可以應(yīng)用霧、霜、雪和飛濺效果

大?。?此類別的選項(xiàng)執(zhí)行與圖像大小相關(guān)的操作??梢愿鶕?jù)特定的高度和寬度或調(diào)整大小的百分比調(diào)整圖像大小。圖像的裁剪和填充可以應(yīng)用于圖像的特定大小

圖像數(shù)據(jù)增強(qiáng)通過(guò)生成所需級(jí)別的數(shù)據(jù)集,無(wú)疑提高了模型的準(zhǔn)確性。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電橋電子測(cè)試重要性

    電橋電子測(cè)試重要性體現(xiàn)在多個(gè)方面,以下是詳細(xì)的分析: 一、精確測(cè)量電參數(shù) 電橋作為一種精密的測(cè)量工具,能夠精確測(cè)量電阻、電容、電感等電
    的頭像 發(fā)表于 01-09 10:03 ?123次閱讀

    PROM器件物聯(lián)網(wǎng)設(shè)備重要性

    PROM器件(Programmable Read-Only Memory,可編程只讀存儲(chǔ)器)物聯(lián)網(wǎng)(IoT)設(shè)備扮演著至關(guān)重要的角色。以下是關(guān)于PROM器件物聯(lián)網(wǎng)設(shè)備
    的頭像 發(fā)表于 11-23 11:35 ?317次閱讀

    PCBA加工的靈魂:揭秘芯片燒錄的重要性

    一站式PCBA智造廠家今天為大家講講什么是PCBA芯片燒錄?PCBA加工芯片燒錄的重要性。PCBA(Printed Circuit Board Assembly)一站式服務(wù),芯片
    的頭像 發(fā)表于 11-20 09:34 ?240次閱讀

    魯棒機(jī)器學(xué)習(xí)重要性

    金融風(fēng)險(xiǎn)評(píng)估。這些應(yīng)用場(chǎng)景對(duì)模型的魯棒提出了極高的要求。 魯棒的定義 魯棒通常被定義為系統(tǒng)面對(duì)不確定性和變化時(shí)仍能保持其功能的能力。
    的頭像 發(fā)表于 11-11 10:19 ?450次閱讀

    ?選對(duì)波長(zhǎng)對(duì)固化時(shí)候的重要性

    的。本文將探討波長(zhǎng)選擇固化過(guò)程重要性,并介紹幾種常見(jiàn)的波長(zhǎng)及其應(yīng)用場(chǎng)景。波長(zhǎng)是光的一種特性,它決定了光的能量分布和穿透能力。固化過(guò)程
    的頭像 發(fā)表于 11-08 14:15 ?358次閱讀
    ?選對(duì)波長(zhǎng)對(duì)<b class='flag-5'>在</b>固化時(shí)候的<b class='flag-5'>重要性</b>

    元器件電路設(shè)計(jì)重要性

    元器件電路設(shè)計(jì)重要性是不言而喻的,它們構(gòu)成了電路的基本單元,并決定了電路的功能、性能以及可靠。以下從幾個(gè)方面詳細(xì)闡述元器件電路設(shè)計(jì)
    的頭像 發(fā)表于 10-29 16:17 ?490次閱讀

    自動(dòng)處理結(jié)果庫(kù)國(guó)際監(jiān)測(cè)系統(tǒng)(IMS)臺(tái)站及監(jiān)測(cè)站能譜數(shù)據(jù)管理重要性及其應(yīng)用

    自動(dòng)處理結(jié)果庫(kù)國(guó)際監(jiān)測(cè)系統(tǒng)(IMS)臺(tái)站及監(jiān)測(cè)站能譜數(shù)據(jù)管理重要性及其應(yīng)用 摘要: 本文探討了自動(dòng)處理結(jié)果庫(kù)
    的頭像 發(fā)表于 09-10 18:17 ?290次閱讀

    IO模塊的作用及其工業(yè)生產(chǎn)中的重要性

    IO模塊,作為自動(dòng)化控制系統(tǒng)的重要組成部分,發(fā)揮著至關(guān)重要的作用。本文為您介紹IO模塊工業(yè)生產(chǎn)中的作用及其重要性。
    的頭像 發(fā)表于 07-17 15:59 ?835次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,
    的頭像 發(fā)表于 07-09 15:57 ?516次閱讀

    NLP技術(shù)人工智能領(lǐng)域的重要性

    智能的橋梁,其重要性日益凸顯。本文將從NLP的定義、發(fā)展歷程、核心技術(shù)、應(yīng)用領(lǐng)域以及對(duì)人工智能領(lǐng)域的深遠(yuǎn)影響等多個(gè)維度,深入探討NLP技術(shù)人工智能領(lǐng)域的重要性。
    的頭像 發(fā)表于 07-04 16:03 ?623次閱讀

    IoT網(wǎng)關(guān)在工業(yè)應(yīng)用重要性及應(yīng)用

    。IoT網(wǎng)關(guān)的核心功能在于其數(shù)據(jù)匯集、協(xié)議轉(zhuǎn)換、遠(yuǎn)程管理、安全防護(hù)等方面,是物聯(lián)網(wǎng)設(shè)備與云端服務(wù)平臺(tái)之間溝通的橋梁。 ? 二、IoT網(wǎng)關(guān)在工業(yè)應(yīng)用重要性 工業(yè)領(lǐng)域,IoT網(wǎng)關(guān)的應(yīng)
    的頭像 發(fā)表于 06-12 16:17 ?458次閱讀

    AC/DC電源模塊的原理、特點(diǎn)以及其實(shí)際應(yīng)用重要性

    BOSHIDA ?AC/DC電源模塊的原理、特點(diǎn)以及其實(shí)際應(yīng)用重要性 AC/DC電源模塊是一種用于將交流電轉(zhuǎn)換為直流電的設(shè)備,廣泛應(yīng)用于各種電子設(shè)備
    的頭像 發(fā)表于 06-11 14:11 ?666次閱讀
    AC/DC電源模塊的原理、特點(diǎn)以<b class='flag-5'>及其</b><b class='flag-5'>在</b>實(shí)際應(yīng)用<b class='flag-5'>中</b>的<b class='flag-5'>重要性</b>

    求助,ADC接地的重要性?

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    論RISC-V的MCUUART接口的重要性

    的適用重要性。某些應(yīng)用場(chǎng)景,只需要異步通信能力的UART接口就能滿足需求,從而簡(jiǎn)化了系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)。 綜上所述,RISC-V的MCU
    發(fā)表于 05-27 15:52

    工業(yè)路由器工業(yè)場(chǎng)景重要性

    工業(yè)路由器的重要性逐漸顯現(xiàn),其推動(dòng)工業(yè)自動(dòng)化、提高生產(chǎn)效率、增強(qiáng)設(shè)備兼容以及保證數(shù)據(jù)安全等方面發(fā)揮著不可替代的作用。本文將詳細(xì)闡述工業(yè)路
    的頭像 發(fā)表于 04-17 16:14 ?359次閱讀