0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

干貨速來!詳析卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特性和應用

analog_devices ? 來源:未知 ? 2023-03-27 22:50 ? 次閱讀

前文《卷積神經(jīng)網(wǎng)絡(luò)簡介:什么是機器學習?》中,我們比較了在微控制器中運行經(jīng)典線性規(guī)劃程序與運行CNN的區(qū)別,并展示了CNN的優(yōu)勢。我們還探討了CIFAR網(wǎng)絡(luò),該網(wǎng)絡(luò)可以對圖像中的貓、房子或自行車等對象進行分類,還可以執(zhí)行簡單的語音識別。本文重點解釋如何訓練這些神經(jīng)網(wǎng)絡(luò)以解決實際問題。

01 神經(jīng)網(wǎng)絡(luò)的訓練過程

前文中討論的CIFAR網(wǎng)絡(luò)由不同層的神經(jīng)元組成。如圖1所示,32 × 32像素的圖像數(shù)據(jù)被呈現(xiàn)給網(wǎng)絡(luò)并通過網(wǎng)絡(luò)層傳遞。CNN處理過程的第一步就是提取待區(qū)分對象的特性和結(jié)構(gòu),這需要借助濾波器矩陣實現(xiàn)。設(shè)計人員對CIFAR網(wǎng)絡(luò)進行建模后,由于最初無法確定這些濾波器矩陣,因此這個階段的網(wǎng)絡(luò)無法檢測模式和對象。

為此,首先需要確定濾波器矩陣的所有參數(shù),以最大限度地提高檢測對象的精度或最大限度地減少損失函數(shù)。這個過程就稱為神經(jīng)網(wǎng)絡(luò)訓練。前文所描述的常見應用在開發(fā)和測試期間只需對網(wǎng)絡(luò)進行一次訓練就可以使用,無需再調(diào)整參數(shù)。如果系統(tǒng)對熟悉的對象進行分類,則無需額外訓練;當系統(tǒng)需要對全新的對象進行分類時,才需要額外進行訓練。

進行網(wǎng)絡(luò)訓練需要使用訓練數(shù)據(jù)集,并使用類似的一組測試數(shù)據(jù)集來測試網(wǎng)絡(luò)的精度。例如CIFAR-10網(wǎng)絡(luò)數(shù)據(jù)集為十個對象類的圖像集合:飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、輪船和卡車。我們必須在訓練CNN之前對這些圖像進行命名,這也是人工智能應用開發(fā)過程中最為復雜的部分。本文討論的訓練過程采用反向傳播的原理,即向網(wǎng)絡(luò)連續(xù)展示大量圖像,并且每次都同時傳送一個目標值。本例的目標值為圖像中相關(guān)的對象類。在每次顯示圖像時,濾波器矩陣都會被優(yōu)化,這樣對象類的目標值就會和實際值相匹配。完成此過程的網(wǎng)絡(luò)就能夠檢測出訓練期間從未看到過的圖像中的對象。

954a4b9c-ccae-11ed-bfe3-dac502259ad0.svg

圖1.CIFAR CNN架構(gòu)。

95612b6e-ccae-11ed-bfe3-dac502259ad0.svg

圖2.由前向傳播和反向傳播組成的訓練循環(huán)。

02 過擬合和欠擬合

在神經(jīng)網(wǎng)絡(luò)的建模過程中經(jīng)常會出現(xiàn)的問題是:神經(jīng)網(wǎng)絡(luò)應該有多少層,或者是神經(jīng)網(wǎng)絡(luò)的濾波器矩陣應該有多大?;卮疬@個問題并非易事,因此討論網(wǎng)絡(luò)的過擬合和欠擬合至關(guān)重要。過擬合由模型過于復雜以及參數(shù)過多而導致。我們可以通過比較訓練數(shù)據(jù)集和測試數(shù)據(jù)集的損失來確定預測模型與訓練數(shù)據(jù)集的擬合程度。如果訓練期間損失較低并且在向網(wǎng)絡(luò)呈現(xiàn)從未顯示過的測試數(shù)據(jù)時損失過度增加,這就強烈表明網(wǎng)絡(luò)已經(jīng)記住了訓練數(shù)據(jù)而不是在實施模式識別。此類情況主要發(fā)生在網(wǎng)絡(luò)的參數(shù)存儲空間過大或者網(wǎng)絡(luò)的卷積層過多的時候。這種情況下應當縮小網(wǎng)絡(luò)規(guī)模。

03 損失函數(shù)和訓練算法

學習分兩個步驟進行。第一步,向網(wǎng)絡(luò)展示圖像,然后由神經(jīng)元網(wǎng)絡(luò)處理這些圖像生成一個輸出矢量。輸出矢量的最大值表示檢測到的對象類,例如示例中的"狗",該值不一定是正確的。這一步稱為前向傳播。

目標值與輸出時產(chǎn)生的實際值之間的差值稱為損失,相關(guān)函數(shù)則稱為損失函數(shù)。網(wǎng)絡(luò)的所有要素和參數(shù)均包含在損失函數(shù)中。神經(jīng)網(wǎng)絡(luò)的學習過程旨在以最小化損失函數(shù)的方式定義這些參數(shù)。這種最小化可通過反向傳播的過程實現(xiàn)。在反向傳播的過程中,輸出產(chǎn)生的偏置(損失 = 目標值-實際值)通過網(wǎng)絡(luò)的各層反饋,直至達到網(wǎng)絡(luò)的起始層。

因此,前向傳播和反向傳播在訓練過程中產(chǎn)生了一個可以逐步確定濾波器矩陣參數(shù)的循環(huán)。這種循環(huán)過程會不斷重復,直至損失值降至一定程度以下。

04 優(yōu)化算法、梯度和梯度下降法

為說明訓練過程,圖3顯示了一個包含x和y兩個參數(shù)的損失函數(shù)的示例,這里z軸對應于損失。如果我們仔細查看該損失函數(shù)的三維函數(shù)圖,我們就會發(fā)現(xiàn)這個函數(shù)有一個全局最小值和一個局部最小值。

目前,有大量數(shù)值優(yōu)化算法可用于確定權(quán)重和偏置。其中,梯度下降法最為簡單。梯度下降法的理念是使用梯度算子在逐步訓練的過程中找到一條通向全局最小值的路徑,該路徑的起點從損失函數(shù)中隨機選擇。梯度算子是一個數(shù)學運算符,它會在損失函數(shù)的每個點生成一個梯度矢量。該矢量的方向指向函數(shù)值變化最大的方向,幅度對應于函數(shù)值的變化程度。在圖3的函數(shù)中,右下角(紅色箭頭處)由于表面平坦,因此梯度矢量的幅度較小。而接近峰值時的情況則完全不同。此處矢量(綠色箭頭)的方向急劇向下,并且由于此處高低差明顯,梯度矢量的幅度也較大。

957cdd8c-ccae-11ed-bfe3-dac502259ad0.svg

圖3.使用梯度下降法確定到最小值的不同路徑。

因此我們可以利用梯度下降法從任意選定的起點開始以迭代的方式尋找下降至山谷的最陡峭路徑。這意味著優(yōu)化算法會在起點計算梯度,并沿最陡峭的下降方向前進一小步。之后算法會重新計算該點的梯度,繼續(xù)尋找創(chuàng)建一條從起點到山谷的路徑。這種方法的問題在于起點并非是提前定義的,而是隨機選擇的。在我們的三維地圖中,某些細心的讀者會將起點置于函數(shù)圖左側(cè)的某個位置,以確保路徑的終點為全局最小值(如藍色路徑所示)。其他兩個路徑(黃色和橙色)要么非常長,要么終點位于局部最小值。但是,算法必須對成千上萬個參數(shù)進行優(yōu)化,顯然起點的選擇不可能每次都碰巧正確。在具體實踐中,這種方法用處不大。因為所選擇的起點可能會導致路徑(即訓練時間)較長,或者目標點并不位于全局最小值,導致網(wǎng)絡(luò)的精度下降。

因此,為避免上述問題,過去幾年已開發(fā)出大量可作為替代的優(yōu)化算法。一些替代的方法包括隨機梯度下降法、動量法、AdaGrad方法、RMSProp方法、Adam方法等。鑒于每種算法都有其特定的優(yōu)缺點,實踐中具體使用的算法將由網(wǎng)絡(luò)開發(fā)人員決定。

05 訓練數(shù)據(jù)

在訓練過程中,我們會向網(wǎng)絡(luò)提供標有正確對象類的圖像,如汽車、輪船等。本例使用了已有的 CIFAR-10 dataset。當然,在具體實踐中,人工智能可能會用于識別貓、狗和汽車之外的領(lǐng)域。這可能需要開發(fā)新應用,例如檢測制造過程中螺釘?shù)馁|(zhì)量必須使用能夠區(qū)分好壞螺釘?shù)挠柧殧?shù)據(jù)對網(wǎng)絡(luò)進行訓練。創(chuàng)建此類數(shù)據(jù)集極其耗時費力,往往是開發(fā)人工智能應用過程中成本最高的一步。編譯完成的數(shù)據(jù)集分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集。訓練數(shù)據(jù)集用于訓練,而測試數(shù)據(jù)則用于在開發(fā)過程的最后檢查訓練好的網(wǎng)絡(luò)的功能。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 亞德諾
    +關(guān)注

    關(guān)注

    6

    文章

    4680

    瀏覽量

    15956

原文標題:干貨速來!詳析卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特性和應用

文章出處:【微信號:analog_devices,微信公眾號:analog_devices】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)有何用途 卷積神經(jīng)網(wǎng)絡(luò)通常運用在哪里

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理、生物信息學等領(lǐng)域。本文將介紹卷積
    的頭像 發(fā)表于 07-11 14:43 ?2387次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本概念、原理及特點

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習算法,它在圖像識別、視頻分析、自然語言處理等領(lǐng)域有著廣泛的應用。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-11 14:38 ?1063次閱讀

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是兩種在人工智能和機器
    的頭像 發(fā)表于 07-10 15:24 ?1524次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學習領(lǐng)域中兩種非常重要的
    的頭像 發(fā)表于 07-04 14:24 ?1301次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-03 10:49 ?553次閱讀

    bp神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是兩種不同類型的人工
    的頭像 發(fā)表于 07-03 10:12 ?1192次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等計算機視覺任務。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-03 09:40 ?471次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和工作原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-03 09:38 ?639次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)CNN)是一種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等領(lǐng)域。本文將詳細介紹CNN在分類任務中的應用,包括基本結(jié)構(gòu)、關(guān)鍵技術(shù)、常見
    的頭像 發(fā)表于 07-03 09:28 ?628次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)三大特點是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。CNN具有以下三大特點: 局
    的頭像 發(fā)表于 07-03 09:26 ?1242次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓練的是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-03 09:15 ?412次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 卷積
    的頭像 發(fā)表于 07-02 16:47 ?581次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)cnn模型有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 CNN的基本概念 1.1
    的頭像 發(fā)表于 07-02 15:24 ?722次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-02 14:44 ?655次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡稱BPNN)是兩
    的頭像 發(fā)表于 07-02 14:24 ?4019次閱讀