0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何提升神經(jīng)網(wǎng)絡性能

電子工程師 ? 來源:工程師曾玲 ? 2019-05-02 17:10 ? 次閱讀

本文簡要介紹了提升神經(jīng)網(wǎng)絡性能的方法,如檢查過擬合、調參、超參數(shù)調節(jié)、數(shù)據(jù)增強。

神經(jīng)網(wǎng)絡是一種在很多用例中能夠提供最優(yōu)準確率的機器學習算法。但是,很多時候我們構建的神經(jīng)網(wǎng)絡的準確率可能無法令人滿意,或者無法讓我們在數(shù)據(jù)科學競賽中拿到領先名次。所以,我們總是在尋求更好的方式來改善模型的性能。有很多技術可以幫助我們達到這個目標。本文將介紹這些技術,幫助大家構建更準確的神經(jīng)網(wǎng)絡。

檢查過擬合

如何提升神經(jīng)網(wǎng)絡性能

保證神經(jīng)網(wǎng)絡在測試集上運行良好的第一步就是驗證神經(jīng)網(wǎng)絡沒有過擬合。什么是過擬合呢?當你的模型開始記錄訓練數(shù)據(jù)而不是從中學習的時候,就發(fā)生了過擬合。然后,當你的模型遇到之前沒有見過的數(shù)據(jù)時,它就無法很好的運行。為了更好地理解,我們來看一個類比。我們有一個記性特好的同學,假設一次數(shù)學考試馬上就要來臨了。你和這位擅長記憶的同學開始學習課本。這名同學記住課本中的每一個公式、問題以及問題的答案,然而你要比他來得聰明一些,所以你決定以直覺為基礎、解決問題、學習這些公式是如何發(fā)揮作用的。考試來了,如果試卷中的問題是直接來源于課本的,那么可以想像那名記憶力超群的同學發(fā)揮得更好,但是,如果試題是涉及應用直觀知識的全新問題,那么你將會做得更好,而你的朋友會慘敗。

如何鑒別模型是否過擬合呢?你僅僅需要交叉檢查訓練準確率和測試準確率。如果訓練準確率遠遠高出了測試準確率,那么可以斷定你的模型是過擬合了。你也可以在圖中畫出預測點來驗證。下面是一些避免過擬合的技術:

數(shù)據(jù)正則化(L1 或 L2);

Dropout:隨機丟棄一些神經(jīng)元之間的連接,強制神經(jīng)網(wǎng)絡尋找新的路徑并泛化;

早停(Early Stopping):促使神經(jīng)網(wǎng)絡訓練早點停止,以減少在測試集中的誤差。

超參數(shù)調節(jié)

如何提升神經(jīng)網(wǎng)絡性能

超參數(shù)是你必須給網(wǎng)絡初始化的值,這些數(shù)值不能在訓練的過程中學到。在卷積神經(jīng)網(wǎng)絡中,這些超參數(shù)包括:核大小、神經(jīng)網(wǎng)絡層數(shù)、激活函數(shù)、損失函數(shù)、所用的優(yōu)化器(梯度下降、RMSprop)、批大小、訓練的 epoch 數(shù)量等等。

每個神經(jīng)網(wǎng)絡都會有最佳超參數(shù)組合,這組參數(shù)能夠得到最大的準確率。你也許會問,「有這么多超參數(shù),我如何選擇每個參數(shù)呢?」不幸的是,對每個神經(jīng)網(wǎng)絡而言,并沒有確定最佳超參數(shù)組合的直接方法,所以通常都是通過反復試驗得到的。但是也有一些關于上述超參數(shù)的最佳實踐:

學習率:選擇最優(yōu)學習率是很重要的,因為它決定了神經(jīng)網(wǎng)絡是否可以收斂到全局最小值。選擇較高的學習率幾乎從來不能到達全局最小值,因為你很可能跳過它。所以,你總是在全局最小值附近,但是從未收斂到全局最小值。選擇較小的學習率有助于神經(jīng)網(wǎng)絡收斂到全局最小值,但是會花費很多時間。這樣你必須用更多的時間來訓練神經(jīng)網(wǎng)絡。較小的學習率也更可能使神經(jīng)網(wǎng)絡困在局部極小值里面,也就是說,神經(jīng)網(wǎng)絡會收斂到一個局部極小值,而且因為學習率比較小,它無法跳出局部極小值。所以,在設置學習率的時候你必須非常謹慎。

神經(jīng)網(wǎng)絡架構:并不存在能夠在所有的測試集中帶來高準確率的標準網(wǎng)絡架構。你必須實驗,嘗試不同的架構,從實驗結果進行推斷,然后再嘗試。我建議使用已經(jīng)得到驗證的架構,而不是構建自己的網(wǎng)絡架構。例如:對于圖像識別任務,有 VGG net、Resnet、谷歌的 Inception 網(wǎng)絡等。這些都是開源的,而且已經(jīng)被證明具有較高的準確率。所以你可以把這些架構復制過來,然后根據(jù)自己的目的做一些調整。

優(yōu)化器和損失函數(shù):這方面有很多可供選擇。事實上,如果有必要,你可以自定義損失函數(shù)。常用的優(yōu)化器有 RMSprop、隨機梯度下降和 Adam。這些優(yōu)化器貌似在很多用例中都可以起作用。如果你的任務是分類任務,那么常用的損失函數(shù)是類別交叉熵。如果你在執(zhí)行回歸任務,那么均方差是最常用的損失函數(shù)。你可以自由地使用這些優(yōu)化器超參數(shù)進行試驗,也可以使用不同的優(yōu)化器和損失函數(shù)。

批大小和 epoch 次數(shù):同樣,沒有適用于所有用例的批大小和 epoch 次數(shù)的標準值。你必須進行試驗,嘗試不同的選擇。在通常的實踐中,批大小被設置為 8、16、32……epoch 次數(shù)則取決于開發(fā)者的偏好以及他/她所擁有的計算資源。

激活函數(shù):激活函數(shù)映射非線性函數(shù)輸入和輸出。激活函數(shù)是特別重要的,選擇合適的激活函數(shù)有助于模型學習得更好?,F(xiàn)在,整流線性單元(ReLU)是最廣泛使用的激活函數(shù),因為它解決了梯度消失的問題。更早時候,Sigmoid 和 Tanh 函數(shù)都是最常用的激活函數(shù)。但是它們都會遇到梯度消失的問題,即在反向傳播中,梯度在到達初始層的過程中,值在變小,趨向于 0。這不利于神經(jīng)網(wǎng)絡向具有更深層的結構擴展。ReLU 克服了這個問題,因此也就可以允許神經(jīng)網(wǎng)絡擴展到更深的層。

ReLU 激活函數(shù)

算法集成

如果單個神經(jīng)網(wǎng)絡不像你期待的那樣準確,那么你可以創(chuàng)建一個神經(jīng)網(wǎng)絡集成,結合多個網(wǎng)絡的預測能力。你可以選擇不同的神經(jīng)網(wǎng)絡架構,在不同部分的數(shù)據(jù)集上訓練它們,然后使用它們的集合預測能力在測試集上達到較高的準確率。假設你在構建一個貓狗分類器,0 代表貓,1 代表狗。當組合不同的貓狗分類器時,基于單個分類器之間的皮爾遜相關系數(shù),集成算法的準確率有了提升。讓我們看一個例子,拿 3 個模型來衡量它們各自的準確率:

Ground Truth: 1111111111 Classifier 1: 1111111100 = 80% accuracy Classifier 2: 1111111100 = 80% accuracy Classifier 3: 1011111100 = 70% accuracy

3 個模型的皮爾遜相關系數(shù)很高。所以,集成它們并不會提升準確率。如果我們使用多數(shù)投票的方式來組合這三個模型,會得到下面的結果:

Ensemble Result: 1111111100 = 80% accuracy

現(xiàn)在,讓我們來看一組輸出具備較低皮爾遜相關系數(shù)的模型:

Ground Truth: 1111111111 Classifier 1: 1111111100 = 80% accuracy Classifier 2: 0111011101 = 70% accuracy Classifier 3: 1000101111 = 60% accuracy

當我們組合這三個弱學習器的時候,會得到以下結果:

Ensemble Result: 1111111101 = 90% accuracy

正如你在上面所看到的,具有低皮爾遜相關系數(shù)的弱學習器的組合優(yōu)于具有較高皮爾遜相關系數(shù)的學習器的組合。

缺乏數(shù)據(jù)

在使用了上述所有的技術以后,如果你的模型仍然沒有在測試集上表現(xiàn)得更好一些,這可能是因為缺乏數(shù)據(jù)。在很多用例中訓練數(shù)據(jù)的數(shù)量是有限的。如果你無法收集更多的數(shù)據(jù),那么你可以采取數(shù)據(jù)增強方法。

數(shù)據(jù)增強技術

如果你正在使用的是圖像數(shù)據(jù)集,你可以通過剪切、翻轉、隨機裁剪等方法來增加新的圖像。這可以為你正在訓練的神經(jīng)網(wǎng)絡提供不同的樣本。

結論

這些技術被認為是最佳實踐經(jīng)驗,在提升模型學習特征的能力方面通常是有效的。希望對大家有所幫助。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    神經(jīng)網(wǎng)絡教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡的構成  第2章人工神經(jīng)網(wǎng)絡基本模型  2.1 MP模型  2.2 感知器模型  2.3
    發(fā)表于 03-20 11:32

    神經(jīng)網(wǎng)絡簡介

    神經(jīng)網(wǎng)絡簡介
    發(fā)表于 08-05 21:01

    神經(jīng)網(wǎng)絡基本介紹

    神經(jīng)網(wǎng)絡基本介紹
    發(fā)表于 01-04 13:41

    全連接神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡有什么區(qū)別

    全連接神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的區(qū)別
    發(fā)表于 06-06 14:21

    卷積神經(jīng)網(wǎng)絡如何使用

    卷積神經(jīng)網(wǎng)絡(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡在工程上經(jīng)歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發(fā)表于 07-17 07:21

    【案例分享】ART神經(jīng)網(wǎng)絡與SOM神經(jīng)網(wǎng)絡

    今天學習了兩個神經(jīng)網(wǎng)絡,分別是自適應諧振(ART)神經(jīng)網(wǎng)絡與自組織映射(SOM)神經(jīng)網(wǎng)絡。整體感覺不是很難,只不過一些最基礎的概念容易理解不清。首先ART神經(jīng)網(wǎng)絡是競爭學習的一個代表,
    發(fā)表于 07-21 04:30

    CMSIS-NN神經(jīng)網(wǎng)絡內核助力微控制器效率提升

    自然會想到Arm Cortex-M系列處理器內核,那么如果您想要強化它的性能并且減少內存消耗,CMSIS-NN就是您最好的選擇。基于CMSIS-NN內核的神經(jīng)網(wǎng)絡推理運算,對于運行時間/吞吐量將會有4.6X的提升,而對于能效將有
    發(fā)表于 07-23 08:08

    如何設計BP神經(jīng)網(wǎng)絡圖像壓縮算法?

    神經(jīng)網(wǎng)絡的并行特點,而且它還可以根據(jù)設計要求配置硬件結構,例如根據(jù)實際需要,可靈活設計數(shù)據(jù)的位寬等。隨著數(shù)字集成電路技術的飛速發(fā)展,F(xiàn)PGA芯片的處理能力得到了極大的提升,已經(jīng)完全可以承擔神經(jīng)網(wǎng)絡數(shù)據(jù)壓縮
    發(fā)表于 08-08 06:11

    什么是LSTM神經(jīng)網(wǎng)絡

    簡單理解LSTM神經(jīng)網(wǎng)絡
    發(fā)表于 01-28 07:16

    基于FPGA的神經(jīng)網(wǎng)絡性能評估及局限性

    FPGA實現(xiàn)神經(jīng)網(wǎng)絡關鍵問題分析基于FPGA的ANN實現(xiàn)方法基于FPGA的神經(jīng)網(wǎng)絡性能評估及局限性
    發(fā)表于 04-30 06:58

    如何構建神經(jīng)網(wǎng)絡?

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預測的計算系統(tǒng)。如何構建神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反向傳播優(yōu)化輸入變量權重的層,以提高模型的預測
    發(fā)表于 07-12 08:02

    基于BP神經(jīng)網(wǎng)絡的PID控制

    最近在學習電機的智能控制,上周學習了基于單神經(jīng)元的PID控制,這周研究基于BP神經(jīng)網(wǎng)絡的PID控制。神經(jīng)網(wǎng)絡具有任意非線性表達能力,可以通過對系統(tǒng)性能的學習來實現(xiàn)具有最佳組合的PID控
    發(fā)表于 09-07 07:43

    圖像預處理和改進神經(jīng)網(wǎng)絡推理的簡要介紹

    提升識別準確率,采用改進神經(jīng)網(wǎng)絡,通過Mnist數(shù)據(jù)集進行訓練。整體處理過程分為兩步:圖像預處理和改進神經(jīng)網(wǎng)絡推理。圖像預處理主要根據(jù)圖像的特征,將數(shù)據(jù)處理成規(guī)范的格式,而改進神經(jīng)網(wǎng)絡
    發(fā)表于 12-23 08:07

    神經(jīng)網(wǎng)絡移植到STM32的方法

    神經(jīng)網(wǎng)絡移植到STM32最近在做的一個項目需要用到網(wǎng)絡進行擬合,并且將擬合得到的結果用作控制,就在想能不能直接在單片機上做神經(jīng)網(wǎng)絡計算,這樣就可以實時計算,不依賴于上位機。所以要解決的主要是兩個
    發(fā)表于 01-11 06:20

    卷積神經(jīng)網(wǎng)絡模型發(fā)展及應用

    神經(jīng)網(wǎng)絡已經(jīng)廣泛應用于圖像分類、目標檢測、語義分割以及自然語言處理等領域。首先分析了典型卷積神經(jīng)網(wǎng)絡模型為提高其性能增加網(wǎng)絡深度以及寬度的模型結構,分析了采用注意力機制進一步
    發(fā)表于 08-02 10:39

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品