0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【每天學(xué)點(diǎn)AI】前向傳播、損失函數(shù)、反向傳播

華清遠(yuǎn)見(jiàn)工控 ? 2024-11-15 10:32 ? 次閱讀

深度學(xué)習(xí)的領(lǐng)域中,前向傳播、反向傳播和損失函數(shù)是構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的三個(gè)核心概念。今天,小編將通過(guò)一個(gè)簡(jiǎn)單的實(shí)例,解釋這三個(gè)概念,并展示它們的作用。

前向傳播:神經(jīng)網(wǎng)絡(luò)的“思考”過(guò)程

前向傳播是神經(jīng)網(wǎng)絡(luò)計(jì)算的基礎(chǔ)步驟,它涉及將輸入數(shù)據(jù)逐層傳遞,通過(guò)神經(jīng)網(wǎng)絡(luò)的權(quán)重和激活函數(shù),最終輸出預(yù)測(cè)結(jié)果。這個(gè)過(guò)程包含“樣本數(shù)據(jù)輸入、算法模型、輸出”這幾個(gè)步驟。

我們來(lái)舉個(gè)簡(jiǎn)單的例子,比如給一個(gè)小寶寶看一張圖片,然后問(wèn)他:“這上面畫的是什么?”他就會(huì)用他的小腦袋瓜去“思考”這張圖片,然后告訴你答案。前向傳播就像是這個(gè)過(guò)程,只不過(guò)小寶寶換成了神經(jīng)網(wǎng)絡(luò)。

  • 樣本數(shù)據(jù)輸入:這一步將圖像、文字、語(yǔ)音等樣本數(shù)據(jù)轉(zhuǎn)換為我們電腦能識(shí)別的數(shù)字輸入。就像小寶寶看到圖片,神經(jīng)網(wǎng)絡(luò)也接收到一張圖片,這張圖片被轉(zhuǎn)換成一串?dāng)?shù)字。
  • 算法模型:簡(jiǎn)單來(lái)說(shuō),就是一些數(shù)學(xué)計(jì)算,主要包含線性層+規(guī)則化層+激活,線性層負(fù)責(zé)做線性函數(shù)的擬合;規(guī)則化層負(fù)責(zé)把我們的線性擬合規(guī)則化,方便后面的計(jì)算;激活層負(fù)責(zé)的是變成非線性化,因?yàn)槲覀兊默F(xiàn)實(shí)世界是非線性的。所以整個(gè)過(guò)程就是:我們輸入的樣本是非線性的,我們通過(guò)這樣一堆數(shù)學(xué)公式,去擬合非線性的樣本數(shù)據(jù)。
  • 輸出層:也是一些數(shù)學(xué)運(yùn)算,比如Linear或者Conv,負(fù)責(zé)將模型的輸出轉(zhuǎn)換為預(yù)測(cè)結(jié)果輸出。

這個(gè)過(guò)程可以用下面的數(shù)學(xué)公式表示:

wKgaomc2sqKASsE0AAAV3wL2wUg189.png

損失函數(shù):告訴神經(jīng)網(wǎng)絡(luò)它錯(cuò)了多少

損失函數(shù)是衡量模型預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽之間差距的依據(jù),它的核心作用是告訴我們模型的預(yù)測(cè)結(jié)果“錯(cuò)”得有多離譜。通俗來(lái)說(shuō),損失函數(shù)就像是一個(gè)裁判,它給模型的預(yù)測(cè)結(jié)果打分,分?jǐn)?shù)越低,說(shuō)明模型的預(yù)測(cè)結(jié)果越接近真實(shí)情況,模型的性能就越好。損失函數(shù)是為了讓我們反向傳播起作用的。就像如果小寶寶猜錯(cuò)了,你會(huì)告訴他:“不對(duì)哦,這是數(shù)字8,不是3。”損失函數(shù)就像是這句話,它告訴神經(jīng)網(wǎng)絡(luò):“嘿,你的答案有點(diǎn)偏差?!?/p>

下面是幾種常用的損失函數(shù):

L1 Loss(MAE):平均絕對(duì)誤差,對(duì)異常值的容忍性更高,但當(dāng)梯度下降恰好為0時(shí)無(wú)法繼續(xù)進(jìn)行。就像是你告訴小寶寶:“你的答案差了多遠(yuǎn)?!边@個(gè)距離就是損失值。

wKgZomc2sqKAEFRlAAANxw_7gak377.png

L2 Loss(MSE):均方誤差,連續(xù)光滑,方便求導(dǎo),但易受到異常值的干擾。這就像是你告訴小寶寶:“你的答案差了多少個(gè)單位?!边@個(gè)單位的平方和就是損失值。

wKgZomc2sqKAaAJQAAAQZu10-74048.png

Smooth L1 Loss:處理異常值更加穩(wěn)健,同時(shí)避免了L2 Loss的梯度爆炸問(wèn)題。就像是你告訴小寶寶:“你的答案差了多遠(yuǎn),但我不會(huì)因?yàn)槟悴碌锰貏e離譜就懲罰你。”這個(gè)損失函數(shù)對(duì)極端錯(cuò)誤更寬容。

wKgZomc2sqKAdKbTAAA3utmQcio364.png

反向傳播:神經(jīng)網(wǎng)絡(luò)的“自我修正”過(guò)程

反向傳播是利用損失函數(shù)的梯度來(lái)更新網(wǎng)絡(luò)參數(shù)的過(guò)程。它從輸出層開(kāi)始,逆向通過(guò)網(wǎng)絡(luò),利用鏈?zhǔn)椒▌t計(jì)算每個(gè)參數(shù)對(duì)損失函數(shù)的梯度。包含這幾個(gè)過(guò)程:

  • 計(jì)算輸出層誤差梯度:首先計(jì)算輸出層的誤差梯度,這是損失函數(shù)對(duì)輸出層權(quán)重的敏感度。
  • 逐層反向傳播:然后從輸出層開(kāi)始,逆向通過(guò)網(wǎng)絡(luò),逐層計(jì)算誤差梯度。
  • 更新權(quán)重和偏置:使用梯度下降算法,根據(jù)計(jì)算出的梯度更新網(wǎng)絡(luò)中每一層的權(quán)重和偏置。

所以前向傳播、反向傳播、損失函數(shù)之間的關(guān)系是這樣的:

他們都是深度學(xué)習(xí)訓(xùn)練過(guò)程中的核心。前向傳播負(fù)責(zé)生成預(yù)測(cè)結(jié)果,損失函數(shù)負(fù)責(zé)量化預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽之間的差異,而反向傳播則負(fù)責(zé)利用這些差異來(lái)更新模型參數(shù),以減少損失函數(shù)的值。

通過(guò)三者的結(jié)合,我們可以構(gòu)建、訓(xùn)練并優(yōu)化深度學(xué)習(xí)模型,使其能夠從數(shù)據(jù)中學(xué)習(xí)復(fù)雜的模式,并在各種任務(wù)如圖像識(shí)別、自然語(yǔ)言處理和預(yù)測(cè)分析中做出準(zhǔn)確的預(yù)測(cè)。

前向傳播、反向傳播、損失函數(shù)屬于機(jī)器學(xué)習(xí)領(lǐng)域中的核心概念,在AI全體系課程中,是理解其他更復(fù)雜機(jī)器學(xué)習(xí)算法的基礎(chǔ),掌握這幾個(gè)概念對(duì)于深入學(xué)習(xí)機(jī)器學(xué)習(xí)、理解更高級(jí)的算法以及在實(shí)際應(yīng)用中設(shè)計(jì)和優(yōu)化模型都具有重要的意義。通過(guò)理解前向傳播、反向傳播和損失函數(shù),學(xué)習(xí)者能夠更好地把握機(jī)器學(xué)習(xí)模型的工作原理,為進(jìn)一步探索深度學(xué)習(xí)和其他高級(jí)機(jī)器學(xué)習(xí)技術(shù)打下堅(jiān)實(shí)的基礎(chǔ)。

人工智能算法的學(xué)習(xí)過(guò)程中,你會(huì)接觸到各種各樣的算法,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等方向的各類算法。但機(jī)器學(xué)習(xí)算法,一直都是通用算法基礎(chǔ)。我們機(jī)器學(xué)習(xí)課程里,會(huì)重點(diǎn)講解2012年后的深度學(xué)習(xí)的通用結(jié)構(gòu),線性+激活來(lái)逼近所有系統(tǒng)為基礎(chǔ),幫助學(xué)習(xí)者搭建這個(gè)過(guò)程中所有的通用性知識(shí)與原理,拓展更多機(jī)器學(xué)習(xí)和AI全棧技術(shù)學(xué)習(xí)可參考下方學(xué)習(xí)路線圖。

AI體系化學(xué)習(xí)路線

wKgaombzzxSAdyb-AAILSe8A5AM65.jpeg

學(xué)習(xí)資料免費(fèi)領(lǐng)

AI全體系學(xué)習(xí)路線超詳版+AI體驗(yàn)卡(AI實(shí)驗(yàn)平臺(tái)體驗(yàn)權(quán)限)+100余講AI視頻課程+項(xiàng)目源碼《從零開(kāi)始訓(xùn)練與部署YOLOV8》+170余篇AI經(jīng)典論文

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    聲場(chǎng)傳播損失模型Raymode的MATLAB程序

    請(qǐng)問(wèn)誰(shuí)有聲場(chǎng)傳播損失模型Raymode的MATLAB程序,qq351383744私聊,謝謝。
    發(fā)表于 09-05 09:01

    反向傳播如何實(shí)現(xiàn)

    實(shí)現(xiàn)反向傳播
    發(fā)表于 07-09 16:10

    AI 學(xué)習(xí)】第六篇--講解BP(反向傳播)流程

    反向傳播整個(gè)流程如下:(1)進(jìn)行前傳播計(jì)算,利用傳播
    發(fā)表于 11-05 17:25

    手動(dòng)設(shè)計(jì)一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(傳播反向傳播

    本文主要寫卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行一次完整的訓(xùn)練,包括傳播反向傳播,并自己手寫一個(gè)卷積神經(jīng)網(wǎng)絡(luò)。
    的頭像 發(fā)表于 05-28 10:35 ?1.8w次閱讀
    手動(dòng)設(shè)計(jì)一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(<b class='flag-5'>前</b><b class='flag-5'>向</b><b class='flag-5'>傳播</b>和<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>)

    人工智能(AI)學(xué)習(xí):如何講解BP(反向傳播)流程

    關(guān)于BP知乎上的解釋是這樣的,反向傳播整個(gè)流程如下: 1)進(jìn)行前傳播計(jì)算,利用
    發(fā)表于 11-03 16:55 ?0次下載
    人工智能(<b class='flag-5'>AI</b>)學(xué)習(xí):如何講解BP(<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>)流程

    淺析深度神經(jīng)網(wǎng)絡(luò)(DNN)反向傳播算法(BP)

    在 深度神經(jīng)網(wǎng)絡(luò)(DNN)模型與傳播算法 中,我們對(duì)DNN的模型和傳播算法做了總結(jié),這里
    的頭像 發(fā)表于 03-22 16:28 ?3693次閱讀
    淺析深度神經(jīng)網(wǎng)絡(luò)(DNN)<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法(BP)

    PyTorch教程5.3之前傳播、反向傳播和計(jì)算圖

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程5.3之前傳播、反向傳播和計(jì)算圖.pdf》資料免費(fèi)下載
    發(fā)表于 06-05 15:36 ?0次下載
    PyTorch教程5.3之前<b class='flag-5'>向</b><b class='flag-5'>傳播</b>、<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>和計(jì)算圖

    PyTorch教程-5.3. 傳播、反向傳播和計(jì)算圖

    5.3. 傳播、反向傳播和計(jì)算圖? Colab [火炬]在 Colab 中打開(kāi)筆記本 Colab [mxnet] Open th
    的頭像 發(fā)表于 06-05 15:43 ?1163次閱讀
    PyTorch教程-5.3. <b class='flag-5'>前</b><b class='flag-5'>向</b><b class='flag-5'>傳播</b>、<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>和計(jì)算圖

    PyTorch教程-9.7. 時(shí)間反向傳播

    反向傳播的討論,那么 RNN 中的傳播應(yīng)該相對(duì)簡(jiǎn)單。在 RNN 中應(yīng)用反向
    的頭像 發(fā)表于 06-05 15:44 ?436次閱讀
    PyTorch教程-9.7. 時(shí)間<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>

    反向傳播神經(jīng)網(wǎng)絡(luò)建模的基本原理

    等方面取得了顯著的成果。本文將詳細(xì)介紹BP神經(jīng)網(wǎng)絡(luò)的基本原理,包括網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)、損失函數(shù)、梯度下降算法、反向傳播算法等。 神經(jīng)網(wǎng)絡(luò)概述
    的頭像 發(fā)表于 07-02 14:05 ?319次閱讀

    神經(jīng)網(wǎng)絡(luò)反向傳播算法原理是什么

    神經(jīng)網(wǎng)絡(luò)反向傳播算法(Backpropagation Algorithm)是一種用于訓(xùn)練多層饋神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)算法。它通過(guò)最小化損失函數(shù)
    的頭像 發(fā)表于 07-02 14:16 ?710次閱讀

    神經(jīng)網(wǎng)絡(luò)傳播反向傳播區(qū)別

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等。神經(jīng)網(wǎng)絡(luò)的核心是傳播反向傳播算法。本文將詳
    的頭像 發(fā)表于 07-02 14:18 ?871次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)建模基本原理

    。本文將詳細(xì)介紹反向傳播神經(jīng)網(wǎng)絡(luò)的基本原理,包括網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)損失函數(shù)、梯度下降算法、反向
    的頭像 發(fā)表于 07-03 11:08 ?485次閱讀

    神經(jīng)網(wǎng)絡(luò)傳播反向傳播在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的作用

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,它通過(guò)模擬人腦神經(jīng)元的連接方式來(lái)處理復(fù)雜的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)的核心是傳播反向傳播算法。本文將詳細(xì)介紹神經(jīng)
    的頭像 發(fā)表于 07-03 11:11 ?1518次閱讀

    神經(jīng)網(wǎng)絡(luò)反向傳播算法的推導(dǎo)過(guò)程

    反向傳播算法的推導(dǎo)過(guò)程,包括傳播、損失函數(shù)、梯度
    的頭像 發(fā)表于 07-03 11:13 ?637次閱讀