電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程之時(shí)間反向傳播

PyTorch教程之時(shí)間反向傳播

2023-06-05 | pdf | 0.19 MB | 次下載 | 免費(fèi)

資料介紹

如果您完成了第 9.5 節(jié)中的練習(xí),您會(huì)發(fā)現(xiàn)梯度裁剪對(duì)于防止偶爾出現(xiàn)的大量梯度破壞訓(xùn)練穩(wěn)定性至關(guān)重要。我們暗示爆炸梯度源于長序列的反向傳播。在介紹大量現(xiàn)代 RNN 架構(gòu)之前,讓我們仔細(xì)看看反向傳播在數(shù)學(xué)細(xì)節(jié)中是如何在序列模型中工作的。希望這個(gè)討論能使梯度消失爆炸的概念更加精確如果你還記得我們?cè)?5.3 節(jié)介紹 MLP 時(shí)通過計(jì)算圖進(jìn)行前向和反向傳播的討論,那么 RNN 中的前向傳播應(yīng)該相對(duì)簡單。在 RNN 中應(yīng)用反向傳播稱為 時(shí)間反向傳播 ( Werbos, 1990 ). 此過程要求我們一次擴(kuò)展(或展開)RNN 的計(jì)算圖。展開的 RNN 本質(zhì)上是一個(gè)前饋神經(jīng)網(wǎng)絡(luò),具有相同的參數(shù)在整個(gè)展開的網(wǎng)絡(luò)中重復(fù)出現(xiàn)的特殊屬性,出現(xiàn)在每個(gè)時(shí)間步長。然后,就像在任何前饋神經(jīng)網(wǎng)絡(luò)中一樣,我們可以應(yīng)用鏈?zhǔn)椒▌t,通過展開的網(wǎng)絡(luò)反向傳播梯度。每個(gè)參數(shù)的梯度必須在參數(shù)出現(xiàn)在展開網(wǎng)絡(luò)中的所有位置上求和。從我們關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的章節(jié)中應(yīng)該熟悉處理這種權(quán)重綁定。

出現(xiàn)并發(fā)癥是因?yàn)樾蛄锌赡芟喈?dāng)長。處理由超過一千個(gè)標(biāo)記組成的文本序列并不罕見。請(qǐng)注意,從計(jì)算(太多內(nèi)存)和優(yōu)化(數(shù)值不穩(wěn)定)的角度來看,這都會(huì)帶來問題。第一步的輸入在到達(dá)輸出之前要經(jīng)過 1000 多個(gè)矩陣乘積,還需要另外 1000 個(gè)矩陣乘積來計(jì)算梯度。我們現(xiàn)在分析可能出現(xiàn)的問題以及如何在實(shí)踐中解決它。

9.7.1. RNN 中的梯度分析

我們從 RNN 工作原理的簡化模型開始。該模型忽略了有關(guān)隱藏狀態(tài)細(xì)節(jié)及其更新方式的細(xì)節(jié)。這里的數(shù)學(xué)符號(hào)沒有明確區(qū)分標(biāo)量、向量和矩陣。我們只是想培養(yǎng)一些直覺。在這個(gè)簡化模型中,我們表示ht作為隱藏狀態(tài), xt作為輸入,和ot作為時(shí)間步的輸出t. 回憶一下我們?cè)?/font>第 9.4.2 節(jié)中的討論,輸入和隱藏狀態(tài)可以在乘以隱藏層中的一個(gè)權(quán)重變量之前連接起來。因此,我們使用 whwo分別表示隱藏層和輸出層的權(quán)重。因此,每個(gè)時(shí)間步的隱藏狀態(tài)和輸出是

(9.7.1)ht=f(xt,ht?1,wh),ot=g(ht,wo),

在哪里fg分別是隱藏層和輸出層的變換。因此,我們有一個(gè)價(jià)值鏈 {…,(xt?1,ht?1,ot?1),(xt,ht,ot),…} 通過循環(huán)計(jì)算相互依賴。前向傳播相當(dāng)簡單。我們所需要的只是遍歷(xt,ht,ot)一次三倍一個(gè)時(shí)間步長。輸出之間的差異ot和想要的目標(biāo) yt然后通過所有的目標(biāo)函數(shù)進(jìn)行評(píng)估 T時(shí)間步長為

(9.7.2)L(x1,…,xT,y1,…,yT,wh,wo)=1T∑t=1Tl(yt,ot).

對(duì)于反向傳播,事情有點(diǎn)棘手,尤其是當(dāng)我們計(jì)算關(guān)于參數(shù)的梯度時(shí)wh目標(biāo)函數(shù)的L. 具體來說,根據(jù)鏈?zhǔn)椒▌t,


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
  2. 1.06 MB  |  532次下載  |  免費(fèi)
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費(fèi)
  5. 3TC358743XBG評(píng)估板參考手冊(cè)
  6. 1.36 MB  |  330次下載  |  免費(fèi)
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費(fèi)
  9. 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費(fèi)
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費(fèi)
  13. 7元宇宙底層硬件系列報(bào)告
  14. 13.42 MB  |  182次下載  |  免費(fèi)
  15. 8FP5207XR-G1中文應(yīng)用手冊(cè)
  16. 1.09 MB  |  178次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費(fèi)
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費(fèi)
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費(fèi)
  7. 4開關(guān)電源設(shè)計(jì)實(shí)例指南
  8. 未知  |  21549次下載  |  免費(fèi)
  9. 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費(fèi)
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費(fèi)
  13. 7電子制作實(shí)例集錦 下載
  14. 未知  |  8113次下載  |  免費(fèi)
  15. 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191187次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138040次下載  |  免費(fèi)