電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網>電子資料下載>電子資料>PyTorch教程12.6之勢頭

PyTorch教程12.6之勢頭

2023-06-05 | pdf | 0.73 MB | 次下載 | 免費

資料介紹

第 12.4 節(jié)中,我們回顧了在執(zhí)行隨機梯度下降時會發(fā)生什么,即,在只有梯度的噪聲變體可用的情況下執(zhí)行優(yōu)化時。特別是,我們注意到對于噪聲梯度,我們在選擇面對噪聲的學習率時需要格外謹慎。如果我們將它降低得太快,收斂就會停滯。如果我們過于寬容,我們將無法收斂到一個足夠好的解決方案,因為噪聲會不斷驅使我們遠離最優(yōu)解。

12.6.1。基本

在本節(jié)中,我們將探索更有效的優(yōu)化算法,尤其是針對實踐中常見的某些類型的優(yōu)化問題。

12.6.1.1。漏平均值

在上一節(jié)中,我們討論了小批量 SGD 作為加速計算的一種方法。它還有一個很好的副作用,即平均梯度減少了方差量。小批量隨機梯度下降可以通過以下方式計算:

(12.6.1)gt,t?1=?w1|Bt|∑i∈Btf(xi,wt?1)=1|Bt|∑i∈Bthi,t?1.

為了保持符號簡單,我們在這里使用 hi,t?1=?wf(xi,wt?1) 作為樣本的隨機梯度下降i使用及時更新的權重t?1. 如果我們能夠從方差減少的效果中受益,甚至超越小批量的平均梯度,那就太好了。完成此任務的一個選擇是用“l(fā)eaky average”代替梯度計算:

(12.6.2)vt=βvt?1+gt,t?1

對于一些β∈(0,1). 這有效地將瞬時梯度替換為對多個過去梯度進行平均的梯度 。v稱為速度。它積累了過去的梯度,類似于一個重球從目標函數景觀上滾下來如何對過去的力進行積分。為了更詳細地了解發(fā)生了什么,讓我們展開vt遞歸地進入

(12.6.3)vt=β2vt?2+βgt?1,t?2+gt,t?1=…,=∑τ=0t?1βτgt?τ,t?τ?1.

大的β相當于長期平均水平,而小 β僅相當于相對于梯度法的輕微修正。新的梯度替換不再指向特定實例上最速下降的方向,而是指向過去梯度的加權平均值的方向。這使我們能夠實現批量平均的大部分好處,而無需實際計算其梯度的成本。稍后我們將更詳細地重新討論這個平均過程。

上述推理構成了現在所謂的 加速梯度方法的基礎,例如動量梯度。他們享有額外的好處,即在優(yōu)化問題是病態(tài)的情況下更有效(即,在某些方向上進展比其他方向慢得多,類似于狹窄的峽谷)。此外,它們允許我們對后續(xù)梯度進行平均以獲得更穩(wěn)定的下降方向。事實上,即使對于無噪聲凸問題,加速方面也是動量起作用的關鍵原因之一。

正如人們所預料的那樣,由于其功效,勢頭是深度學習及其他領域優(yōu)化的一個深入研究的課題。例如,請參閱Goh(2017 年撰寫的 精美說明文章,以獲取深入分析和交互式動畫。它是由Polyak ( 1964 )提出的。Nesterov(2018在凸優(yōu)化的背景下進行了詳細的理論討論。長期以來,眾所周知,深度學習的勢頭是有益的。參見例如Sutskever等人的討論 。( 2013 )了解詳情。

12.6.1.2。病態(tài)問題

為了更好地理解動量法的幾何特性,我們重新審視了梯度下降法,盡管它的目標函數明顯不太令人滿意。回想一下我們在12.3 節(jié)中使用的f(x)=x12+2x22,即適度扭曲的橢球物鏡。我們通過在x1方向通過

(12.6.4)f(x)=0.1x12+2x22.

像之前一樣

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數據手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費