深度學(xué)習(xí)研究總結(jié)：頻率原則和參數(shù)凝聚

作者注記

我是2017年11月開(kāi)始接觸深度學(xué)習(xí)，至今剛好五年。2019年10月入職上海交大，至今三年，剛好第一階段考核。2022年8月19號(hào)，我在第一屆中國(guó)機(jī)器學(xué)習(xí)與科學(xué)應(yīng)用大會(huì)做大會(huì)報(bào)告，總結(jié)這五年的研究以及展望未來(lái)的方向。本文是該報(bào)告里關(guān)于理論方面的研究總結(jié)（做了一點(diǎn)擴(kuò)展）。

我理解的深度學(xué)習(xí)

我原本是研究計(jì)算神經(jīng)科學(xué)的，研究的內(nèi)容，宏觀來(lái)講是從數(shù)學(xué)的角度理解大腦工作的原理，具體來(lái)說(shuō)，我的研究是處理高維的神經(jīng)元網(wǎng)絡(luò)產(chǎn)生的脈沖數(shù)據(jù)，嘗試去理解這些信號(hào)是如何處理輸入的信號(hào)。但大腦過(guò)于復(fù)雜，維度也過(guò)于高，我們普通大腦有一千億左右個(gè)神經(jīng)元，每個(gè)神經(jīng)元還和成千上萬(wàn)個(gè)其它神經(jīng)元有信號(hào)傳遞，我對(duì)處理這類數(shù)據(jù)并沒(méi)有太多信心，那階段也剛好讀到一篇文章，大意是把現(xiàn)階段計(jì)算神經(jīng)科學(xué)的研究方法用來(lái)研究計(jì)算機(jī)的芯片，結(jié)論是這些方法并不能幫助我們理解芯片的工作原理。另一個(gè)讓我覺(jué)得非常難受的地方是我們不僅對(duì)大腦了解很少，還非常難以獲得大腦的數(shù)據(jù)。于是，我們當(dāng)時(shí)思考，能否尋找一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)模型，能夠?qū)崿F(xiàn)復(fù)雜的功能，同時(shí)我們對(duì)它的理解也很少的例子，我們通過(guò)研究它來(lái)啟發(fā)我們對(duì)大腦的研究。

當(dāng)時(shí)是2017年底，深度學(xué)習(xí)已經(jīng)非常流行，特別是我的同學(xué)已經(jīng)接觸深度學(xué)習(xí)一段時(shí)間，所以我們迅速了解到深度學(xué)習(xí)。其結(jié)構(gòu)和訓(xùn)練看起來(lái)足夠簡(jiǎn)單，但能力不凡，而且與其相關(guān)的理論正處在萌芽階段。因此，我進(jìn)入深度學(xué)習(xí)的第一個(gè)想法是把它當(dāng)作研究大腦的簡(jiǎn)單模型。?顯然，在這種“類腦研究”的定位下，我們關(guān)心的是深度學(xué)習(xí)的基礎(chǔ)研究。這里，我想?yún)^(qū)分深度學(xué)習(xí)的“理論”和“基礎(chǔ)研究”。我認(rèn)為“理論”給人一種全是公式和證明的感覺(jué)。而“基礎(chǔ)研究”的范圍聽(tīng)起來(lái)會(huì)更廣闊一些，它不僅可以包括“理論”，還可以是一些重要的現(xiàn)象，直觀的解釋，定律，經(jīng)驗(yàn)原則等等。這種區(qū)分只是一種感性的區(qū)分，實(shí)際上，我們?cè)谡務(wù)撍鼈兊臅r(shí)候，并不真正做這么細(xì)致的區(qū)分。盡管是以深度學(xué)習(xí)為模型，來(lái)研究大腦為何會(huì)有如此復(fù)雜的學(xué)習(xí)能力，但大腦和深度學(xué)習(xí)還是有明顯的差異。而我從知識(shí)儲(chǔ)備、能力和時(shí)間上來(lái)看，都很難同時(shí)在這兩個(gè)目前看起來(lái)距離仍然很大的領(lǐng)域同時(shí)深入。

于是我選擇全面轉(zhuǎn)向深度學(xué)習(xí)，研究的問(wèn)題是，深度學(xué)習(xí)作為一個(gè)算法，它有什么樣的特征?！皼](méi)有免費(fèi)的午餐”的定理告訴我們，當(dāng)考慮所有可能的數(shù)據(jù)集的平均性能時(shí)，所有算法都是等價(jià)的，也就是沒(méi)有哪一種算法是萬(wàn)能的。我們需要厘清深度學(xué)習(xí)這類算法適用于什么數(shù)據(jù)，以及不適用于什么數(shù)據(jù)。?事實(shí)上，深度學(xué)習(xí)理論并不是處于萌芽階段，從上世紀(jì)中葉，它剛開(kāi)始發(fā)展的時(shí)候，相關(guān)的理論就已經(jīng)開(kāi)始了，也有過(guò)一些重要的結(jié)果，但整體上來(lái)說(shuō)，它仍然處于初級(jí)階段。對(duì)我而言，這更是一個(gè)非常困難的問(wèn)題。于是，我轉(zhuǎn)而把深度學(xué)習(xí)當(dāng)作一種“玩具”，通過(guò)調(diào)整各類超參數(shù)和不同的任務(wù)，觀察它會(huì)產(chǎn)生哪些“自然現(xiàn)象”。設(shè)定的目標(biāo)也不再高大上，而是有趣即可，發(fā)現(xiàn)有趣的現(xiàn)象，然后解釋它，也許還可以用它來(lái)指導(dǎo)實(shí)際應(yīng)用。在上面這些認(rèn)識(shí)下，我們從深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的一些有趣的現(xiàn)象開(kāi)始。于我個(gè)人，我是從頭開(kāi)始學(xué)習(xí)寫python和tensorflow，更具體是，從網(wǎng)上找了幾份代碼，邊抄邊理解。

神經(jīng)網(wǎng)絡(luò)真的很復(fù)雜嗎？

在傳統(tǒng)的學(xué)習(xí)理論中，模型的參數(shù)量是指示模型復(fù)雜程度很重要的一個(gè)指標(biāo)。當(dāng)模型的復(fù)雜度增加時(shí)，模型擬合訓(xùn)練數(shù)據(jù)的能力會(huì)增強(qiáng)，但也會(huì)帶來(lái)在測(cè)試集上過(guò)擬合的問(wèn)題。馮·諾依曼曾經(jīng)說(shuō)過(guò)一句著名的話，給我四個(gè)參數(shù)，我能擬合一頭大象，五個(gè)參數(shù)可以讓大象的鼻子動(dòng)起來(lái)。

因此，傳統(tǒng)建模相關(guān)的研究人員在使用神經(jīng)網(wǎng)絡(luò)時(shí)，經(jīng)常會(huì)計(jì)算模型參數(shù)量，以及為了避免過(guò)擬合，刻意用參數(shù)少的網(wǎng)絡(luò)。然而，今天神經(jīng)網(wǎng)絡(luò)能夠大獲成功，一個(gè)重要的原因正是使用了超大規(guī)模的網(wǎng)絡(luò)。網(wǎng)絡(luò)的參數(shù)數(shù)量往往遠(yuǎn)大于樣本的數(shù)量，但卻不像傳統(tǒng)學(xué)習(xí)理論所預(yù)言的那樣過(guò)擬合。這便是這些年受到極大關(guān)注的泛化迷團(tuán)。實(shí)際上，在1995年，Leo Breiman在一篇文章中就已經(jīng)指出了這個(gè)問(wèn)題。在神經(jīng)網(wǎng)絡(luò)非常流行和重要的今天，這個(gè)迷團(tuán)愈加重要。我們可以問(wèn)：帶有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)真的很復(fù)雜嗎？

答案是肯定的！上世紀(jì)八十年代末的理論工作證明當(dāng)兩層神經(jīng)網(wǎng)絡(luò)（激活函數(shù)非多項(xiàng)式函數(shù)）足夠?qū)挄r(shí)，它可以以任意精度逼近任意連續(xù)函數(shù)，這也就是著名的“萬(wàn)有逼近”定理。實(shí)際上，我們應(yīng)該問(wèn)一個(gè)更加有意義的問(wèn)題：在實(shí)際訓(xùn)練中，神經(jīng)網(wǎng)絡(luò)真的很復(fù)雜嗎？?逼近論證明的解在實(shí)際訓(xùn)練中幾乎不可能遇到。實(shí)際的訓(xùn)練，需要設(shè)定初始值、優(yōu)化算法、網(wǎng)絡(luò)結(jié)構(gòu)等超參數(shù)。對(duì)我們實(shí)際要有指導(dǎo)作用，我們就不能脫離這些因素來(lái)考慮泛化的問(wèn)題，因?yàn)榉夯旧砭褪且蕾噷?shí)際數(shù)據(jù)的問(wèn)題。

兩種簡(jiǎn)單偏好的現(xiàn)象

在學(xué)習(xí)與訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過(guò)程中，我們很容易發(fā)現(xiàn)，神經(jīng)網(wǎng)絡(luò)的訓(xùn)練有一定的規(guī)律。在我們的研究中，有兩種現(xiàn)象很有趣，在研究和解釋它們的過(guò)程中，我們發(fā)現(xiàn)它們同樣是很有意義的。我先簡(jiǎn)單介紹，然后再詳細(xì)分別介紹。第一，我們發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)在擬合數(shù)據(jù)的過(guò)程中經(jīng)常會(huì)先學(xué)習(xí)低頻，而后慢慢學(xué)習(xí)高頻。我們把這個(gè)現(xiàn)象命名為頻率原則（Frequency Principle, F-Principle）[1, 2]，也有其它工作把它稱為Spectral bias。第二，我們發(fā)現(xiàn)在訓(xùn)練過(guò)程，有很多神經(jīng)元的輸入權(quán)重（向量）的方向會(huì)保持一致。我們稱之為凝聚現(xiàn)象。這些輸入權(quán)重一樣的神經(jīng)元對(duì)輸入的處理是一樣的，那它們就可以簡(jiǎn)化成一個(gè)神經(jīng)元，也就是一個(gè)大網(wǎng)絡(luò)可以簡(jiǎn)化成小網(wǎng)絡(luò)[3, 4]。這兩種現(xiàn)象都體現(xiàn)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中有一種隱式的簡(jiǎn)單偏好，低頻偏好或者有效小網(wǎng)絡(luò)偏好。低頻偏好是非常普遍的，但小網(wǎng)絡(luò)偏好是要在非線性的訓(xùn)練過(guò)程中才會(huì)出現(xiàn)的特征。

頻率原則

我早期在匯報(bào)頻率原則相關(guān)的工作的時(shí)候，做計(jì)算數(shù)學(xué)的老師同學(xué)非常有興趣，因?yàn)樵趥鹘y(tǒng)的迭代格式中，例如Jacobi迭代，低頻是收斂得非常慢的。多重網(wǎng)格方法非常有效地解決了這個(gè)問(wèn)題。我們?cè)趯?shí)驗(yàn)中，也驗(yàn)證了神經(jīng)網(wǎng)絡(luò)和Jacobi迭代在解PDE時(shí)完全不一樣的頻率收斂順序（如下圖）[2, 5]。

頻率原則有多廣泛呢？?頻率原則最開(kāi)始是在一維函數(shù)的擬合中發(fā)現(xiàn)的。我在調(diào)參的過(guò)程中發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)似乎總是先抓住目標(biāo)函數(shù)的輪廓信息，然后再是細(xì)節(jié)。頻率是一種非常適合用來(lái)刻畫輪廓和細(xì)節(jié)的量。于是，我們?cè)陬l率空間看神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程，發(fā)現(xiàn)非常明顯地從低頻到高頻的順序。

實(shí)域空間擬合（紅色為目標(biāo)函數(shù)，藍(lán)色為DNN）頻域空間擬合（紅色為目標(biāo)函數(shù)，藍(lán)色為DNN）

對(duì)于兩維的函數(shù)，以圖像為例，用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)從兩維位置到灰度值的映射。神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程會(huì)慢慢記住更多細(xì)節(jié)。

對(duì)于更高維的例子，傅里葉變換是困難的，這也是不容易在高維的圖像分類任務(wù)中發(fā)現(xiàn)頻率原則的一個(gè)原因。我們的貢獻(xiàn)還有一點(diǎn)就是用一個(gè)例子論證針對(duì)簡(jiǎn)單的低維問(wèn)題的研究可以啟發(fā)深度學(xué)習(xí)的基礎(chǔ)研究。高維問(wèn)題的頻率需要多說(shuō)兩句。本質(zhì)上，高頻指的是輸出對(duì)輸入的變化非常敏感。比如在圖片分類任務(wù)中，當(dāng)一張圖片被修改一點(diǎn)點(diǎn)，輸出就發(fā)生變化。顯然，這說(shuō)的正是對(duì)抗樣本。關(guān)于高維中驗(yàn)證頻率原則，我們采用了降維和濾波的辦法。一系列的實(shí)驗(yàn)都驗(yàn)證了頻率原則是一個(gè)廣泛存在的現(xiàn)象。

為什么會(huì)有頻率原則呢？?事實(shí)上，在自然界中大部分信號(hào)都有一個(gè)特征，強(qiáng)度隨頻率增加而衰減。一般我們見(jiàn)到的函數(shù)在頻率空間也都有衰減的特征，特別是函數(shù)越光滑，衰減越快，連常見(jiàn)的ReLU函數(shù)在頻率空間也是關(guān)于頻率二次方衰減。在梯度下降的計(jì)算中，很容易得到低頻信號(hào)對(duì)梯度的貢獻(xiàn)要大于高頻，所以梯度下降自然就以消除低頻誤差為主要目標(biāo)[2]。對(duì)于一般的網(wǎng)絡(luò)，我們有定性的理論證明[6]，而對(duì)于線性NTK區(qū)域的網(wǎng)絡(luò)，我們有嚴(yán)格的線性頻率原則模型揭示頻率衰減的機(jī)制[7, 8, 9]。有了這個(gè)理解，我們也可以構(gòu)造一些例子來(lái)加速高頻的收斂，比如在損失函數(shù)中增加輸出關(guān)于輸入的導(dǎo)數(shù)項(xiàng)，因?yàn)榍髮?dǎo)在頻率空間看，相當(dāng)于在強(qiáng)度上乘以了一個(gè)其對(duì)應(yīng)的頻率，可以緩解高頻的困難。這在求解PDE中很常見(jiàn)。

了解頻率原則對(duì)我們理解神經(jīng)網(wǎng)絡(luò)有什么幫助嗎？?我們舉兩個(gè)例子。第一個(gè)是理解提前停止這個(gè)技巧。實(shí)際的訓(xùn)練中，一般都能發(fā)現(xiàn)泛化最好的點(diǎn)并不是訓(xùn)練誤差最低的，通常需要在訓(xùn)練誤差還沒(méi)降得很低的時(shí)候，提前停止訓(xùn)練。實(shí)際數(shù)據(jù)大部分都是低頻占優(yōu)，而且基本都有噪音。噪音對(duì)低頻的影響相對(duì)比較小，而對(duì)高頻影響相對(duì)比較大，而神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過(guò)程先學(xué)習(xí)低頻，所以通過(guò)提前停止可以避免學(xué)習(xí)到過(guò)多被污染的高頻而帶來(lái)更好的泛化性能。另一個(gè)例子是，我們發(fā)現(xiàn)圖像分類問(wèn)題中，從圖像到類別的映射通常也是低頻占優(yōu)，所以可以理解其良好的泛化。但對(duì)于定義在d維空間中的奇偶函數(shù)，其每一維的值只能取1或者-1。顯然任何一維被擾動(dòng)后，輸出都會(huì)發(fā)生大的變化。這個(gè)函數(shù)可以被證明是高頻占優(yōu)的，而實(shí)際訓(xùn)練中，神經(jīng)網(wǎng)絡(luò)在這個(gè)問(wèn)題中完全沒(méi)有預(yù)測(cè)能力。我們還利用頻率原則解釋了為什么在實(shí)驗(yàn)中會(huì)觀察到深度可以加快訓(xùn)練，核心的原因是越深的網(wǎng)絡(luò)把目標(biāo)函數(shù)變成一個(gè)越低頻的函數(shù)，使學(xué)習(xí)變得容易 [10]。

除了理解，頻率原則能對(duì)我們實(shí)際設(shè)計(jì)和使用神經(jīng)網(wǎng)絡(luò)產(chǎn)生什么指導(dǎo)嗎？頻率原則揭示了神經(jīng)網(wǎng)絡(luò)中存在高頻災(zāi)難，這也引起了很多研究人員的注意，包括求解PDE、生成圖像、擬合函數(shù)等。高頻災(zāi)難帶來(lái)的訓(xùn)練和泛化困難很難通過(guò)簡(jiǎn)單的調(diào)參來(lái)緩解。我們組提出了多尺度神經(jīng)網(wǎng)絡(luò)的方法來(lái)加速高頻的收斂[11]。基本的想法是把目標(biāo)函數(shù)在徑向進(jìn)行不同尺度的拉伸，嘗試將不同頻率的成分都拉伸成一致的低頻，達(dá)到一致的快速收斂。實(shí)現(xiàn)也是非常之容易，僅需在第一隱藏層的神經(jīng)元的輸入乘以一些固定的系數(shù)即可。我們的一些工作發(fā)現(xiàn)調(diào)整激活函數(shù)對(duì)網(wǎng)絡(luò)的性能影響很大[12]，用正弦余弦函數(shù)做第一個(gè)隱藏層的基可以有比較好的效果[13]。這個(gè)算法被華為的MindSp ore所采用。徑向拉伸的想法在很多其它的算法中也被采用，包括在圖片渲染中非常出名的NerF（神經(jīng)輻射場(chǎng)）。

多尺度網(wǎng)絡(luò)結(jié)構(gòu)

頻率原則還有很多未解的問(wèn)題需要被探索。?在非梯度下降訓(xùn)練的過(guò)程，比如粒子群算法怎么證明頻率下降[14]？如何在理論上論證多尺度神經(jīng)網(wǎng)絡(luò)對(duì)高頻的加速效果？是否有更穩(wěn)定更快的高頻加速算法？小波可以更細(xì)致的描述不同局部的頻率特征，能否用小波更細(xì)節(jié)地理解神經(jīng)網(wǎng)絡(luò)的訓(xùn)練行為？數(shù)據(jù)量、網(wǎng)絡(luò)深度、損失函數(shù)怎么影響頻率原則？頻率原則可以指導(dǎo)算法設(shè)計(jì)的理論，為訓(xùn)練規(guī)律提供一種“宏觀”描述。對(duì)于“微觀”機(jī)制，我們需要進(jìn)一步研究。同樣是低頻到高頻的學(xué)習(xí)過(guò)程，參數(shù)的演化可以非常不一樣，比如一個(gè)函數(shù)可以用一個(gè)神經(jīng)元表示，也可以用10個(gè)神經(jīng)元（每個(gè)神經(jīng)元的輸出權(quán)重為原輸出權(quán)重的1/10）一起表示，從輸入輸出函數(shù)的頻率來(lái)看，這兩種表示完全沒(méi)有差別，那神經(jīng)網(wǎng)絡(luò)會(huì)選擇哪一種表示，以及這些表示有什么差別？下面我們就要更細(xì)致地看參數(shù)演化中的現(xiàn)象。

參數(shù)凝聚現(xiàn)象

為了介紹參數(shù)凝聚現(xiàn)象我們有必要介紹一下兩層神經(jīng)元網(wǎng)絡(luò)的表達(dá)

W是輸入權(quán)重，它以內(nèi)積的方式提取輸入在權(quán)重所在的方向上的成分，可以理解為一種特征提取的方式，加上偏置項(xiàng)，然后再經(jīng)過(guò)非線性函數(shù)（也稱為激活函數(shù)），完成單個(gè)神經(jīng)元的計(jì)算，然后再把所有神經(jīng)元的輸出加權(quán)求和。為了方便，我們記

對(duì)于ReLU激活函數(shù)，我們可以通過(guò)考慮輸入權(quán)重的角度和神經(jīng)元的幅度來(lái)理解每個(gè)神經(jīng)元的特征：, 其中??？紤]用上面的兩層神經(jīng)網(wǎng)絡(luò)來(lái)擬合四個(gè)一維的數(shù)據(jù)點(diǎn)。結(jié)合輸入權(quán)重和偏置項(xiàng)，我們所關(guān)心的方向就是兩維的方向，因此可以用角度來(lái)表示其方向。下圖展示了，不同初始化下，神經(jīng)網(wǎng)絡(luò)的擬合結(jié)果（第一行），以及在訓(xùn)練前（青色）和訓(xùn)練后（紅色）特征分布的圖（第二行）

不同初始化的擬合結(jié)果

顯然，隨初始化尺度變?。◤淖蟮接遥跏蓟叨炔粩嘧冃。窠?jīng)網(wǎng)絡(luò)的擬合結(jié)果差異很大，在特征分布上，當(dāng)尺度很大（這里使用NTK的初始化），神經(jīng)網(wǎng)絡(luò)特征幾乎不變，和random feature這類線性模型差不多，而隨初始化變小，訓(xùn)練過(guò)程出現(xiàn)明顯的特征變化的過(guò)程。最有意思的是，這些特征的方向聚集在兩個(gè)主要的方向。我們把這種現(xiàn)象稱為參數(shù)凝聚。?大量的實(shí)際問(wèn)題告訴我們神經(jīng)網(wǎng)絡(luò)比線性的方法要好很多，那非線性過(guò)程所呈現(xiàn)的參數(shù)凝聚有什么好處嗎？?如下圖展示的一個(gè)極端凝聚的例子，對(duì)于一個(gè)隨機(jī)初始化的網(wǎng)絡(luò)，經(jīng)過(guò)短暫的訓(xùn)練后，每個(gè)隱藏層神經(jīng)元的輸入權(quán)重是完全一致的，因此這個(gè)網(wǎng)絡(luò)可以等效成僅有一個(gè)隱藏層神經(jīng)元的小網(wǎng)絡(luò)。一般情況下，神經(jīng)元會(huì)凝聚到多個(gè)方向。

凝聚現(xiàn)象的例子

回顧在我們前面最開(kāi)始提到的泛化迷團(tuán)，以及我們最開(kāi)始提出的問(wèn)題“在實(shí)際訓(xùn)練中，神經(jīng)網(wǎng)絡(luò)真的很復(fù)雜嗎？”，在參數(shù)凝聚的情況下，對(duì)于一個(gè)表面看起來(lái)很多參數(shù)的網(wǎng)絡(luò)，我們自然要問(wèn)：神經(jīng)網(wǎng)絡(luò)實(shí)際的有效參數(shù)有多少？?比如我們前面看到的兩層神經(jīng)網(wǎng)絡(luò)凝聚在兩個(gè)方向的例子，實(shí)際上，這個(gè)網(wǎng)絡(luò)的有效神經(jīng)元只有兩個(gè)。因此凝聚可以根據(jù)實(shí)際數(shù)據(jù)擬合的需求來(lái)有效地控制模型的復(fù)雜度。

前面，我們只是通過(guò)一個(gè)簡(jiǎn)單的例子來(lái)呈現(xiàn)凝聚現(xiàn)象，接下來(lái)重要的問(wèn)題是：參數(shù)凝聚是非線性過(guò)程中普遍的現(xiàn)象嗎？?在統(tǒng)計(jì)力學(xué)相圖的啟發(fā)下，我們?cè)趯?shí)驗(yàn)發(fā)現(xiàn)并理論推導(dǎo)出了兩層無(wú)限寬ReLU神經(jīng)網(wǎng)絡(luò)的相圖。基于不同的初始化尺度，以參數(shù)在訓(xùn)練前后的相對(duì)距離在無(wú)限寬極限下趨于零、常數(shù)、無(wú)窮作為判據(jù)，相圖劃分了線性、臨界、凝聚三種動(dòng)力學(xué)態(tài)（dynamical regime）。領(lǐng)域內(nèi)的一系列理論研究（包括NTK，mean-field等）都可以在我們的相圖中找到對(duì)應(yīng)的位置[3]。

兩層ReLU網(wǎng)絡(luò)的相圖

在三層無(wú)窮寬[15]的全連接網(wǎng)絡(luò)中，我們實(shí)驗(yàn)證明在所有非線性的區(qū)域，參數(shù)凝聚都是一種普遍的現(xiàn)象。理論上，我們證明當(dāng)初始化尺度足夠小的時(shí)候，在訓(xùn)練初始階段就會(huì)產(chǎn)生凝聚[4] 。有趣的是，我們?cè)谘芯緿ropout算法的隱式正則化的時(shí)候，發(fā)現(xiàn)Dropout算法會(huì)明顯地促進(jìn)參數(shù)凝聚地形成。?Dropout算法的想法是Hinton提出的，在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中，以一定概率p保留神經(jīng)元，是一種常用的技巧，對(duì)泛化能力的提升有明顯的幫助。我們首先來(lái)看一下擬合結(jié)果。下面左圖是沒(méi)有用Dropout的例子，放大擬合的函數(shù)，可以看到明顯的小尺度的波動(dòng)，右圖是用了Dropout的結(jié)果，擬合的函數(shù)要光滑很多。

Dropout（右）使輸出更光滑

仔細(xì)看他們的特征分布時(shí)，可以看到訓(xùn)練前（藍(lán)色）和訓(xùn)練后（橙色）的分布在有Dropout的情況下會(huì)明顯不同，且呈現(xiàn)出明顯地凝聚效應(yīng)，有效參數(shù)變得更少，函數(shù)復(fù)雜度也相應(yīng)變得簡(jiǎn)單光滑。

Dropout（右）使參數(shù)凝聚

進(jìn)一步，我們分析為什么Dropout會(huì)帶來(lái)凝聚效應(yīng)。我們發(fā)現(xiàn)Dropout的訓(xùn)練會(huì)帶來(lái)一項(xiàng)特殊的隱式正則效應(yīng)。我們通過(guò)下面的例子來(lái)理解這個(gè)效應(yīng)。下面黃色和紅色兩種情況都能合成一個(gè)相同的向量，Dropout要求兩個(gè)分向量的模長(zhǎng)平方和要最小，那顯然只有當(dāng)兩個(gè)向量的方向一致的時(shí)候，并且完全相等的時(shí)候，它們的模長(zhǎng)平方和才能最小，對(duì)于w來(lái)說(shuō)，這就是凝聚。

到目前，我們談了參數(shù)凝聚使得神經(jīng)網(wǎng)絡(luò)的有效規(guī)模變得很小，那為什么我們不直接訓(xùn)練一個(gè)小規(guī)模的網(wǎng)絡(luò)？大網(wǎng)絡(luò)和小網(wǎng)絡(luò)有什么差異？?首先，我們用不同寬度的兩層網(wǎng)絡(luò)來(lái)擬合同一批數(shù)據(jù)，下圖展示了它們的損失下降的過(guò)程。

不同寬度的網(wǎng)絡(luò)的損失函數(shù)表現(xiàn)出了高度的相似性，它們會(huì)在共同的位置發(fā)生停留。那在共同的臺(tái)階處有什么相似性呢？下面左圖可以看到，對(duì)于上述箭頭指示的臺(tái)階，不同寬度網(wǎng)絡(luò)的輸出函數(shù)非?？拷８M(jìn)一步看它們的特征圖（下右圖），它們都發(fā)生了強(qiáng)烈的凝聚現(xiàn)象。這些體現(xiàn)了它們的相似性。

如果再仔細(xì)觀察他們的損失圖，可以發(fā)現(xiàn)當(dāng)寬度增加的時(shí)候，網(wǎng)絡(luò)的損失函數(shù)更容易下降，比如前面箭頭指的地方，相對(duì)小的網(wǎng)絡(luò)就停留在臺(tái)階上，大的網(wǎng)絡(luò)的損失才繼續(xù)下降。從實(shí)驗(yàn)上可以看出，大網(wǎng)絡(luò)凝聚時(shí)雖然和小網(wǎng)絡(luò)在表達(dá)能力類似，但看起來(lái)大網(wǎng)絡(luò)更容易訓(xùn)練。怎么解釋不同寬度的網(wǎng)絡(luò)的相似性以及大網(wǎng)絡(luò)的優(yōu)勢(shì)？?在一個(gè)梯度下降的訓(xùn)練過(guò)程，出現(xiàn)平臺(tái)的原因很可能是因?yàn)橛?xùn)練路徑經(jīng)歷某個(gè)鞍點(diǎn)（附近有上升方向也有下降方向的極值點(diǎn)）附近。不同寬度的網(wǎng)絡(luò)似乎會(huì)經(jīng)歷相同的鞍點(diǎn)。但參數(shù)量不同的網(wǎng)絡(luò)，它們各自的鞍點(diǎn)生活在不同維度的空間，怎么會(huì)是同一點(diǎn)呢？

我們證明了不同寬度的網(wǎng)絡(luò)的損失景觀的極值點(diǎn)存在一個(gè)嵌入原則(Embedding Principle)[16], 即一個(gè)神經(jīng)網(wǎng)絡(luò)的損失景觀中 “包含”所有更窄神經(jīng)網(wǎng)絡(luò)損失景觀的所有臨界點(diǎn)（包括鞍點(diǎn)、局部最優(yōu)點(diǎn)和全局最優(yōu)點(diǎn)等）。簡(jiǎn)單地說(shuō)，就是一個(gè)網(wǎng)絡(luò)處理臨界點(diǎn)時(shí)，通過(guò)一些特定的嵌入方式，可以把這個(gè)網(wǎng)絡(luò)嵌入到一個(gè)更寬的網(wǎng)絡(luò)中，嵌入過(guò)程能夠保持網(wǎng)絡(luò)輸出不變以及寬網(wǎng)絡(luò)仍然處于臨界點(diǎn)。最簡(jiǎn)單的嵌入方式正是凝聚的逆過(guò)程，比如下圖是一種一步嵌入方式。更一般的嵌入方式我們?cè)贘ournal of Machine Learning第一期的文章里[17]有詳細(xì)討論。

嵌入原則揭示了不同寬度網(wǎng)絡(luò)的相似性，當(dāng)然也提供了研究它們差異性的手段。由于在嵌入的過(guò)程中有自由參數(shù)，因此在更大網(wǎng)絡(luò)的臨界點(diǎn)的退化程度越大。同樣的，一個(gè)大網(wǎng)絡(luò)的損失景觀里的臨界點(diǎn)，如果它來(lái)源于更簡(jiǎn)單的網(wǎng)絡(luò)的臨界點(diǎn)的嵌入，那么它的退化程度也越大（直觀可以理解它占的空間越大）。我們就可以猜測(cè)這些越簡(jiǎn)單的臨界點(diǎn)越有可能被學(xué)習(xí)到。

另外，我們?cè)诶碚撋献C明，在嵌入的過(guò)程中，臨界點(diǎn)附近的下降方向、上升方向都不會(huì)變少。這告訴我們，一個(gè)鞍點(diǎn)被嵌入到一個(gè)更大的網(wǎng)絡(luò)以后，它不可能變成一個(gè)極小值點(diǎn)，但一個(gè)極小值點(diǎn)被嵌入到大網(wǎng)絡(luò)以后，它很有可能會(huì)變成鞍點(diǎn)，產(chǎn)生更多的下降方向。我們?cè)趯?shí)驗(yàn)上也證明了嵌入過(guò)程會(huì)產(chǎn)生更多下降方向。

因此，我們有理由相信，大網(wǎng)絡(luò)盡管凝聚成有效的小網(wǎng)絡(luò)，但它會(huì)比小網(wǎng)絡(luò)更容易訓(xùn)練。也就是大網(wǎng)絡(luò)既可以控制模型的復(fù)雜度（可能帶來(lái)更好的泛化），又可以使訓(xùn)練更容易。?我們的工作還發(fā)現(xiàn)了在深度上神經(jīng)網(wǎng)絡(luò)損失景觀的嵌入原則[18]。關(guān)于凝聚現(xiàn)象，同樣還有很多問(wèn)題值得繼續(xù)深入。下面是一些例子。除了初始訓(xùn)練外，訓(xùn)練過(guò)程中的凝聚現(xiàn)象產(chǎn)生的機(jī)制是什么？不同的網(wǎng)絡(luò)結(jié)構(gòu)是否有凝聚現(xiàn)象？凝聚的過(guò)程和頻率原則有什么聯(lián)系？凝聚怎么定量地和泛化建立聯(lián)系？

總結(jié)

過(guò)去五年，在深度學(xué)習(xí)的基礎(chǔ)研究方面，我們主要圍繞頻率原則和參數(shù)凝聚兩類現(xiàn)象展開(kāi)工作。從發(fā)現(xiàn)它們，意識(shí)到他們很有趣，再到解釋它們，并在一定程度上基于這些工作去理解深度學(xué)習(xí)的其它方面和設(shè)計(jì)更好的算法。未來(lái)五年，我們將在深度學(xué)習(xí)的基礎(chǔ)研究和AI for Science方面深入鉆研。

參考文獻(xiàn)

[1] Zhi-Qin John Xu*, Yaoyu Zhang, and Yanyang Xiao, Training behavior of deep neural network in frequency domain, arXiv preprint: 1807.01251, (2018), ICONIP 2019.

[2] Zhi-Qin John Xu* , Yaoyu Zhang, Tao Luo, Yanyang Xiao, Zheng Ma, Frequency Principle: Fourier Analysis Sheds Light on Deep Neural Networks, arXiv preprint: 1901.06523, Communications in Computational Physics (CiCP).

[3]Tao Luo#,Zhi-Qin John Xu #, Zheng Ma, Yaoyu Zhang*, Phase diagram for two-layer ReLU neural networks at infinite-width limit, arxiv 2007.07497 (2020), Journal of Machine Learning Research (2021)

[4]Hanxu Zhou, Qixuan Zhou, Tao Luo, Yaoyu Zhang*, Zhi-Qin John Xu*, Towards Understanding the Condensation of Neural Networks at Initial Training. arxiv 2105.11686 (2021), NeurIPS2022.

[5] Jihong Wang,Zhi-Qin John Xu*, Jiwei Zhang*, Yaoyu Zhang, Implicit bias in understanding deep learning for solving PDEs beyond Ritz-Galerkin method, CSIAM Trans. Appl. Math.

[6] Tao Luo, Zheng Ma,Zhi-Qin John Xu, Yaoyu Zhang, Theory of the frequency principle for general deep neural networks, CSIAM Trans. Appl. Math., arXiv preprint, 1906.09235 (2019).

[7] Yaoyu Zhang, Tao Luo, Zheng Ma,Zhi-Qin John Xu*, Linear Frequency Principle Model to Understand the Absence of Overfitting in Neural Networks. Chinese Physics Letters, 2021.

[8] Tao Luo*, Zheng Ma,Zhi-Qin John Xu, Yaoyu Zhang, On the exact computation of linear frequency principle dynamics and its generalization, SIAM Journal on Mathematics of Data Science (SIMODS) to appear, arxiv 2010.08153 (2020).

[9]Tao Luo*, Zheng Ma, Zhiwei Wang, Zhi-Qin John Xu, Yaoyu Zhang, An Upper Limit of Decaying Rate with Respect to Frequency in Deep Neural Network, To appear in Mathematical and Scientific Machine Learning 2022 (MSML22),

[10] Zhi-Qin John Xu* , Hanxu Zhou, Deep frequency principle towards understanding why deeper learning is faster, AAAI 2021, arxiv 2007.14313 (2020)

[11] Ziqi Liu, Wei Cai,Zhi-Qin John Xu* , Multi-scale Deep Neural Network (MscaleDNN) for Solving Poisson-Boltzmann Equation in Complex Domains, arxiv 2007.11207 (2020) Communications in Computational Physics (CiCP).

[12] Xi-An Li,Zhi-Qin John Xu* , Lei Zhang, A multi-scale DNN algorithm for nonlinear elliptic equations with multiple scales, arxiv 2009.14597, (2020) Communications in Computational Physics (CiCP).

[13] Xi-An Li,Zhi-Qin John Xu, Lei Zhang*, Subspace Decomposition based DNN algorithm for elliptic type multi-scale PDEs. arxiv 2112.06660 (2021)

[14]Yuheng Ma,Zhi-Qin John Xu*, Jiwei Zhang*, Frequency Principle in Deep Learning Beyond Gradient-descent-based Training, arxiv 2101.00747 (2021).

[15]Hanxu Zhou, Qixuan Zhou, Zhenyuan Jin, Tao Luo, Yaoyu Zhang,Zhi-Qin John Xu*, Empirical Phase Diagram for Three-layer Neural Networks with Infinite Width. arxiv 2205.12101 (2022), NeurIPS2022.

[16]Yaoyu Zhang*, Zhongwang Zhang, Tao Luo,Zhi-Qin John Xu*, Embedding Principle of Loss Landscape of Deep Neural Networks. NeurIPS 2021 spotlight, arxiv 2105.14573 (2021)

[17] Zhongwang Zhang,Zhi-Qin John Xu*, Implicit regularization of dropout. arxiv 2207.05952 (2022)

[18]Zhiwei Bai, Tao Luo,Zhi-Qin John Xu*, Yaoyu Zhang*, Embedding Principle in Depth for the Loss Landscape Analysis of Deep Neural Networks. arxiv 2205.13283 (2022)

編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)

評(píng)論

相關(guān)推薦

FPGA學(xué)習(xí)-總結(jié)fifo設(shè)計(jì)中深度H的計(jì)算

對(duì)于fifo來(lái)說(shuō)，H的設(shè)置至關(guān)重要。既要保證功能性，不溢出丟數(shù)，也要保證性能流水。深度設(shè)置過(guò)小會(huì)影響功能，過(guò)大又浪費(fèi)資源。因此，總結(jié)下fifo設(shè)計(jì)中深度H的計(jì)算。

2022-08-29 11:19:03

1078

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法成為研究的主流，并隨之誕生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

2017全國(guó)深度學(xué)習(xí)技術(shù)應(yīng)用大會(huì)

單位：中國(guó)電子學(xué)會(huì)學(xué)術(shù)交流中心　　四、大會(huì)主席：王亮中科院自動(dòng)化研究所　　五、大會(huì)交流形式　　1.特邀演講：大會(huì)將邀請(qǐng)國(guó)內(nèi)深度學(xué)習(xí)技術(shù)領(lǐng)域的著名專家，就深度學(xué)習(xí)技術(shù)的應(yīng)用和最新動(dòng)態(tài)做特邀報(bào)告

2017-03-22 17:16:00

深度學(xué)習(xí)DeepLearning實(shí)戰(zhàn)

一：深度學(xué)習(xí)DeepLearning實(shí)戰(zhàn)時(shí)間地點(diǎn)：1 月 15日— 1 月18 日二：深度強(qiáng)化學(xué)習(xí)核心技術(shù)實(shí)戰(zhàn)時(shí)間地點(diǎn)： 1 月 27 日— 1 月30 日(第一天報(bào)到授課三天；提前環(huán)境部署電腦

2021-01-09 17:01:54

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示?；逎y懂的概念，略微有些難以

2018-07-04 16:07:53

深度學(xué)習(xí)介紹

在未來(lái)的某個(gè)時(shí)候，人們必定能夠相對(duì)自如地運(yùn)用人工智能，安全地駕車出行。這個(gè)時(shí)刻何時(shí)到來(lái)我無(wú)法預(yù)見(jiàn)；但我相信，彼時(shí)“智能”會(huì)顯現(xiàn)出更“切實(shí)”的意義。與此同時(shí)，通過(guò)深度學(xué)習(xí)方法，人工智能的實(shí)際應(yīng)用能夠在

2022-11-11 07:55:50

深度學(xué)習(xí)在預(yù)測(cè)和健康管理中的應(yīng)用

方法方面的最新進(jìn)展，目的是發(fā)現(xiàn)研究差距并提出進(jìn)一步的改進(jìn)建議。在簡(jiǎn)要介紹了幾種深度學(xué)習(xí)模型之后，我們回顧并分析了使用深度學(xué)習(xí)進(jìn)行故障檢測(cè)，診斷和預(yù)后的應(yīng)用。該調(diào)查驗(yàn)證了深度學(xué)習(xí)對(duì)PHM中各種類型的輸入

2021-07-12 06:46:47

深度學(xué)習(xí)存在哪些問(wèn)題？

深度學(xué)習(xí)常用模型有哪些？深度學(xué)習(xí)常用軟件工具及平臺(tái)有哪些？深度學(xué)習(xí)存在哪些問(wèn)題？

2021-10-14 08:20:47

深度學(xué)習(xí)是什么

創(chuàng)客們的最酷“玩具”　　智能無(wú)人機(jī)、自主機(jī)器人、智能攝像機(jī)、自動(dòng)駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后，幾乎都和計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)密切相關(guān)?！　?b class="flag-6" style="color: red">深度學(xué)習(xí)

2021-07-19 06:17:28

深度學(xué)習(xí)框架只為GPU?

CPU優(yōu)化深度學(xué)習(xí)框架和函數(shù)庫(kù)機(jī)器學(xué)***器

2021-02-22 06:01:02

深度學(xué)習(xí)模型是如何創(chuàng)建的？

具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來(lái)了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個(gè)行業(yè)的企業(yè)和組織。深度學(xué)習(xí)模型可以幫助實(shí)現(xiàn)工業(yè)流程自動(dòng)化，進(jìn)行實(shí)時(shí)分析以做出決策，甚至可以預(yù)測(cè)預(yù)警。這些AI

2021-10-27 06:34:15

深度強(qiáng)化學(xué)習(xí)實(shí)戰(zhàn)

2021-01-10 13:42:26

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

學(xué)習(xí)，也就是現(xiàn)在最流行的深度學(xué)習(xí)領(lǐng)域，關(guān)注論壇的朋友應(yīng)該看到了，開(kāi)發(fā)板試用活動(dòng)中有【NanoPi K1 Plus試用】的申請(qǐng)，介紹中NanopiK1plus的高大上優(yōu)點(diǎn)之一就是“可運(yùn)行深度學(xué)習(xí)算法的智能

2018-06-04 22:32:12

THz在凝聚態(tài)物理研究中有哪些應(yīng)用？

THz波填補(bǔ)了紅外光和微波的頻率空白。使在全頻范圍內(nèi)研究凝聚態(tài)物質(zhì)與電磁波(光)的相互作用成為可能，特別是對(duì)固體元激發(fā)的研究具有重要意義。THz頻率范圍內(nèi)的固體元激發(fā)有：離子晶體的橫光學(xué)聲子和縱光學(xué)

2019-05-29 07:32:31

【HarmonyOS HiSpark AI Camera】基于深度學(xué)習(xí)的目標(biāo)檢測(cè)系統(tǒng)設(shè)計(jì)

項(xiàng)目名稱：基于深度學(xué)習(xí)的目標(biāo)檢測(cè)系統(tǒng)設(shè)計(jì)試用計(jì)劃：嘗試在硬件平臺(tái)實(shí)現(xiàn)對(duì)Yolo卷積神經(jīng)網(wǎng)絡(luò)的加速運(yùn)算，期望提出的方法能夠使目標(biāo)檢測(cè)技術(shù)更便捷，運(yùn)用領(lǐng)域更廣泛。針對(duì)課題的研究一是研究基于開(kāi)發(fā)板低功耗

2020-09-25 10:11:49

【NanoPi K1 Plus試用體驗(yàn)】搭建深度學(xué)習(xí)框架

近幾年各種深度學(xué)習(xí)框架涌現(xiàn)，大家可能很難從眾多的深度學(xué)習(xí)框架中選擇一個(gè)合適的框架進(jìn)行學(xué)習(xí)。對(duì)于深度學(xué)習(xí)的初學(xué)者，或者覺(jué)得Tensorflow,Caffe等框架學(xué)習(xí)困難難以上手的人，可以考慮學(xué)習(xí)

2018-07-17 11:40:31

【米爾FZ3深度學(xué)習(xí)計(jì)算卡試用體驗(yàn)】FZ3深度學(xué)習(xí)計(jì)算卡總結(jié)篇

趕沒(méi)有時(shí)間研究自帶深度學(xué)習(xí)系統(tǒng)的的相關(guān)前向推斷教程，而且本人更偏向于硬件部分，C++對(duì)于我來(lái)說(shuō)還是不太友好，因此自己的設(shè)計(jì)的系統(tǒng)更多的還是偏向于python語(yǔ)言。以下是對(duì)這個(gè)板卡的相關(guān)總結(jié)說(shuō)明。一

2021-01-10 14:39:17

【詳解】FPGA：深度學(xué)習(xí)的未來(lái)？

（FPGA）提供了另一個(gè)值得探究的解決方案。日漸流行的FPGA設(shè)計(jì)工具使其對(duì)深度學(xué)習(xí)領(lǐng)域經(jīng)常使用的上層軟件兼容性更強(qiáng)，使得FPGA更容易為模型搭建和部署者所用。FPGA架構(gòu)靈活，使得研究者能夠在諸如GPU

2018-08-13 09:33:30

什么是深度學(xué)習(xí)？

深度學(xué)習(xí)是什么意思

2020-11-11 06:58:03

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

方便的進(jìn)行深度學(xué)習(xí)的應(yīng)用。然而，深度學(xué)習(xí)仍然主要使用 GPU 和 CPU 完成。因此，在這里我們將仔細(xì)研究使用 FPGA 進(jìn)行深度學(xué)習(xí)推理的好處。可構(gòu)建低功耗、節(jié)省空間的系統(tǒng)FPGA 的計(jì)算并行度不如

2023-02-17 16:56:59

剛開(kāi)始進(jìn)行深度學(xué)習(xí)的同學(xué)怎么選擇合適的機(jī)器配置

怎么為自己的深度學(xué)習(xí)機(jī)器選擇合適的GPU配置呢？對(duì)于那些一直想進(jìn)行深度學(xué)習(xí)研究的同學(xué)來(lái)說(shuō)，一直是個(gè)比較糾結(jié)的問(wèn)題，既要考慮到使用的場(chǎng)景，又要考慮到價(jià)格等各方面因素。如何選擇深度學(xué)習(xí)的組件？這真的很

2018-09-19 13:56:36

卷積神經(jīng)網(wǎng)絡(luò)—深度卷積網(wǎng)絡(luò)：實(shí)例探究及學(xué)習(xí)總結(jié)

《深度學(xué)習(xí)工程師-吳恩達(dá)》03卷積神經(jīng)網(wǎng)絡(luò)—深度卷積網(wǎng)絡(luò)：實(shí)例探究 學(xué)習(xí)總結(jié)

2020-05-22 17:15:57

吳恩達(dá)深度學(xué)習(xí)相關(guān)函數(shù)總結(jié)(一)

關(guān)于吳恩達(dá)深度學(xué)習(xí)總結(jié)(一)

2019-07-29 10:35:29

基于深度學(xué)習(xí)的異常檢測(cè)的研究方法

ABSTRACT1.基于深度學(xué)習(xí)的異常檢測(cè)的研究方法進(jìn)行結(jié)構(gòu)化和全面的概述2.回顧這些方法在各個(gè)領(lǐng)域這個(gè)中的應(yīng)用情況，并評(píng)估他們的有效性。3.根據(jù)基本假設(shè)和采用的方法將最先進(jìn)的深度異常檢測(cè)技術(shù)分為

2021-07-12 06:36:22

基于深度學(xué)習(xí)的異常檢測(cè)的研究方法

異常檢測(cè)的深度學(xué)習(xí)研究綜述原文：arXiv:1901.03407摘要異常檢測(cè)是一個(gè)重要的問(wèn)題，在不同的研究領(lǐng)域和應(yīng)用領(lǐng)域都得到了很好的研究。本文的研究目的有兩個(gè)：首先，我們對(duì)基于深度學(xué)習(xí)的異常檢測(cè)

2021-07-12 07:10:19

基于深度學(xué)習(xí)的監(jiān)督圖像分類算法研究，MATLAB制作的。求助：程序代碼修改補(bǔ)充，有償

關(guān)鍵詞:圖像檢索;深度學(xué)習(xí);哈希算法;

2019-04-01 16:12:24

射頻系統(tǒng)的深度學(xué)習(xí)【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學(xué)習(xí)與評(píng)論內(nèi)容? 射頻系統(tǒng)中的深度學(xué)習(xí)? Deepwave Digital技術(shù)? 信號(hào)檢測(cè)和分類示例? GPU的實(shí)時(shí)DSP基準(zhǔn)測(cè)試? 總結(jié)回映電子是一家

2022-01-05 10:00:58

探討一下深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

下面來(lái)探討一下深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用，具體如下：1、深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究，包含多個(gè)隱層的多層感知器(MLP) 是一種原始的深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象

2021-10-27 08:02:31

改善深層神經(jīng)網(wǎng)絡(luò)--超參數(shù)優(yōu)化、batch正則化和程序框架學(xué)習(xí)總結(jié)

《深度學(xué)習(xí)工程師-吳恩達(dá)》02改善深層神經(jīng)網(wǎng)絡(luò)--超參數(shù)優(yōu)化、batch正則化和程序框架 學(xué)習(xí)總結(jié)

2020-06-16 14:52:01

計(jì)算機(jī)視覺(jué)應(yīng)用深度學(xué)習(xí)

怎樣從傳統(tǒng)機(jī)器學(xué)習(xí)方法過(guò)渡到深度學(xué)習(xí)？

2021-10-14 06:51:23

請(qǐng)問(wèn)一下什么是深度學(xué)習(xí)？

請(qǐng)問(wèn)一下什么是深度學(xué)習(xí)？

2021-08-30 07:35:21

谷歌深度學(xué)習(xí)插件tensorflow

前段時(shí)間忙著研究Zedboard，這幾天穿插著加入Python的深度學(xué)習(xí)的研究，最近使用谷歌的tensorflow比較多，而且官方出了中文教程，比較給力，下面在Windows10下安裝一下

2018-07-04 13:46:51

PCB設(shè)計(jì)原則總結(jié)

PCB設(shè)計(jì)原則總結(jié)

2016-12-20 23:00:50

Python機(jī)器學(xué)習(xí)庫(kù)和深度學(xué)習(xí)庫(kù)總結(jié)

和DBSCAN。而且也設(shè)計(jì)出了Python numerical和scientific libraries Numpy and Scipy 2、Keras（深度學(xué)習(xí)） https://github.com/fchollet/keras Keras是

2017-11-10 14:49:02

727

深度學(xué)習(xí)主流芯片的介紹及其優(yōu)缺點(diǎn)的分析

本文我們就來(lái)分析目前主流的深度學(xué)習(xí)芯片的優(yōu)缺點(diǎn)。 CPU 不適合深度學(xué)習(xí) 深度學(xué)習(xí)與傳統(tǒng)計(jì)算模式最大的區(qū)別就是不需要編程，它是從輸入的大量數(shù)據(jù)中自發(fā)地總結(jié)出規(guī)律，而傳統(tǒng)計(jì)算模式更多都需要人為提取所需

2017-09-27 15:24:59

超參數(shù)優(yōu)化是深度學(xué)習(xí)中的重要組成部分

超參數(shù)優(yōu)化是深度學(xué)習(xí)中的重要組成部分。其原因在于，神經(jīng)網(wǎng)絡(luò)是公認(rèn)的難以配置，而又有很多參數(shù)需要設(shè)置。最重要的是，個(gè)別模型的訓(xùn)練非常緩慢。在這篇文章中，你會(huì)了解到如何使用scikit-learn

2017-09-30 16:22:16

諾亞關(guān)于深度學(xué)習(xí)的研究進(jìn)展及發(fā)展趨勢(shì)

實(shí)驗(yàn)室最近兩年內(nèi)和深度學(xué)習(xí)相關(guān)的研究成果，并探討了深度學(xué)習(xí)的未來(lái)趨勢(shì)。深度學(xué)習(xí)的近十年進(jìn)展深度學(xué)習(xí)為什么現(xiàn)在這么火？大數(shù)據(jù)、算法突破和計(jì)算能力。算法上有什么樣的突破？第一點(diǎn)，對(duì)多層神經(jīng)網(wǎng)絡(luò)做預(yù)訓(xùn)練。第二點(diǎn)，大量標(biāo)注

2017-10-09 18:36:54

開(kāi)源深度學(xué)習(xí)框架對(duì)比研究的三個(gè)主要維度學(xué)習(xí)

本節(jié)對(duì)5個(gè)開(kāi)源深度學(xué)習(xí)框架進(jìn)行對(duì)比研究，主要側(cè)重于3個(gè)維度研究：硬件支持率、速度和準(zhǔn)確率、社區(qū)活躍性。他們分別是：TensorFlow、Caffe、Keras、Torch、DL4j 。 2.3.1

2017-11-15 12:04:00

3896

盤點(diǎn)幾種深度學(xué)習(xí)庫(kù)

本文總結(jié)了Python、Matlab、CPP、Java、JavaScript、Lua、Julia、Lisp、Haskell、.NET、R等語(yǔ)言的深度學(xué)習(xí)庫(kù)，趕緊收藏吧！Theano是一個(gè)Python

2017-11-16 14:20:45

2873

將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的深度強(qiáng)化學(xué)習(xí)DRL

深度強(qiáng)化學(xué)習(xí)DRL自提出以來(lái)，已在理論和應(yīng)用方面均取得了顯著的成果。尤其是谷歌DeepMind團(tuán)隊(duì)基于深度強(qiáng)化學(xué)習(xí)DRL研發(fā)的AlphaGo，將深度強(qiáng)化學(xué)習(xí)DRL成推上新的熱點(diǎn)和高度，成為人工智能歷史上一個(gè)新的里程碑。因此，深度強(qiáng)化學(xué)習(xí)DRL非常值得研究。

2018-06-29 18:36:00

27596

山世光談深度學(xué)習(xí)生產(chǎn)線、以及中科視拓深度學(xué)習(xí)算法平臺(tái)SeeTaaS

中科視拓董事長(zhǎng)山世光研究員，在2017鈦媒體T-EDGE年度國(guó)際盛典上，談深度學(xué)習(xí)生產(chǎn)線、以及中科視拓通用深度學(xué)習(xí)算法平臺(tái)SeeTaaS。

2017-12-26 13:41:37

4266

對(duì)2017年NLP領(lǐng)域中深度學(xué)習(xí)技術(shù)應(yīng)用的總結(jié)

本文作者Javier Couto是tryo labs公司的一名研發(fā)科學(xué)家，專注于NLP技術(shù)。這篇文章是他對(duì)2017年NLP領(lǐng)域中深度學(xué)習(xí)技術(shù)應(yīng)用的總結(jié)，也許并不全面，但都是他認(rèn)為有價(jià)值、有意義的成果。Couto表示，2017年是對(duì)NLP領(lǐng)域非常有意義的一年，隨著深度學(xué)習(xí)的應(yīng)用，NLP技術(shù)也將繼續(xù)發(fā)展下去。

2017-12-28 10:02:28

5372

采用無(wú)監(jiān)督學(xué)習(xí)的方法，用深度摘要網(wǎng)絡(luò)總結(jié)視頻

中科院和英國(guó)倫敦大學(xué)瑪麗女王學(xué)院的研究人員就生成視頻摘要提出了一種新方法，采用無(wú)監(jiān)督學(xué)習(xí)的方法，用深度摘要網(wǎng)絡(luò)（Deep Summarization Network，DSN）總結(jié)視頻。

2018-01-15 10:49:15

6753

袁進(jìn)輝：分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展

1月17日，院友袁進(jìn)輝博士回到微軟亞洲研究院做了題為《打造最強(qiáng)深度學(xué)習(xí)引擎》的報(bào)告，分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展。

2018-01-25 09:23:45

4492

深度學(xué)習(xí)方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學(xué)習(xí)的研究者都在使用GPU，但是對(duì)比深度學(xué)習(xí)硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認(rèn)清對(duì)深度學(xué)習(xí)硬件平臺(tái)的要求。

2018-02-02 15:21:40

10206

吳恩達(dá)深度學(xué)習(xí)專項(xiàng)課程的信息圖deeplearning.ai課程總結(jié)

深度學(xué)習(xí)能發(fā)展起來(lái)主要是由于大數(shù)據(jù)的出現(xiàn)，神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的數(shù)據(jù)；而大數(shù)據(jù)本身也反過(guò)來(lái)促進(jìn)了更大型網(wǎng)絡(luò)的出現(xiàn)。深度學(xué)習(xí)研究的一大突破是新型激活函數(shù)的出現(xiàn)，用 ReLU 函數(shù)替換 sigmoid

2018-04-03 11:16:22

4276

人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)有什么關(guān)系？

有三個(gè)詞，這兩年出現(xiàn)的頻率越來(lái)越高：人工智能（AI），機(jī)器學(xué)習(xí)（ML），深度學(xué)習(xí)（DL），到底他們哥仨是什么關(guān)系？

2018-06-08 15:19:18

11942

探討深度學(xué)習(xí)在自動(dòng)駕駛中的應(yīng)用

深度強(qiáng)化學(xué)習(xí)的理論、自動(dòng)駕駛技術(shù)的現(xiàn)狀以及問(wèn)題、深度強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛技術(shù)當(dāng)中的應(yīng)用及基于深度強(qiáng)化學(xué)習(xí)的禮讓自動(dòng)駕駛研究。

2018-08-18 10:19:57

4854

深度學(xué)習(xí)是什么？了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解

本深度學(xué)習(xí)是什么？了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解本文檔視頻讓你4分鐘快速了解深度學(xué)習(xí) 深度學(xué)習(xí)的概念源于人工智能的人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

2018-08-23 14:36:16

5分鐘內(nèi)看懂機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別

由 mengqiqi 于星期四, 2018-09-13 09:34 發(fā)表在本文中，我們將研究深度學(xué)習(xí)和機(jī)器學(xué)習(xí)之間的差異。我們將逐一了解它們，然后討論他們?cè)诟鱾€(gè)方面的不同之處。除了深度學(xué)習(xí)和機(jī)器

2018-09-13 17:19:01

393

一文解讀深度學(xué)習(xí)的發(fā)展

在2018清潔發(fā)展國(guó)際融資論壇上，北京交通大學(xué)人工智能研究院常務(wù)副院長(zhǎng)、教授于劍先生從專業(yè)角度回顧了人工智能的發(fā)展歷程，并介紹了深度學(xué)習(xí)的適用范圍和所面臨的問(wèn)題。他指出，深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域最引人注目的研究方向，但沒(méi)有任何一種算法可以解決機(jī)器學(xué)習(xí)所有的應(yīng)用。

2018-10-05 17:29:00

2098

淺論學(xué)習(xí)深度學(xué)習(xí)的四個(gè)步驟

2018-10-07 15:19:00

11904

解讀深度學(xué)習(xí)與大數(shù)據(jù)分析研究進(jìn)展

在研究基于大數(shù)據(jù)框架將深度學(xué)習(xí)的分布式實(shí)現(xiàn)后，王萬(wàn)良指出，人工智能是大數(shù)據(jù)分析領(lǐng)域的研究主流，基于深度學(xué)習(xí)的大數(shù)據(jù)分析方法發(fā)展最為迅速，GPU成為深度學(xué)習(xí)的更高效的硬件平臺(tái)，研究分布式計(jì)算智能優(yōu)化算法將解決大數(shù)據(jù)優(yōu)化問(wèn)題，能夠提升算法的效果并降低計(jì)算復(fù)雜度。

2018-09-26 16:56:13

8879

零基礎(chǔ)入行深度學(xué)習(xí)

深度學(xué)習(xí)到底有多熱，這里我就不再?gòu)?qiáng)調(diào)了，也因此有很多人關(guān)心這樣的幾個(gè)問(wèn)題，“適不適合轉(zhuǎn)行深度學(xué)習(xí)（機(jī)器學(xué)習(xí)）”，“怎么樣轉(zhuǎn)行深度學(xué)習(xí)（機(jī)器學(xué)習(xí)）”，“轉(zhuǎn)行深度學(xué)習(xí)需要哪些入門材料？”等等。

2018-10-19 14:07:19

2467

機(jī)器學(xué)習(xí)研究中常見(jiàn)的七大謠傳總結(jié)

在學(xué)習(xí)深度學(xué)習(xí)的過(guò)程中，我們常會(huì)遇到各種謠傳，也會(huì)遇到各種想當(dāng)然的「執(zhí)念」。在本文中，作者總結(jié)了機(jī)器學(xué)習(xí)研究中常見(jiàn)的七大謠傳，他們很多都是我們以前的固有概念，而最近又有新研究對(duì)它們提出質(zhì)疑。所以在為機(jī)器學(xué)習(xí)填坑的生涯中，快自檢這七個(gè)言傳吧。

2019-02-26 14:05:18

2593

NLP中的深度學(xué)習(xí)技術(shù)概述

該項(xiàng)目是對(duì)基于深度學(xué)習(xí)的自然語(yǔ)言處理（NLP）的概述，包括用來(lái)解決不同 NLP 任務(wù)和應(yīng)用的深度學(xué)習(xí)模型（如循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)）的理論介紹和實(shí)現(xiàn)細(xì)節(jié)，以及對(duì) NLP 任務(wù)（機(jī)器翻譯、問(wèn)答和對(duì)話系統(tǒng)）當(dāng)前最優(yōu)結(jié)果的總結(jié)。

2019-03-01 09:13:57

4424

深度學(xué)習(xí)和普通機(jī)器學(xué)習(xí)的區(qū)別

本質(zhì)上，深度學(xué)習(xí)提供了一套技術(shù)和算法，這些技術(shù)和算法可以幫助我們對(duì)深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行參數(shù)化——人工神經(jīng)網(wǎng)絡(luò)中有很多隱含層數(shù)和參數(shù)。深度學(xué)習(xí)背后的一個(gè)關(guān)鍵思想是從給定的數(shù)據(jù)集中提取高層次的特征。因此，深度學(xué)習(xí)的目標(biāo)是克服單調(diào)乏味的特征工程任務(wù)的挑戰(zhàn)，并幫助將傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)化。

2019-06-08 14:44:00

4142

深度學(xué)習(xí)真的好嗎

對(duì)深度學(xué)習(xí)近期取得的進(jìn)展，從事圖像處理研究的人可謂厭惡和妒忌參半。

2019-07-03 10:43:37

4879

深度神經(jīng)網(wǎng)絡(luò)不同超參數(shù)調(diào)整規(guī)則總結(jié)

在深度神經(jīng)網(wǎng)絡(luò)中，超參數(shù)的調(diào)整是一項(xiàng)必備技能，通過(guò)觀察在訓(xùn)練過(guò)程中的監(jiān)測(cè)指標(biāo)如損失loss和準(zhǔn)確率來(lái)判斷當(dāng)前模型處于什么樣的訓(xùn)練狀態(tài)，及時(shí)調(diào)整超參數(shù)以更科學(xué)地訓(xùn)練模型能夠提高資源利用率。下面將分別介紹并總結(jié)不同超參數(shù)的調(diào)整規(guī)則。

2019-08-29 15:53:34

4629

深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的六個(gè)本質(zhì)區(qū)別你知道幾個(gè)？

深度學(xué)習(xí)和機(jī)器學(xué)習(xí)已經(jīng)變得無(wú)處不在，那它們之間到底有什么區(qū)別呢？本文我們?yōu)榇蠹?b class="flag-6" style="color: red">總結(jié)了深度學(xué)習(xí)VS機(jī)器學(xué)習(xí)的六大本質(zhì)區(qū)別。

2019-11-30 11:17:02

14218

關(guān)于深度強(qiáng)化學(xué)習(xí)的概念以及它的工作原理

深度學(xué)習(xí)DL是機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。深度學(xué)習(xí)DL有監(jiān)督和非監(jiān)督之分，都已經(jīng)得到廣泛的研究和應(yīng)用。

2020-01-30 09:53:00

5546

FPGA做深度學(xué)習(xí)加速的技能總結(jié)

做深度學(xué)習(xí)加速器已經(jīng)兩年了，從RTL設(shè)計(jì)到仿真驗(yàn)證，以及相應(yīng)的去了解了Linux驅(qū)動(dòng)，深度學(xué)習(xí)壓縮方法等等。

2020-03-08 16:29:00

8343

Facebook研究開(kāi)放新框架，讓深度學(xué)習(xí)更加容易

FAIR一直是深度學(xué)習(xí)領(lǐng)域研究和開(kāi)源框架的定期貢獻(xiàn)者。從PyTorch到ONNX, FAIR團(tuán)隊(duì)為實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用程序的簡(jiǎn)化做出了不可思議的貢獻(xiàn)。

2020-03-13 15:23:05

1503

一個(gè)全新的深度學(xué)習(xí)框架——計(jì)圖

清華大學(xué)計(jì)算機(jī)系胡事民教授研究團(tuán)隊(duì)提出了一個(gè)全新的深度學(xué)習(xí)框架——計(jì)圖（Jittor）。Jittor是一個(gè)采用元算子表達(dá)神經(jīng)網(wǎng)絡(luò)計(jì)算單元、完全基于動(dòng)態(tài)編譯（Just-in-Time）的深度學(xué)習(xí)框架。

2020-03-26 15:50:29

6456

如何使用深度學(xué)習(xí)實(shí)現(xiàn)語(yǔ)音聲學(xué)模型的研究

的分析識(shí)別更是研究的重中之重。近年來(lái)深 10 度學(xué)習(xí)模型的廣泛發(fā)展和計(jì)算能力的大幅提升對(duì)語(yǔ)音識(shí)別技術(shù)的提升起到了關(guān)鍵作用。本文立足于語(yǔ)音識(shí)別與深度學(xué)習(xí)理論緊密結(jié)合，針對(duì)如何利用深度學(xué)習(xí)模型搭建區(qū)分能力更強(qiáng)魯棒性更

2020-05-09 08:00:00

THz在凝聚態(tài)物理研究中有什么樣的應(yīng)用

THz波填補(bǔ)了紅外光和微波的頻率空白。使在全頻范圍內(nèi)研究凝聚態(tài)物質(zhì)與電磁波（光）的相互作用成為可能，特別是對(duì)固體元激發(fā)的研究具有重要意義。THz頻率范圍內(nèi)的固體元激發(fā)有：離子晶體的橫光學(xué)聲子和縱光學(xué)聲子，離子晶體的橫光學(xué)聲子與光子相互作用產(chǎn)生的極化激元，金屬的等離子體振蕩，金屬和半導(dǎo)體的回旋共振等。

2020-12-09 10:27:00

微軟和谷歌分別開(kāi)源分布式深度學(xué)習(xí)框架對(duì)比

微軟和谷歌一直在積極研究用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的新框架，并且在最近將各自的成果開(kāi)源微軟的 PipeDream 和谷歌的 GPipe。原則上看，他們都遵循了類似的原則來(lái)訓(xùn)練深度學(xué)習(xí)模型。這兩個(gè)項(xiàng)目已在

2020-11-01 10:49:41

1696

三極管的頻率參數(shù)的學(xué)習(xí)課件免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是三極管的頻率參數(shù)的學(xué)習(xí)課件免費(fèi)下載包括了：共射截止頻率，特征頻率，共基截止頻率

2020-12-15 08:00:00

深度主動(dòng)學(xué)習(xí)的相關(guān)工作全面概述

Abstract 主動(dòng)學(xué)習(xí)試圖通過(guò)標(biāo)記最少量的樣本使得模型的性能收益最大化。而深度學(xué)習(xí)則對(duì)數(shù)據(jù)比較貪婪，需要大量的數(shù)據(jù)供給來(lái)優(yōu)化海量的參數(shù)，從而使得模型學(xué)會(huì)如何提取高質(zhì)量的特征。近年來(lái)，由于互聯(lián)網(wǎng)

2021-02-17 11:55:00

3128

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有什么區(qū)別？

深度學(xué)習(xí)算法現(xiàn)在是圖像處理軟件庫(kù)的組成部分。在他們的幫助下，可以學(xué)習(xí)和訓(xùn)練復(fù)雜的功能;但他們的應(yīng)用也不是萬(wàn)能的。 “機(jī)器學(xué)習(xí)”和“深度學(xué)習(xí)”有什么區(qū)別？在機(jī)器視覺(jué)和深度學(xué)習(xí)中，人類視覺(jué)的力量和對(duì)視

2021-03-12 16:11:00

7763

基于深度學(xué)習(xí)的三維點(diǎn)云語(yǔ)義分割研究分析

近年來(lái)，深度傳感器和三維激光掃描儀的普及推動(dòng)了三維點(diǎn)云處理方法的快速發(fā)展。點(diǎn)云語(yǔ)義分割作為理解三維場(chǎng)景的關(guān)鍵步驟，受到了研究者的廣泛關(guān)注。隨著深度學(xué)習(xí)的迅速發(fā)展并廣泛應(yīng)用到三維語(yǔ)義分割領(lǐng)域，點(diǎn)云語(yǔ)義

2021-04-01 14:48:46

基于深度學(xué)習(xí)的惡意代碼功防研究及進(jìn)展

深度學(xué)習(xí)賦能的惡意代碼攻防研究已經(jīng)成為網(wǎng)絡(luò)安全領(lǐng)域中的熱點(diǎn)問(wèn)題。當(dāng)前還沒(méi)有針對(duì)這一熱點(diǎn)問(wèn)題的相關(guān)綜述，為了及時(shí)跟進(jìn)該領(lǐng)域的最新研究成果，本文首先分析并總結(jié)了惡意代碼攻擊的一般流程。基于該攻擊流程

2021-04-28 17:23:38

基于深度學(xué)習(xí)的信息級(jí)聯(lián)預(yù)測(cè)方法研究綜述

Prediction領(lǐng)堿。文中主要對(duì)基于深度學(xué)習(xí)的信息級(jí)聯(lián)預(yù)測(cè)方法的研究現(xiàn)狀與經(jīng)典算法進(jìn)行分類、梳理與總結(jié)。根據(jù)信息級(jí)聯(lián)特征刻畫的側(cè)重點(diǎn)不冋，將基于深度學(xué)習(xí)的信息級(jí)聯(lián)預(yù)測(cè)方法分為時(shí)序信息級(jí)聯(lián)預(yù)測(cè)方法與拓?fù)湫畔⒓?jí)聯(lián)預(yù)測(cè)方法，并進(jìn)一步將時(shí)序信息級(jí)聯(lián)預(yù)測(cè)方法

2021-05-18 15:28:21

深度學(xué)習(xí)為傳統(tǒng)視覺(jué)檢測(cè)帶來(lái)希望

　　深度學(xué)習(xí)（Deep Learning）的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。它是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域，其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)

2021-06-17 10:32:02

438

基于深度學(xué)習(xí)的文本主題模型研究綜述

基于深度學(xué)習(xí)的文本主題模型研究綜述

2021-06-24 11:49:18

深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

2021-10-20 17:51:05

基于深度學(xué)習(xí)的目標(biāo)檢測(cè)研究綜述

基于深度學(xué)習(xí)的目標(biāo)檢測(cè)研究綜述來(lái)源：《電子學(xué)報(bào)》?，作者羅會(huì)蘭等摘要：?目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)的熱點(diǎn)課題，在機(jī)器人導(dǎo)航、智能視頻監(jiān)控及航天航空等領(lǐng)域都有廣泛的應(yīng)用.本文首先綜述了目標(biāo)檢測(cè)

2022-01-06 09:14:58

1702

FDTD學(xué)習(xí)總結(jié).pdf

FDTD學(xué)習(xí)總結(jié).pdf

2022-01-17 11:28:24

深度學(xué)習(xí)在軌跡數(shù)據(jù)挖掘中的應(yīng)用研究綜述

深度學(xué)習(xí)在軌跡數(shù)據(jù)挖掘中的應(yīng)用研究綜述來(lái)源：《?計(jì)算機(jī)科學(xué)與應(yīng)用》?，作者李旭娟等摘要:? 在過(guò)去十年，深度學(xué)習(xí)已被證明在很多領(lǐng)域應(yīng)用非常成功，如視覺(jué)圖像、自然語(yǔ)言處理、語(yǔ)音識(shí)別等，同時(shí)

2022-03-08 17:24:10

1271

使用深度學(xué)習(xí)的好處和優(yōu)勢(shì)

深度學(xué)習(xí)型圖像分析較適合原本復(fù)雜的涂裝表面檢測(cè)：有微小變化但可接受的圖案，以及無(wú)法使用空間頻率方法排除的位置變量。深度學(xué)習(xí)擅長(zhǎng)解決復(fù)雜的表面和涂裝缺陷，例如轉(zhuǎn)動(dòng)、刷涂或發(fā)亮部件上的掛擦和凹痕。

2022-09-01 09:40:25

9078

深度學(xué)習(xí)聚類的綜述

作者：凱魯嘎吉來(lái)源：博客園這篇文章對(duì)現(xiàn)有的深度聚類算法進(jìn)行全面綜述與總結(jié)。現(xiàn)有的深度聚類算法大都由聚類損失與網(wǎng)絡(luò)損失兩部分構(gòu)成，博客從兩個(gè)視角總結(jié)現(xiàn)有的深度聚類算法，即聚類模型與神經(jīng)網(wǎng)絡(luò)模型

2022-12-30 11:15:08

649

讀懂深度學(xué)習(xí)，走進(jìn)“深度學(xué)習(xí)+”階段

人工智能的概念在1956年就被提出，如今終于走入現(xiàn)實(shí)，離不開(kāi)一種名為“深度學(xué)習(xí)”的技術(shù)。深度學(xué)習(xí)的運(yùn)作模式，如同一場(chǎng)傳話游戲。給神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)，對(duì)數(shù)據(jù)的特征進(jìn)行描述，在神經(jīng)網(wǎng)絡(luò)中層層傳遞，最終

2023-01-14 23:34:43

588

什么是深度學(xué)習(xí)中優(yōu)化算法

先大致講一下什么是深度學(xué)習(xí)中優(yōu)化算法吧，我們可以把模型比作函數(shù)，一種很復(fù)雜的函數(shù)：h(f(g(k(x))))，函數(shù)有參數(shù)，這些參數(shù)是未知的，深度學(xué)習(xí)中的“學(xué)習(xí)”就是通過(guò)訓(xùn)練數(shù)據(jù)求解這些未知的參數(shù)。

2023-02-13 15:31:48

1019

基于深度學(xué)習(xí)的散射成像研究進(jìn)展

卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一種用于對(duì)目標(biāo)進(jìn)行重建、分類等處理的深度學(xué)習(xí)方法。自2016年深度學(xué)習(xí)被首次應(yīng)用于散射成像，該研究一直是光學(xué)成像領(lǐng)域的熱門方向。

2023-05-24 09:51:21

166

為什么深度學(xué)習(xí)是非參數(shù)的？

今天我想要與大家分享的是深度神經(jīng)網(wǎng)絡(luò)的工作方式，以及深度神經(jīng)與“傳統(tǒng)”機(jī)器學(xué)習(xí)模型的不同之處。

2023-05-25 15:13:54

268

深度學(xué)習(xí)研究之PEFT技術(shù)解析

，實(shí)現(xiàn)高效的遷移學(xué)習(xí)。因此，PEFT 技術(shù)可以在提高模型效果的同時(shí)，大大縮短模型訓(xùn)練時(shí)間和計(jì)算成本，讓更多人能夠參與到深度學(xué)習(xí)研究中來(lái)。

2023-06-02 12:41:45

449

深度學(xué)習(xí)聚類的綜述

作者：凱魯嘎吉來(lái)源：博客園這篇文章對(duì)現(xiàn)有的深度聚類算法進(jìn)行全面綜述與總結(jié)?，F(xiàn)有的深度聚類算法大都由聚類損失與網(wǎng)絡(luò)損失兩部分構(gòu)成，博客從兩個(gè)視角總結(jié)現(xiàn)有的深度聚類算法，即聚類模型與神經(jīng)網(wǎng)絡(luò)模型。1.

2023-01-13 11:11:52

567

智造之眼丨深度學(xué)習(xí)應(yīng)用

智造之眼?科學(xué)設(shè)計(jì)深度學(xué)習(xí)各應(yīng)用流程，在盡量簡(jiǎn)化前期準(zhǔn)備工作的基礎(chǔ)上為客戶提供穩(wěn)定且準(zhǔn)確的深度學(xué)習(xí)解決方案。

2023-05-04 16:55:52

424

深度學(xué)習(xí)基本概念

科學(xué)領(lǐng)域一個(gè)非常熱門的研究領(lǐng)域。深度學(xué)習(xí)的基本概念和原理是什么？讓我們一起來(lái)探究一下。 1. 神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的核心，是一種由多個(gè)節(jié)點(diǎn)（也稱為神經(jīng)元）組成的計(jì)算模型。神經(jīng)網(wǎng)絡(luò)模擬了人類神經(jīng)元的工作方式，通

2023-08-17 16:02:49

982

深度學(xué)習(xí)算法簡(jiǎn)介深度學(xué)習(xí)算法是什么深度學(xué)習(xí)算法有哪些

。深度學(xué)習(xí)算法作為其中的重要組成部分，不僅可以為諸如人工智能、圖像識(shí)別以及自然語(yǔ)言處理等領(lǐng)域提供支持，同時(shí)也受到了越來(lái)越多的關(guān)注和研究。在本文中，我們將著重介紹深度學(xué)習(xí)算法，包括其是什么和有哪些種類。一、什么是

2023-08-17 16:02:56

6010

什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用

什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用深度學(xué)習(xí)算法被認(rèn)為是人工智能的核心，它是一種模仿人類大腦神經(jīng)元的計(jì)算模型。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種變體，主要通過(guò)變換各種架構(gòu)來(lái)對(duì)大量數(shù)據(jù)進(jìn)行學(xué)習(xí)以及分類處理

2023-08-17 16:03:04

1305

深度學(xué)習(xí)框架是什么？深度學(xué)習(xí)框架有哪些？

高模型的精度和性能。隨著人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展，深度學(xué)習(xí)框架已成為了研究和開(kāi)發(fā)人員們必備的工具之一。目前，市場(chǎng)上存在許多深度學(xué)習(xí)框架可供選擇。本文將為您介紹一些較為常見(jiàn)的深度學(xué)習(xí)框架，并探究它們的特點(diǎn)

2023-08-17 16:03:09

1589

深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程

深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要分支，多年來(lái)深度學(xué)習(xí)一直在各個(gè)領(lǐng)域的應(yīng)用中發(fā)揮著極其重要的作用，成為了人工智能技術(shù)的重要組成部分。許多深度學(xué)習(xí)算法和框架提供

2023-08-17 16:11:26

638

深度學(xué)習(xí)服務(wù)器怎么做深度學(xué)習(xí)服務(wù)器diy 深度學(xué)習(xí)服務(wù)器主板用什么

深度學(xué)習(xí)服務(wù)器怎么做深度學(xué)習(xí)服務(wù)器diy 深度學(xué)習(xí)服務(wù)器主板用什么? 隨著人工智能的飛速發(fā)展，越來(lái)越多的人開(kāi)始投身于深度學(xué)習(xí)領(lǐng)域。但是，隨著深度學(xué)習(xí)的算法越來(lái)越復(fù)雜，需要更大的計(jì)算能力才能運(yùn)行

2023-08-17 16:11:29

489

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別隨著人工智能技術(shù)的不斷發(fā)展，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)已經(jīng)成為大家熟知的兩個(gè)術(shù)語(yǔ)。雖然它們都屬于人工智能技術(shù)的研究領(lǐng)域，但它們之間有很大的差異。本文將詳細(xì)介紹機(jī)器學(xué)習(xí)和深度學(xué)習(xí)

2023-08-17 16:11:40

2734

深度學(xué)習(xí)的由來(lái) 深度學(xué)習(xí)的經(jīng)典算法有哪些

深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支，其學(xué)習(xí)方法可以分為監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。兩種方法都具有其獨(dú)特的學(xué)習(xí)模型：多層感知機(jī) 、卷積神經(jīng)網(wǎng)絡(luò)等屬于監(jiān) 督學(xué)習(xí)；深度置信網(wǎng) 、自動(dòng)編碼器、去噪自動(dòng)編碼器、稀疏編碼等屬于無(wú)監(jiān)督學(xué)習(xí)。

2023-10-09 10:23:42

303

為什么深度學(xué)習(xí)的效果更好？

導(dǎo)讀深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集，已成為人工智能領(lǐng)域的一項(xiàng)變革性技術(shù)，在從計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理到自動(dòng)駕駛汽車等廣泛的應(yīng)用中取得了顯著的成功。深度學(xué)習(xí)的有效性并非偶然，而是植根于幾個(gè)基本原則和進(jìn)步

2024-03-09 08:26:27

已全部加載完成

搜索歷史

深度學(xué)習(xí)研究總結(jié)：頻率原則和參數(shù)凝聚

評(píng)論