0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google AI的研究人員的最新研究提出一個全新概念:剛度(Stiffness)

DPVg_AI_era ? 來源:lp ? 2019-03-21 09:14 ? 次閱讀

Google AI的研究人員的最新研究提出一個全新概念:剛度(Stiffness),為探索神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問題提供了一個新視角。

Google AI的研究人員最近在arxiv發(fā)表的一篇新論文,探索了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問題的一個新視角。

論文題為“Stiffness: A New Perspective on Generalization in Neural Networks”,作者是谷歌 AI 蘇黎世研究中心的Stanislav Fort等人。

論文提出“剛度”(stiffness)這個概念,透過這個概念研究了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問題。

研究人員通過分析一個示例中的小梯度步驟如何影響另一個示例的損失來測量網(wǎng)絡(luò)的“剛度”。

具體來說,他們在4個分類數(shù)據(jù)集(MNIST、FASHION MNIST、CIFAR-10、CIFAR-100)上分析了全連接卷積神經(jīng)網(wǎng)絡(luò)的剛度。他們關(guān)注的是剛度如何隨著1) 類隸屬度(class membership),2)數(shù)據(jù)點(diǎn)之間的距離,3)訓(xùn)練迭代,和4)學(xué)習(xí)率而變化。

研究表明,當(dāng)在固定的驗(yàn)證集上計算時,剛度與泛化(generalization)直接相關(guān)。剛度函數(shù)的靈活性較差,因此不太容易對數(shù)據(jù)集的特定細(xì)節(jié)進(jìn)行過擬合。

結(jié)果表明,“剛度”的概念有助于診斷和表征泛化。

學(xué)習(xí)率的選擇對學(xué)習(xí)函數(shù)的剛度特性有顯著影響。高學(xué)習(xí)率會導(dǎo)致函數(shù)逼近在更大的距離上“更剛”(stiffer),并且學(xué)習(xí)到的特征可以更好地泛化到來自不同類的輸入。另一方面,較低的學(xué)習(xí)率似乎能學(xué)到更詳細(xì)、更具體的特征,即使在訓(xùn)練集上導(dǎo)致同樣的損失,也不能泛化到其他類。

這表明,高學(xué)習(xí)率的優(yōu)勢不僅在于收斂所需的步驟更少,還在于它們傾向于學(xué)習(xí)的特性具有更高的泛化性,即高學(xué)習(xí)率充當(dāng)了有效的正則化器。

剛度(Stiffness)的定義

剛度的定義如下:

如果點(diǎn)處的損失相對于網(wǎng)絡(luò)權(quán)重的梯度是,并且點(diǎn)處的梯度是?,則我們定義“剛度”為。

圖1:“剛度”概念的圖示

如圖1所示,“剛度”可以看做是通過應(yīng)用基于另一個輸入的梯度更新引起的輸入損失的變化,相當(dāng)于兩個輸入的梯度之間的梯度對齊(gradient alignment)。

實(shí)驗(yàn)和結(jié)果

基于類隸屬度關(guān)系的剛度特性

我們基于驗(yàn)證集數(shù)據(jù)點(diǎn)的類隸屬度(class membership )作為訓(xùn)練迭代函數(shù),研究了驗(yàn)證集數(shù)據(jù)點(diǎn)的剛度特性。

對于帶有真實(shí)標(biāo)簽的MNIST、FASHION MNIST和CIFAR-10數(shù)據(jù)集,結(jié)果分別顯示為圖3、圖5、圖6,對于帶有隨機(jī)排列訓(xùn)練集標(biāo)簽的MNIST數(shù)據(jù)集,結(jié)果為圖4.

圖3:MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence

圖4:MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence,訓(xùn)練時使用隨機(jī)排列的標(biāo)簽。

圖5:FASHION MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence

圖6:CIFAR-10上卷積神經(jīng)網(wǎng)絡(luò)剛度的Class-membership dependence

圖3、圖5和圖6都顯示了4個訓(xùn)練階段的剛度矩陣:初始化階段(任何梯度步驟之前)、優(yōu)化早期階段和兩個后期階段。

學(xué)習(xí)率對剛度的影響

圖8:在MNIST 和 FASHION MNIST上以不同學(xué)習(xí)率訓(xùn)練,不同類別的剛度。

如圖8所示,這兩幅圖給出了三種不同訓(xùn)練損失的 class dependent剛度矩陣。較高的學(xué)習(xí)率導(dǎo)致來自不同類的輸入之間的剛度更高,表明它們學(xué)習(xí)的特性在不同類之間更加可泛化(generalizable)。

結(jié)論

我們探討了神經(jīng)網(wǎng)絡(luò)剛度的概念,并用它來診斷和表征泛化。我們研究了在真實(shí)數(shù)據(jù)集上訓(xùn)練的模型的剛度,并測量了其隨訓(xùn)練迭代、類隸屬度、數(shù)據(jù)點(diǎn)之間的距離和學(xué)習(xí)率的選擇而變化的情況。為了探討泛化和過擬合,我們重點(diǎn)研究了驗(yàn)證集中數(shù)據(jù)點(diǎn)的剛度。

總結(jié)而言,本文定義了剛度的概念,證明了它的實(shí)用性,為更好地理解神經(jīng)網(wǎng)絡(luò)中的泛化特性提供了一個新的視角,并觀察了其隨學(xué)習(xí)率的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1768

    瀏覽量

    57654
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4776

    瀏覽量

    100948
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24749

原文標(biāo)題:你的模型剛不剛?谷歌提出“剛度”概念,探索神經(jīng)網(wǎng)絡(luò)泛化新視角

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    東京大學(xué)的研究人員:新開發(fā)的電子皮膚有LED顯示屏

    過去的幾年出現(xiàn)了很多柔性電子皮膚貼片概念,可以管理藥物或監(jiān)測健康狀況,但是東京大學(xué)的研究人員最新開發(fā)的版本增加了LED顯示屏。
    發(fā)表于 05-15 08:46 ?1473次閱讀

    Google研究人員開發(fā)增強(qiáng)現(xiàn)實(shí)顯微鏡檢測癌細(xì)胞

    Google研究人員開發(fā)了種增強(qiáng)現(xiàn)實(shí)顯微鏡(ARM),該顯微鏡可以從經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中獲取實(shí)時數(shù)據(jù),以檢測癌細(xì)胞,并將其顯示在查看
    發(fā)表于 04-23 12:09 ?2256次閱讀

    帶你了解AI研究人員年薪百萬背后的真相

    近期,紐約時報記者卡德梅茨爆料了條令人「震驚」的消息——AI 研究人員年薪百萬(哪怕是在 OpenAI 這樣的非營利機(jī)構(gòu)里),個個都是人生贏家。
    的頭像 發(fā)表于 05-28 17:46 ?5701次閱讀

    深度學(xué)習(xí)全新打開方式Google Brain提出概念激活向量新方法

    最近,Google Brain團(tuán)隊(duì)的研究人員發(fā)表了篇論文,提出種名為概念激活向量(Conc
    的頭像 發(fā)表于 07-31 14:11 ?3036次閱讀

    研究人員提出系列新的點(diǎn)云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員提出系列新的點(diǎn)云處理模塊,從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行了研究,得到了更寬、更深、更快效率更高的點(diǎn)云處理網(wǎng)絡(luò),讓更
    的頭像 發(fā)表于 08-02 14:44 ?3080次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出</b>了<b class='flag-5'>一</b>系列新的點(diǎn)云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標(biāo)是通過單張圖像輸入,對圖像中的物體進(jìn)行檢測、獲取不同物體的類別、掩膜和對應(yīng)的三維網(wǎng)格,并對真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進(jìn)并提出了新
    的頭像 發(fā)表于 08-02 15:51 ?3910次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出</b>了Mesh R-CNN模型

    Google AI發(fā)布項(xiàng)新研究 可以“近乎即時”地預(yù)報天氣

    近日,據(jù)外媒報道,Google AI發(fā)布項(xiàng)新研究,稱可以“近乎即時”地預(yù)報天氣。谷歌的研究人員描述了如何能夠以僅數(shù)分鐘的計算,以1公里的分
    發(fā)表于 01-17 11:47 ?613次閱讀

    研究人員已經(jīng)使用機(jī)器學(xué)習(xí)來開發(fā)血液測試

    這個由來自哈佛醫(yī)學(xué)院,克利夫蘭診所,梅奧診所等眾多研究人員研究人員組成的多機(jī)構(gòu)團(tuán)隊(duì)對來自3,052名參與者的數(shù)據(jù)進(jìn)行了AI訓(xùn)練。其中,1,531例患有癌癥,1,521例沒有。
    的頭像 發(fā)表于 05-21 10:17 ?1967次閱讀

    AI研究人員如何應(yīng)對透明AI

    許多現(xiàn)代的AI系統(tǒng)都在神經(jīng)網(wǎng)絡(luò)上運(yùn)行,而我們僅了解其基礎(chǔ)知識,因?yàn)樗惴ū旧砗苌偬峁┙忉尫绞?。缺乏解釋性通常被稱為AI系統(tǒng)的“黑匣子”。研究人員將注意力集中在神經(jīng)網(wǎng)絡(luò)如何工作的細(xì)節(jié)上
    的頭像 發(fā)表于 07-14 16:31 ?1905次閱讀

    研究人員發(fā)現(xiàn)可竊取AWS憑證的加密貨幣蠕蟲

    研究人員近期發(fā)現(xiàn)可以竊取AWS憑證的加密貨幣蠕蟲。這是首個含有AWS特定功能的蠕蟲,該蠕蟲可以竊取本地憑證、掃描錯誤配置的Docker平臺的網(wǎng)絡(luò)。研究人員發(fā)現(xiàn)黑客組織TeamTNT
    的頭像 發(fā)表于 08-26 14:04 ?1620次閱讀
    <b class='flag-5'>研究人員</b>發(fā)現(xiàn)<b class='flag-5'>一</b><b class='flag-5'>個</b>可竊取AWS憑證的加密貨幣蠕蟲

    研究人員宣布了種新的AI機(jī)器學(xué)習(xí)工具

    南加州大學(xué)(USC)的Victor Martinez是AI研究的首席研究員該軟件將于本月在2020年自然語言處理經(jīng)驗(yàn)方法會議論文集上首次亮相。其他研究人員USC克里希納包括和Soman
    的頭像 發(fā)表于 11-23 15:10 ?1900次閱讀

    研究人員發(fā)明全新AI感應(yīng)設(shè)備

    12月23日消息,據(jù)國外媒體報道,加州大學(xué)伯克利分校的研究人員發(fā)明了種裝置,利用可穿戴傳感器和人工智能軟件來確定一個人想要做出的手勢。
    的頭像 發(fā)表于 12-23 16:51 ?2739次閱讀

    研究人員為鋰硫電池提出種新陰極設(shè)計概念

    研究團(tuán)隊(duì),為鋰硫電池(Li–S)提出種新穎的陰極設(shè)計概念,將可大幅提升此類具有發(fā)展前景的下代電池的性能。
    發(fā)表于 12-29 10:48 ?547次閱讀

    研究人員制造出種復(fù)制人類的行為下棋的AI

    我們這些凡人在國際象棋上已經(jīng)很久沒有真正與人工智能競爭了。距人類在國際象棋比賽中征服計算機(jī)已有15年了。但是,近日,研究人員開發(fā)了AI國際象棋engine,它的出現(xiàn)并不是打算碾
    的頭像 發(fā)表于 02-23 09:38 ?1571次閱讀

    小到分子!研究人員開發(fā)種微小的壓電電阻器

    使用壓阻的電子傳感器在許多設(shè)備中都很常見,包括汽車、醫(yī)療可穿戴設(shè)備和智能手機(jī)?,F(xiàn)在,澳大利亞的研究人員開發(fā)了種微小的壓電電阻器,小到分子,可以實(shí)現(xiàn)
    的頭像 發(fā)表于 10-31 16:52 ?937次閱讀