0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)進(jìn)化說(shuō)的是什么?

倩倩 ? 來(lái)源:巡洋艦人工智能學(xué)堂 ? 2020-04-17 14:35 ? 次閱讀

Nature新子刊Machine intelligence中有一篇12頁(yè)的綜述,匯總介紹了神經(jīng)進(jìn)化這一前沿的研究方向在神經(jīng)網(wǎng)絡(luò)中的眾多應(yīng)用。本文用5分鐘概述該文的主要觀點(diǎn),對(duì)于不了解神經(jīng)進(jìn)化的讀者,本文將先帶你認(rèn)識(shí)神經(jīng)進(jìn)化說(shuō)的是什么?你不需要太多的背景知識(shí),也能讀懂本文。

人工的神經(jīng)網(wǎng)絡(luò)是依靠梯度的反向傳播來(lái)進(jìn)行優(yōu)化的,而在生物界中,神經(jīng)網(wǎng)絡(luò)中并沒(méi)有指出優(yōu)化方向的梯度,感知從下而上正向傳播,之后相近的刺激帶來(lái)共同激活的神經(jīng)元,再用這些連接來(lái)對(duì)新事物編碼及預(yù)測(cè),而一切都依賴(lài)于進(jìn)化機(jī)制。所謂神經(jīng)進(jìn)化,就是用遺傳算法來(lái)進(jìn)行神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)生成,參數(shù)更新及整體的效率優(yōu)化。其基本的循環(huán)是突變-》選擇-》繁衍-》再突變。

下圖來(lái)自莫煩Python視頻,其中對(duì)比了兩種神經(jīng)進(jìn)化的策略,一種是不固定網(wǎng)絡(luò)的結(jié)構(gòu),通過(guò)神經(jīng)網(wǎng)絡(luò)間的交叉配對(duì)形成下一代的網(wǎng)絡(luò),另一組是固定結(jié)構(gòu),每一代網(wǎng)絡(luò)中通過(guò)引入突變改變連接的強(qiáng)度,最終倆者都通過(guò)進(jìn)化的優(yōu)勝劣汰來(lái)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的最優(yōu)化。

不同于傳統(tǒng)的隨機(jī)梯度下降,是基于對(duì)現(xiàn)在錯(cuò)誤來(lái)源的外推決定下一步進(jìn)化的方向,即使引入了隨機(jī)性,也只是在原有方向上引入高斯誤差,是一種事后的彌補(bǔ),而神經(jīng)進(jìn)化是通過(guò)在下一代中引入在算法空間中性質(zhì)完全不同的點(diǎn),之后根據(jù)適應(yīng)度在這些點(diǎn)之間進(jìn)行內(nèi)推,雖然速度慢,但是可以更大規(guī)模的并行處理,且能夠更好的避免陷入局部最優(yōu)。

神經(jīng)進(jìn)化不止在監(jiān)督學(xué)習(xí)中應(yīng)用廣泛,在深度強(qiáng)化學(xué)習(xí)中也有廣泛的應(yīng)用。Uber開(kāi)發(fā)的開(kāi)源工具Visual Inspector for Neuroevolution(VINE),可以用于神經(jīng)演化的交互式數(shù)據(jù)可視化工具。而下文的作者之一也來(lái)自Uber的AI實(shí)驗(yàn)室。

在結(jié)束背景介紹之后,進(jìn)入這篇論文本身的介紹。作者首先指出了神經(jīng)進(jìn)化相比神經(jīng)網(wǎng)絡(luò)的幾個(gè)獨(dú)特的能力,包括通過(guò)學(xué)習(xí)找到合適的網(wǎng)絡(luò)組成部分(例如激活函數(shù)),以及網(wǎng)絡(luò)的超參數(shù)(有幾層,每層有多少神經(jīng)元)以及用于的學(xué)習(xí)策略本身。不同于AutoML的自動(dòng)化調(diào)參,神經(jīng)進(jìn)化始終在搜索答案中保持著一個(gè)多樣的解法“種群”,而且由于神經(jīng)進(jìn)化的研究和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)并沒(méi)有多少交集,因此倆者之間的匯總更容易擦出火花。

最初的神經(jīng)進(jìn)化關(guān)注小規(guī)模網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)的演化,最初的進(jìn)化算法僅僅是通過(guò)(神經(jīng)元)連接矩陣間的權(quán)重加上隨機(jī)突變來(lái)展開(kāi),之后受到基因間調(diào)控網(wǎng)絡(luò)的啟發(fā),對(duì)網(wǎng)絡(luò)結(jié)構(gòu)展開(kāi)了間接的編碼。隨著引入在倆個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中的雜交(crossover),神經(jīng)進(jìn)化可以探索更為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),但需要面對(duì)如何避免讓新生成的網(wǎng)絡(luò)結(jié)構(gòu)由于缺少足夠的時(shí)間進(jìn)行局部?jī)?yōu)化而無(wú)法發(fā)揮出其最優(yōu)的性能,該方向上最顯著的成果是NeuroEvolution of Augmenting Topologies (NEAT)算法,該算法的成果包括模擬機(jī)器人行走的控制程序,下圖分別是使用遺傳算法和進(jìn)化策略訓(xùn)練模擬機(jī)器人走路(來(lái)自UberAI實(shí)驗(yàn)室Mujoco 人)

在強(qiáng)化學(xué)習(xí)領(lǐng)域,natural evolutionary strategy可以在 Atari 游戲機(jī)上和Deep Q learning有相近的表現(xiàn),而且這些算法的并行潛力使得這些算法在有足夠計(jì)算資源時(shí),可以用更快的時(shí)間完成訓(xùn)練,盡管神經(jīng)進(jìn)化需要的總的計(jì)算資源要多一些。神經(jīng)進(jìn)化在強(qiáng)化學(xué)習(xí)中的成功說(shuō)明了神經(jīng)進(jìn)化方法可以用在現(xiàn)實(shí)中的復(fù)雜問(wèn)題上。

Lehman將神經(jīng)進(jìn)化和梯度結(jié)合了起來(lái)。該方法的靈感來(lái)自是通過(guò)梯度去選擇出那些不那么危險(xiǎn)的突變。由于強(qiáng)化學(xué)習(xí)中評(píng)估一個(gè)策略的適應(yīng)度需要花費(fèi)的比評(píng)估網(wǎng)絡(luò)本身要花費(fèi)更多的資源,前者需要運(yùn)行游戲或者模擬環(huán)境數(shù)回合,才能看到收益,而后者只需要去將網(wǎng)絡(luò)中的錯(cuò)誤項(xiàng)前向傳播幾步即可。神經(jīng)進(jìn)化中對(duì)策略(policy)加以隨機(jī)的突變,部分突變不會(huì)影響策略的性能,但少部分會(huì)讓該策略徹底失效。通過(guò)對(duì)狀態(tài)和行為歸檔記錄,可以通過(guò)梯度信息對(duì)變異的大小進(jìn)行縮放,從而避免突變后的策略對(duì)于當(dāng)前的狀態(tài)過(guò)于激進(jìn)或保守,從而使得在深度超過(guò)100層的網(wǎng)絡(luò)上可以使用神經(jīng)進(jìn)化的策略。

神經(jīng)進(jìn)化可以模擬真實(shí)進(jìn)化中對(duì)多樣性和新奇策略的偏好,在要優(yōu)化的目標(biāo)中對(duì)全新的策略給予獎(jiǎng)勵(lì),從而避免陷入局部最優(yōu),或者以策略種群的多樣性為優(yōu)化主要目標(biāo)。在強(qiáng)化學(xué)習(xí)中,一個(gè)策略要想和其他策略不同,需要具有不同的基礎(chǔ)能力,從而使策略種群多樣性為優(yōu)化目標(biāo)好于人為設(shè)定的損失函數(shù)。

總結(jié):神經(jīng)進(jìn)化在meta learning,多任務(wù)學(xué)習(xí)中都可以和現(xiàn)有方法結(jié)合。正如卷積操作就是一種編碼信息的方式,神經(jīng)進(jìn)化還可以找到更好的對(duì)信息進(jìn)行間接編碼(Indirect coding)的方法以及通過(guò)進(jìn)化策略重現(xiàn)出類(lèi)似LSTM的網(wǎng)絡(luò)結(jié)構(gòu)。強(qiáng)化學(xué)習(xí)中的自我對(duì)弈可以看成是神經(jīng)進(jìn)化的一種,而對(duì)策略多樣性的偏好也鼓勵(lì)了模型對(duì)新策略的探索。最后,在通向通用人工智能的路上,神經(jīng)進(jìn)化通過(guò)構(gòu)建開(kāi)放目地的(open-endedness)的系統(tǒng),讓策略不帶有先驗(yàn)?zāi)康氐奶剿鳎M自然界的進(jìn)化,最終得到一個(gè)足夠普適的智能系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識(shí)別、自然語(yǔ)言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩種常見(jiàn)的模型。 1. 結(jié)構(gòu)差異 1.1 傳統(tǒng)神經(jīng)
    的頭像 發(fā)表于 11-15 14:53 ?511次閱讀

    神經(jīng)元是什么?神經(jīng)元在神經(jīng)系統(tǒng)中的作用

    神經(jīng)元,又稱(chēng)神經(jīng)細(xì)胞,是神經(jīng)系統(tǒng)的基本結(jié)構(gòu)和功能單位。它們負(fù)責(zé)接收、整合、傳導(dǎo)和傳遞信息,從而參與和調(diào)控神經(jīng)系統(tǒng)的各種活動(dòng)。神經(jīng)元在形態(tài)上高
    的頭像 發(fā)表于 07-12 11:49 ?1336次閱讀
    <b class='flag-5'>神經(jīng)</b>元是什么?<b class='flag-5'>神經(jīng)</b>元在<b class='flag-5'>神經(jīng)</b>系統(tǒng)中的作用

    BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱(chēng)CNN)是兩種在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 07-10 15:24 ?1586次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)稱(chēng)ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個(gè)基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及未來(lái)發(fā)展等多個(gè)方面,詳細(xì)闡述BP
    的頭像 發(fā)表于 07-10 15:20 ?1123次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?587次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)嗎

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱(chēng)RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱(chēng)RNN)實(shí)際上是同一個(gè)概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?794次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)
    的頭像 發(fā)表于 07-04 14:24 ?1328次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指?jìng)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時(shí),我們需要從多個(gè)維度進(jìn)行深入分析。這些維度包括網(wǎng)絡(luò)結(jié)
    的頭像 發(fā)表于 07-04 13:20 ?917次閱讀

    神經(jīng)元的分類(lèi)包括哪些

    神經(jīng)元是神經(jīng)系統(tǒng)的基本功能單位,它們通過(guò)電信號(hào)和化學(xué)信號(hào)進(jìn)行信息傳遞和處理。神經(jīng)元的分類(lèi)非常復(fù)雜,可以根據(jù)不同的標(biāo)準(zhǔn)進(jìn)行分類(lèi)。 一、神經(jīng)元的基本概念 1.1
    的頭像 發(fā)表于 07-03 11:36 ?1322次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡(jiǎn)稱(chēng)BP神經(jīng)網(wǎng)絡(luò))是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過(guò)反向傳播算法來(lái)調(diào)整網(wǎng)絡(luò)中的權(quán)重和偏置,以達(dá)到最小化誤差的目的。BP
    的頭像 發(fā)表于 07-03 11:00 ?819次閱讀

    bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)是一種常見(jiàn)的前饋神經(jīng)網(wǎng)絡(luò),它使用反向傳播算法來(lái)訓(xùn)練網(wǎng)絡(luò)。雖然BP神經(jīng)網(wǎng)絡(luò)在某些方面與深度神經(jīng)網(wǎng)絡(luò)(Deep
    的頭像 發(fā)表于 07-03 10:14 ?864次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱(chēng)CNN)是兩種不同類(lèi)型的人工神經(jīng)網(wǎng)絡(luò),它們?cè)?/div>
    的頭像 發(fā)表于 07-03 10:12 ?1216次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱(chēng)CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括其
    的頭像 發(fā)表于 07-02 14:44 ?671次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱(chēng)CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡(jiǎn)稱(chēng)BPNN)是兩種
    的頭像 發(fā)表于 07-02 14:24 ?4215次閱讀

    神經(jīng)元與神經(jīng)網(wǎng)絡(luò)的區(qū)別與聯(lián)系

    在人工智能和機(jī)器學(xué)習(xí)的領(lǐng)域中,神經(jīng)元和神經(jīng)網(wǎng)絡(luò)是兩個(gè)至關(guān)重要的概念。雖然它們都與人腦中的神經(jīng)系統(tǒng)有著密切的聯(lián)系,但在實(shí)際應(yīng)用和理論研究中,它們各自扮演著不同的角色。本文旨在深入探討神經(jīng)
    的頭像 發(fā)表于 07-01 11:50 ?999次閱讀