中文字幕熟人丝袜人妻痴汉,国产尤物网站尤物在线看,亚洲精品国产精品国自产小说

最近神經(jīng)網(wǎng)絡(luò)的成功不斷擴(kuò)展著模型的架構(gòu)，并促成了架構(gòu)搜索的出現(xiàn)，即神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)架構(gòu)。架構(gòu)搜索的傳統(tǒng)方法是神經(jīng)演化，如今，硬件的發(fā)展能實現(xiàn)大規(guī)模的演變，生成可以與手工設(shè)計相媲美的圖像分類模型。但是，新的技術(shù)雖然可行，卻無法讓開發(fā)者決定在具體的環(huán)境下（即搜索空間和數(shù)據(jù)集）使用哪種方法。

在本篇論文中，研究人員使用流行的異步進(jìn)化算法（asynchronous evolutionary algorithm）的正則化版本，并將其與非正則化的形式以及強(qiáng)化學(xué)習(xí)方法進(jìn)行比較。硬件條件、計算能力和神經(jīng)網(wǎng)絡(luò)訓(xùn)練代碼都相同，在這之中研究人員探索在不同的數(shù)據(jù)集、搜索空間和規(guī)模下模型的表現(xiàn)情況。以下是論智對論文的編譯總結(jié)。

實驗方法

我們使用不同的算法搜索神經(jīng)網(wǎng)絡(luò)分類器的空間，進(jìn)行基線研究后，所得到的最好的模型將被擴(kuò)大尺寸，以生產(chǎn)更高質(zhì)量的圖像分類器。我們在不同的計算規(guī)模上執(zhí)行搜索過程。另外，我們還研究了非神經(jīng)網(wǎng)絡(luò)模擬中的進(jìn)化算法。

1.搜索空間

所有神經(jīng)進(jìn)化和強(qiáng)化學(xué)習(xí)實驗都使用基線研究的搜索空間設(shè)計，它需要尋找兩個類似于Inception的模塊體系結(jié)構(gòu)，這兩個結(jié)構(gòu)在前饋模式中堆疊以形成圖像分類器。

2.架構(gòu)搜索算法

對于進(jìn)化算法，我們使用聯(lián)賽選擇算法（tournament selection）或正則化的變體。標(biāo)準(zhǔn)的聯(lián)賽選擇算法是對訓(xùn)練模型P的數(shù)量進(jìn)行周期化的改進(jìn)。在每個循環(huán)中，隨機(jī)選擇一個S模型的樣本。樣本的最佳模型將生成具有變化架構(gòu)的另一模型，它將被訓(xùn)練然后添加到模型樣本中。最差的模型將被刪除。我們將這種方法稱為非正則進(jìn)化（NRE）。它的變體，正則化進(jìn)化（RE）則是一種自然的修正：無需刪除樣本中最差的模型，而是刪除樣本中最老的模型（即第一個被訓(xùn)練的模型）。在NRE和RE中，樣本初始化的架構(gòu)都是隨機(jī)的。

3.實驗設(shè)置

為了對比進(jìn)化算法和強(qiáng)化學(xué)習(xí)算法，我們將在不同的計算規(guī)模上進(jìn)行實驗。

小規(guī)模試驗

首先進(jìn)行的實驗可以在CPU上進(jìn)行，我們部署了SP-I、SP-II和SP-III三種搜索空間，利用G-CIFAR、MNIST或者G-ImageNet數(shù)據(jù)集進(jìn)行實驗。

大規(guī)模實驗

然后再部署基線研究的設(shè)置。這里僅用SP-I搜索空間和CIFAR-10數(shù)據(jù)集，兩種模型各在450個GPU上訓(xùn)練將近7天。

4.模型擴(kuò)展

我們要將進(jìn)化算法或強(qiáng)化學(xué)習(xí)發(fā)現(xiàn)的架構(gòu)轉(zhuǎn)化為全尺寸、精確的模型。擴(kuò)展后的模型將在CIFAR-10或ImageNet上進(jìn)行訓(xùn)練，程序與基線研究的相同。

實驗結(jié)果