0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練

IEEE電氣電子工程師 ? 來(lái)源:IEEE電氣電子工程師 ? 作者:IEEE電氣電子工程師 ? 2022-10-11 11:57 ? 次閱讀

我們身邊的小工具不斷地在充實(shí)著我們的生活 —— 智能手表可以檢測(cè)我們的生命體征,跟蹤我們的健康狀況;家用揚(yáng)聲器通過(guò)聽我們的對(duì)話來(lái)識(shí)別我們的聲音;智能手機(jī)還能夠扮演語(yǔ)法學(xué)家的角色,觀察我們寫了什么來(lái)自動(dòng)修復(fù)我們的特殊打字錯(cuò)誤。我們很感激這些便利,但我們與電子設(shè)備共享的信息并不總是在我們的所控范圍內(nèi)。

機(jī)器學(xué)習(xí)可能需要很重的硬件,所以像手機(jī)這樣的“邊緣”設(shè)備通常會(huì)向中央服務(wù)器發(fā)送原始數(shù)據(jù),然后返回經(jīng)過(guò)訓(xùn)練的算法。然而,有些人希望訓(xùn)練能夠在本地進(jìn)行。一種新的人工智能訓(xùn)練方法擴(kuò)展了小型設(shè)備的訓(xùn)練能力,可能有助于保護(hù)隱私。

最強(qiáng)大的機(jī)器學(xué)習(xí)系統(tǒng)使用神經(jīng)網(wǎng)絡(luò),復(fù)雜的函數(shù)充滿可調(diào)參數(shù)。在訓(xùn)練期間,網(wǎng)絡(luò)接收輸入(如一組像素),生成輸出(如標(biāo)簽“cat”),將其輸出與正確答案進(jìn)行比較,并調(diào)整其參數(shù),以便下次做得更好。為了知道如何調(diào)整每個(gè)內(nèi)部旋鈕,網(wǎng)絡(luò)需要記住每個(gè)旋鈕的效果,但它們的數(shù)量通常為數(shù)百萬(wàn)甚至數(shù)十億。這需要大量?jī)?nèi)存。訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)可能需要數(shù)百倍的記憶,而僅僅使用一個(gè)(也稱為“推理”)。在后一種情況下,一旦將信息傳遞到下一層,內(nèi)存就可以忘記網(wǎng)絡(luò)的每一層做了什么。

為了減少訓(xùn)練階段的記憶需求,研究人員采用了一些技巧。其中一種稱為分頁(yè)或卸載,機(jī)器將這些激活信息從短期內(nèi)存移動(dòng)到較慢但更豐富的內(nèi)存類型,如閃存或SD卡,然后在需要時(shí)將其恢復(fù)。在另一種稱為重物質(zhì)化的方法中,機(jī)器刪除激活,然后稍后再次計(jì)算。加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)家、描述了該創(chuàng)新的論文的主要作者Shishir Patil說(shuō),它們結(jié)合使用了“次優(yōu)”的“啟發(fā)式”,通常需要大量能量。Patil及其合作者報(bào)告的創(chuàng)新將分頁(yè)和重新實(shí)體化方法結(jié)合了起來(lái)。

“將這兩種技術(shù)很好地結(jié)合到這個(gè)優(yōu)化問(wèn)題中,然后解決它,這真的很好,”加州大學(xué)河濱分校的計(jì)算機(jī)科學(xué)家Jiasi Chen說(shuō),他從事邊緣計(jì)算研究,但沒(méi)有參與這項(xiàng)工作。

7月,Patil在巴爾的摩舉行的機(jī)器學(xué)習(xí)國(guó)際會(huì)議上介紹了他的系統(tǒng),稱為POET(private optimal energy training)。他首先給出了POET設(shè)備的技術(shù)細(xì)節(jié),以及他所希望訓(xùn)練的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的信息。他指定了內(nèi)存預(yù)算和時(shí)間預(yù)算。然后,他要求設(shè)備創(chuàng)建一個(gè)培訓(xùn)流程,將能源消耗降至最低。該進(jìn)程可能決定對(duì)某些重新計(jì)算效率低下的激活進(jìn)行分頁(yè),但對(duì)其他易于重做但需要大量?jī)?nèi)存存儲(chǔ)的激活進(jìn)行重新實(shí)體化。

突破性創(chuàng)新的關(guān)鍵之一在于將問(wèn)題定義為混合整數(shù)線性規(guī)劃(MILP)難題,即一組約束和變量之間的關(guān)系。對(duì)于每個(gè)設(shè)備和網(wǎng)絡(luò)架構(gòu),POET將其變量插入Patil手工編制的MILP程序,然后找到最佳解決方案。Chen說(shuō):“一個(gè)主要的挑戰(zhàn)實(shí)際上是以一種好的方式來(lái)闡述這個(gè)問(wèn)題,這樣你就可以把它輸入到一個(gè)解決方案中。因此,您可以捕獲所有真實(shí)的系統(tǒng)動(dòng)態(tài),如能量、延遲和內(nèi)存?!?/p>

該團(tuán)隊(duì)在四個(gè)不同的處理器上測(cè)試了POET,其RAM范圍從32KB到8GB。研究人員分別訓(xùn)練了三種不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):兩種在圖像識(shí)別中流行的類型(VGG16和ResNet-18),以及一種流行的語(yǔ)言處理網(wǎng)絡(luò)(BERT)。在許多測(cè)試中,該系統(tǒng)可以減少大約80%的內(nèi)存使用量,而不會(huì)大幅增加能耗??杀容^的方法不能同時(shí)做到這兩個(gè)。據(jù)Patil稱,研究表明,BERT現(xiàn)在可以在最小的設(shè)備上進(jìn)行訓(xùn)練,這在以前是不可能的。

Patil說(shuō):“當(dāng)我們開始的時(shí)候,POET基本上是一個(gè)很好的主意。”現(xiàn)在,幾家公司已經(jīng)開始使用它,并且有一家大公司已經(jīng)在其智能揚(yáng)聲器中試用了它。Patil說(shuō),非常棒的一點(diǎn)是,POET不會(huì)通過(guò)“量化”或縮寫激活來(lái)降低網(wǎng)絡(luò)精度,從而節(jié)省內(nèi)存。因此,設(shè)計(jì)網(wǎng)絡(luò)的團(tuán)隊(duì)不必與實(shí)現(xiàn)網(wǎng)絡(luò)的團(tuán)隊(duì)協(xié)調(diào),就精度和內(nèi)存之間的權(quán)衡進(jìn)行談判。

Patil指出,除了隱私問(wèn)題外,使用POET還有其他原因。一些設(shè)備需要在本地訓(xùn)練網(wǎng)絡(luò),以解決互聯(lián)網(wǎng)連接很差或沒(méi)有連接的問(wèn)題 —— 這些設(shè)備包括在農(nóng)場(chǎng)、潛艇或太空中使用的設(shè)備。由于數(shù)據(jù)傳輸需要太多能量,其他設(shè)置可以從創(chuàng)新中受益。POET還可以使大型設(shè)備互聯(lián)網(wǎng)服務(wù)器更節(jié)省內(nèi)存和能源。但對(duì)于數(shù)據(jù)保密,Patil說(shuō),“我想這是非常及時(shí)的,對(duì)吧?”當(dāng)大型設(shè)備——互聯(lián)網(wǎng)服務(wù)器——訓(xùn)練大型網(wǎng)絡(luò)時(shí),也可能從POET中受益。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:研究人員開發(fā)在小型設(shè)備上訓(xùn)練大型神經(jīng)網(wǎng)絡(luò) 保護(hù)隱私

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的作用是什么

    結(jié)構(gòu)是最基本的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、隱藏層和輸出層。下面介紹神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的作用。
    的頭像 發(fā)表于 07-11 11:03 ?932次閱讀

    怎么對(duì)神經(jīng)網(wǎng)絡(luò)重新訓(xùn)練

    重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)是一個(gè)復(fù)雜的過(guò)程,涉及到多個(gè)步驟和考慮因素。 引言 神經(jīng)網(wǎng)絡(luò)是一強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等領(lǐng)域。然而,隨著時(shí)間的推移,數(shù)據(jù)分布可
    的頭像 發(fā)表于 07-11 10:25 ?473次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)訓(xùn)練過(guò)程

    網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)誤差反向傳播算法(Error Backpropagation Algorithm)來(lái)訓(xùn)練網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)復(fù)雜問(wèn)題的學(xué)習(xí)和解決。以下將詳細(xì)闡述BP神經(jīng)網(wǎng)絡(luò)的工作方式,涵蓋其基本
    的頭像 發(fā)表于 07-10 15:07 ?4686次閱讀
    BP<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的基本<b class='flag-5'>結(jié)構(gòu)</b>和<b class='flag-5'>訓(xùn)練</b>過(guò)程

    遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式主要分為

    結(jié)構(gòu)形式。 Elman網(wǎng)絡(luò) Elman網(wǎng)絡(luò)是一基本的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由Elman于1990年提出。其
    的頭像 發(fā)表于 07-05 09:32 ?563次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?1344次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指?jìng)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時(shí),我們需要從多個(gè)維度進(jìn)行深入分析。這些維度包括
    的頭像 發(fā)表于 07-04 13:20 ?921次閱讀

    bp神經(jīng)網(wǎng)絡(luò)算法過(guò)程包括

    的算法過(guò)程,包括網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)、訓(xùn)練過(guò)程、反向傳播算法、權(quán)重更新策略等。 網(wǎng)絡(luò)結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成,每層包含若干神經(jīng)
    的頭像 發(fā)表于 07-04 09:45 ?487次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    網(wǎng)絡(luò)結(jié)構(gòu),分別適用于不同的應(yīng)用場(chǎng)景。本文將從基本概念、結(jié)構(gòu)組成、工作原理及應(yīng)用領(lǐng)域等方面對(duì)這兩神經(jīng)網(wǎng)絡(luò)進(jìn)行深入解讀。
    的頭像 發(fā)表于 07-03 16:12 ?3419次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    結(jié)構(gòu)、原理、應(yīng)用場(chǎng)景等方面都存在一定的差異。以下是對(duì)這兩神經(jīng)網(wǎng)絡(luò)的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)是一
    的頭像 發(fā)表于 07-03 10:12 ?1227次閱讀

    BP神經(jīng)網(wǎng)絡(luò)算法的基本流程包括

    、自然語(yǔ)言處理等。本文將詳細(xì)介紹BP神經(jīng)網(wǎng)絡(luò)算法的基本流程,包括網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)、前向傳播、反向傳播、權(quán)重更新和訓(xùn)練過(guò)程等。 網(wǎng)絡(luò)結(jié)構(gòu) BP神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-03 09:52 ?523次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    、訓(xùn)練過(guò)程以及應(yīng)用場(chǎng)景。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一前饋深度學(xué)習(xí)模型,其核心思想是利用卷積
    的頭像 發(fā)表于 07-03 09:15 ?429次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)訓(xùn)練過(guò)程

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一在圖像識(shí)別、視頻處理、自然語(yǔ)言處理等多個(gè)領(lǐng)域廣泛應(yīng)用的深度學(xué)習(xí)算法。其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)和算法設(shè)計(jì),使得CNN在
    的頭像 發(fā)表于 07-02 18:27 ?915次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理、結(jié)構(gòu)訓(xùn)練過(guò)程

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一深度學(xué)習(xí)算法,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的基本原理、
    的頭像 發(fā)表于 07-02 14:21 ?2667次閱讀

    神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類型和應(yīng)用實(shí)例

    神經(jīng)網(wǎng)絡(luò)模型,作為深度學(xué)習(xí)領(lǐng)域的核心組成部分,近年來(lái)在圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域取得了顯著進(jìn)展。本文旨在深入解讀神經(jīng)網(wǎng)絡(luò)的基本原理、結(jié)構(gòu)類型、訓(xùn)練過(guò)程以及應(yīng)用實(shí)例,為初
    的頭像 發(fā)表于 07-02 11:33 ?451次閱讀

    如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)

    神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的重要分支,廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域。然而,要使神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中取得良好效果,必須進(jìn)行有效的訓(xùn)練和優(yōu)化。本文將從神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-01 14:14 ?483次閱讀