近期,麻省理工學(xué)院的研究人員開發(fā)了一種專用芯片,將神經(jīng)網(wǎng)絡(luò)計算的速度提高了 3 倍至 7 倍,同時將功耗降低了 95%。這將會使在智能手機上運行神經(jīng)網(wǎng)絡(luò)變得切實可行。
不管是語音識別還是面部識別,目前大多數(shù)人工智能系統(tǒng)的進步背后都來自于神經(jīng)網(wǎng)絡(luò)的功勞。人工神經(jīng)網(wǎng)絡(luò),也就是通過大量簡易“神經(jīng)元”(信息處理器)連接而成的系統(tǒng),能夠通過分析大量訓(xùn)練數(shù)據(jù)學(xué)習(xí)如何完成不同的任務(wù)。
正是因為這樣的結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)占用空間大,其計算過程中的耗能也相應(yīng)非常大。因此,目前的神經(jīng)網(wǎng)絡(luò)很少能夠被便攜設(shè)備使用。目前所有使用神經(jīng)網(wǎng)絡(luò)的智能手機軟件只能向網(wǎng)絡(luò)服務(wù)器發(fā)送數(shù)據(jù),通過接收服務(wù)器返回的數(shù)據(jù)完成計算。
不過,麻省理工學(xué)院(MIT)的研究人員開發(fā)了一種能夠?qū)⑸窠?jīng)網(wǎng)絡(luò)計算速度提升 3-7 倍的專用芯片。除了提升計算性能,這類芯片還能夠減少計算時 94-95% 的能耗。這種芯片使智能手機運用神經(jīng)網(wǎng)絡(luò)進行計算成為了可能,甚至能夠擴展到在各式智能家居中的應(yīng)用。
負責(zé)芯片開發(fā)的 Avishek Biswas 是這樣解釋的:“目前大部分的處理器芯片都有這樣的模型:芯片的一部分是內(nèi)存,另一部分是處理器。在計算的同時,數(shù)據(jù)相當(dāng)于是在這兩部分之間來回移位?!盉iswas 是 MIT 電氣工程和計算機學(xué)的一名研究生。
“由于這類機器學(xué)習(xí)算法需要非常多的計算量,數(shù)據(jù)的移位消耗了總能量中的絕大部分;但是算法中的計算本身其實能夠被簡化為‘點乘’這一種運算。我們因此產(chǎn)生了這種想法:能不能將這種‘點乘’運算直接在內(nèi)存中執(zhí)行,從而不需要將數(shù)據(jù)來回移動呢?”
Biswas 和他的指導(dǎo)教授,MIT 工程學(xué)院院長、Vannevar Bush 榮譽教授 Anantha Chandrakasan 在他們最新發(fā)表的論文中詳細地描述了這種新型芯片。Biswas 在上周的國際固態(tài)電路會議(International Solid State Circuits Conference)中介紹了這篇論文。
重回抽象
人工神經(jīng)網(wǎng)絡(luò)一般被分成很多層,某一層中的一個處理器節(jié)點會從數(shù)個下層節(jié)點中獲得數(shù)據(jù),在計算后又將結(jié)果傳送給上層中的數(shù)個節(jié)點。任意兩個節(jié)點的連接都擁有不同的權(quán)重(weight),標志著下層節(jié)點傳送的數(shù)據(jù)對于上層節(jié)點的計算有多大的影響。“訓(xùn)練”神經(jīng)網(wǎng)絡(luò)的過程其實就是調(diào)試并改進這些權(quán)重數(shù)據(jù)。
當(dāng)某個節(jié)點獲得下層節(jié)點傳送的數(shù)據(jù)后,它會將每個數(shù)據(jù)乘以它的權(quán)重,然后將這些結(jié)果相加。這一運算過程——將相乘后的所有結(jié)果相加——就叫作“點乘”。如果點乘的結(jié)果超過了某個定值,這一結(jié)果將被傳送給更上層的節(jié)點。上層節(jié)點也將會這一結(jié)果乘以連接權(quán)重,然后再和別的數(shù)據(jù)相加。
“神經(jīng)網(wǎng)絡(luò)”本身其實是對這一算法的一種“抽象化”:在計算機中,“節(jié)點”其實只是內(nèi)存中的一系列權(quán)重數(shù)據(jù)。計算點乘的過程一般是從內(nèi)存中讀取一個權(quán)重和相關(guān)的計算數(shù)據(jù),將這兩個數(shù)據(jù)相乘并將結(jié)果存在內(nèi)存的某個位置,然后重復(fù)這一過程,直到這一個節(jié)點的所有數(shù)據(jù)都被計算完畢。由于一個神經(jīng)網(wǎng)絡(luò)可能有上萬(甚至上百萬)的節(jié)點,在計算過程中其實要進行非常多的數(shù)據(jù)移動。
人工神經(jīng)網(wǎng)絡(luò)的計算過程其實是對大腦活動的一種電子化詮釋。在大腦中,信號沿著多個神經(jīng)元行進,在“突觸”或者一束神經(jīng)元之間的間隙中相遇。神經(jīng)元的放電速率和穿過突觸的電化學(xué)信號對應(yīng)著人工神經(jīng)網(wǎng)絡(luò)中的數(shù)據(jù)值和權(quán)重。這樣說來,MIT 研究人員此次研發(fā)的新型芯片通過對大腦活動的進一步復(fù)制、模仿,從而提升了人工神經(jīng)網(wǎng)絡(luò)的效率。
在這種新型芯片中,一個節(jié)點的輸入數(shù)據(jù)被轉(zhuǎn)化為不同的電壓,并且這些電壓將乘以權(quán)重大小進行放大或縮小。將相乘后的結(jié)果相加的過程能夠通過組合這些電壓得到實現(xiàn)。只有組合后的電壓會被重新轉(zhuǎn)換成數(shù)據(jù),并在內(nèi)存中進行存儲,以進行下一步計算。
因此,這種芯片原型不需要將數(shù)據(jù)在處理器和內(nèi)存中移動——它能同時計算 16 個節(jié)點的點乘結(jié)果。
不是“開”就是“關(guān)”
這個系統(tǒng)的一大特點是權(quán)重數(shù)值不是 1 就是-1。這就意味著它們能被實現(xiàn)為內(nèi)存中的“電路開關(guān)”,也就是“關(guān)閉電路”與“打開電路”的區(qū)別。最新的理論研究表明,僅有兩個權(quán)重值的人工神經(jīng)網(wǎng)絡(luò)與其它神經(jīng)網(wǎng)絡(luò)相比,其準確性僅會下降 1%-2%。
Biswas 與 Chandrakasan 教授的研究與這一理論結(jié)果相差不遠。在實驗中,他們在傳統(tǒng)計算機中運行了一個全面的神經(jīng)網(wǎng)絡(luò),同時在他們研發(fā)的芯片上運行了二元權(quán)重的神經(jīng)網(wǎng)絡(luò)。芯片提供的計算結(jié)果與計算機提供的結(jié)果一般僅相差 2%-3%。
“這項研究是針對深度學(xué)習(xí)應(yīng)用中基于靜態(tài)存儲器(SRAM)內(nèi)存模擬計算的一次非常有前景的實際演示?!盜BM 人工智能研究院副總裁 Dario Gil 是這樣評價的,“這項研究的結(jié)果對于在存儲陣列中實現(xiàn)卷積網(wǎng)絡(luò)提供了一種節(jié)能的實現(xiàn)方案。它一定能夠為將來在物聯(lián)網(wǎng)(Internet of Things, IoT)中采用更復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)進行圖像和視頻分類開辟可能性?!?/p>
-
芯片
+關(guān)注
關(guān)注
456文章
50950瀏覽量
424718 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4774瀏覽量
100894 -
MIT
+關(guān)注
關(guān)注
3文章
253瀏覽量
23417
原文標題:MIT開發(fā)出“跨越性”專用芯片,功耗降低 95%,手機也能運行神經(jīng)網(wǎng)絡(luò)
文章出處:【微信號:lianggezhizi,微信公眾號:兩個質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論