完全通過(guò)光學(xué),不要計(jì)算機(jī)也能構(gòu)建個(gè)神經(jīng)網(wǎng)絡(luò)?港科大的研究團(tuán)隊(duì)提出了一種全光學(xué)神經(jīng)網(wǎng)絡(luò),所有線性變換、激活函數(shù)通過(guò)光學(xué)模塊就能實(shí)現(xiàn)。
在處理模式識(shí)別、風(fēng)險(xiǎn)管理以及其他同樣復(fù)雜的任務(wù)時(shí),最強(qiáng)大的計(jì)算機(jī)都無(wú)法與人腦匹敵。但是,近來(lái)光學(xué)神經(jīng)網(wǎng)絡(luò)取得的進(jìn)展通過(guò)模擬人腦中神經(jīng)元的反應(yīng)方式縮小了計(jì)算機(jī)與人腦之間的差距。這種光學(xué)神經(jīng)網(wǎng)絡(luò)比 ML 中的網(wǎng)絡(luò)能耗更低、運(yùn)算更快,是未來(lái)大規(guī)模應(yīng)用 AI 的堅(jiān)實(shí)基礎(chǔ)。
近日,來(lái)自香港科技大學(xué)的研究團(tuán)隊(duì)在《Optica》雜志上發(fā)表了一篇論文,詳細(xì)描述了他們提出的雙層全光學(xué)神經(jīng)網(wǎng)絡(luò)。這是一個(gè)功能完善的全光學(xué)神經(jīng)網(wǎng)絡(luò)(AONN),其中所使用的線性函數(shù)和非線性激活函數(shù)都是完全根據(jù)光學(xué)實(shí)現(xiàn)的。而且這種全光學(xué)神經(jīng)網(wǎng)絡(luò)還能擴(kuò)展到更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu),從而完成圖像識(shí)別等更復(fù)雜的任務(wù)。
這個(gè)復(fù)雜的東西就是一個(gè)兩層的全光學(xué)神經(jīng)網(wǎng)絡(luò),它和機(jī)器學(xué)習(xí)中的兩層全連接網(wǎng)絡(luò)有點(diǎn)「類似」。
研究團(tuán)隊(duì)成員之一 Junwei Liu 表示:「我們提出的全光學(xué)神經(jīng)網(wǎng)絡(luò)能夠以光速執(zhí)行光學(xué)并行計(jì)算,并且耗能極少。這種大規(guī)模的全光學(xué)神經(jīng)網(wǎng)絡(luò)可應(yīng)用于圖像識(shí)別以及科學(xué)研究等諸多領(lǐng)域。」
港科大的全光學(xué)神經(jīng)網(wǎng)絡(luò)是什么
在傳統(tǒng)混合光學(xué)的神經(jīng)網(wǎng)絡(luò)中,光學(xué)組件通常用于線性運(yùn)算,而非線性激活函數(shù)通常使用電子的方式實(shí)現(xiàn)。這主要因?yàn)榉蔷€性光學(xué)元器件需要高功率的激光器,這在光學(xué)神經(jīng)網(wǎng)絡(luò)中是很難實(shí)現(xiàn)的。
為了克服這方面的問(wèn)題,研究者使用具有電磁感應(yīng)透明度的冷原子實(shí)現(xiàn)非線性函數(shù)。研究團(tuán)隊(duì)的 Shengwang Du 說(shuō):「這種光感應(yīng)效應(yīng)可以通過(guò)非常小功率的激光器實(shí)現(xiàn),且該效應(yīng)是基于非線性量子干涉的。因此這種效應(yīng)可以將我們的系統(tǒng)擴(kuò)展到量子神經(jīng)網(wǎng)絡(luò),從而解決經(jīng)典方法難以解決的問(wèn)題?!?/p>
為了確認(rèn)新方法的能力與可行性,研究者構(gòu)建了一個(gè)雙層全連接全光學(xué)神經(jīng)網(wǎng)絡(luò),它的輸入單元與輸出單元數(shù)目分別是 16 與 2。研究者使用他們的全光學(xué)網(wǎng)絡(luò)分類 Ising 模型(一種磁場(chǎng)的統(tǒng)計(jì)學(xué)模型),即 order 和 disorder 階段兩個(gè)類別。結(jié)果表明,全光學(xué)神經(jīng)網(wǎng)絡(luò)與一般基于計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò)一樣準(zhǔn)確。
圖 1:全連接網(wǎng)絡(luò)的結(jié)構(gòu)與全光學(xué)神經(jīng)網(wǎng)絡(luò)的一般結(jié)構(gòu)。
如上 a 為機(jī)器學(xué)習(xí)中常見(jiàn)的全連接網(wǎng)絡(luò),b 則是香港科技大學(xué)研究者提出的全光學(xué)神經(jīng)網(wǎng)絡(luò)(AONN),它們都會(huì)進(jìn)行非線性變換。與一般的 ONN 不同,AONN 沒(méi)有復(fù)雜的電場(chǎng)神經(jīng)元,AONN 所有的信都通過(guò)光學(xué)的方式進(jìn)行編碼。
非線性光學(xué)激活函數(shù)
這篇論文核心的突破就是采用了基于光學(xué)的非線性激活函數(shù),因此整個(gè)網(wǎng)絡(luò)才能稱為「全」光學(xué)神經(jīng)網(wǎng)絡(luò)。那么什么是非線性光學(xué)激活函數(shù)?簡(jiǎn)單而言,它就是一種基于電磁感應(yīng)透明的模塊(electromagnetically induced transparency, EIT)完成的,我們只要知道 EIT 是一種原子躍遷之間的光量子干涉效應(yīng)就行了。
EIT 非線性光學(xué)激活函數(shù)由激光冷卻的 85Rb 原子在 dark-line 二維磁光阱(MOT)中實(shí)現(xiàn),如下圖 3(a) 所示。圖 3(b) 所示為原子能級(jí),原子在基態(tài)|1》中制備。
在沒(méi)有耦合光束的情況下,原子介質(zhì)對(duì)共振探測(cè)光束是不透明的,它如圖 3(c) 透射光譜中的實(shí)現(xiàn)所示最大程度地被原子吸收。
圖 3:EIT 非線性光學(xué)激活函數(shù)的實(shí)現(xiàn)。
對(duì)「光學(xué)神經(jīng)網(wǎng)絡(luò)」的不懈追求
當(dāng)然,香港科技大學(xué)的這個(gè)全光學(xué)神經(jīng)網(wǎng)絡(luò)并非研究者在該領(lǐng)域的唯一探索。今年 5 月份,在《Nature》的一篇論文中,德國(guó)的研究人員提出了一種在毫米級(jí)光子芯片上實(shí)現(xiàn)的、基于相變非線性材料的全光學(xué)脈沖神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)內(nèi)部沒(méi)有光到電的轉(zhuǎn)換,輸入的數(shù)據(jù)被電子調(diào)制成不同的波長(zhǎng)以注入網(wǎng)絡(luò),但之后所有數(shù)據(jù)都會(huì)停留在芯片上。利用集成相變材料來(lái)實(shí)現(xiàn)權(quán)重調(diào)制和神經(jīng)元集成;它們位于兩種微環(huán)諧振器上,具有突觸或神經(jīng)功能。
在不同工作波長(zhǎng)情況下注入的未調(diào)制光接收到在相變材料中累積的神經(jīng)元激活,之后將它們傳遞到網(wǎng)絡(luò)下一層。即使沒(méi)有芯片上光學(xué)增益(在這個(gè)過(guò)程中,一種介質(zhì)將能量傳遞給通過(guò)它傳輸?shù)墓猓@個(gè)設(shè)置也可能擴(kuò)展至更大的網(wǎng)絡(luò)。作者在其上實(shí)現(xiàn)了小規(guī)模的監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。
利用上述全光學(xué)神經(jīng)元進(jìn)行監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。a 和 b 表示兩個(gè)神經(jīng)元在不同輸入模式下的輸出;C:全光學(xué)神經(jīng)元的無(wú)監(jiān)督學(xué)習(xí)機(jī)制;d:重復(fù)顯示「0110」模式時(shí)四個(gè)突觸的權(quán)重隨時(shí)間的變化。
香港科技大學(xué)的研究者在論文中也提到了這項(xiàng)研究,但他們指出,這兩項(xiàng)研究存在根本差別。首先,德國(guó)這項(xiàng)研究中的系統(tǒng)是單層的,而本文中提出的是一個(gè) 16 個(gè)輸入、2 個(gè)輸出的雙層全光學(xué)神經(jīng)網(wǎng)絡(luò),還帶有 4 個(gè)具有非線性光學(xué)激活函數(shù)的中間神經(jīng)元。而且,港科大的研究者利用 EIT 量子干涉實(shí)現(xiàn)了非線性光學(xué)激活函數(shù),這與那項(xiàng)研究的方法完全不同。
除了上述全光學(xué)神經(jīng)網(wǎng)絡(luò),還有研究者嘗試從局部入手,把神經(jīng)網(wǎng)絡(luò)的一部分替換為光學(xué)卷積層。
去年 8 月,斯坦福大學(xué)在《Nature》子刊《Scientific Reports》上發(fā)表論文,提出在 CNN 網(wǎng)絡(luò)前端替換一個(gè)光學(xué)卷積層(opt-conv)的方案,可以在保持網(wǎng)絡(luò)性能的同時(shí)顯著降低能耗,并在 CIFAR-10 數(shù)據(jù)集的分類任務(wù)上驗(yàn)證了其結(jié)論。
光學(xué)卷積層也就是用光學(xué)器件實(shí)現(xiàn)的卷積層,其光學(xué)運(yùn)算具備高帶寬、高互聯(lián)和并行處理特性,并能光速執(zhí)行運(yùn)算,功耗接近于零。該技術(shù)有望在低功耗機(jī)器學(xué)習(xí)領(lǐng)域得到進(jìn)一步發(fā)掘。
光學(xué)卷積層設(shè)計(jì)。(a)4f 系統(tǒng)圖,可以通過(guò)在傅里葉平面上放置相位掩模來(lái)實(shí)現(xiàn)光學(xué)卷積層(opt-conv)。(b)數(shù)字卷積層的標(biāo)準(zhǔn)組成,包括輸入圖像、卷積核堆棧和相應(yīng)的輸出量。(c)opt-conv 層中的等效組成,核和輸出以二維數(shù)組的形式平鋪在平面,而不是堆疊在深度維數(shù)中。
此外,為了實(shí)現(xiàn)光速運(yùn)算,加州大學(xué)洛杉磯分校(UCLA)的研究者甚至用 3D 打印打造出了固態(tài)的神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)利用層級(jí)傳播的光衍射來(lái)執(zhí)行計(jì)算,實(shí)現(xiàn)了手寫數(shù)字的圖像識(shí)別,相關(guān)成果已發(fā)表在《science》雜志上。
這一想法看似新奇,其實(shí)也很自然。神經(jīng)網(wǎng)絡(luò)中執(zhí)行的線性運(yùn)算,恰好和光衍射的線性相互作用對(duì)應(yīng),神經(jīng)元的權(quán)重、激活值概念也能和光的振幅、相位對(duì)應(yīng)(可調(diào))。此外,固態(tài)光衍射計(jì)算還具有能耗小、無(wú)發(fā)熱、光速執(zhí)行(盡管傳統(tǒng)計(jì)算機(jī)電路中的電場(chǎng)傳播也是光速的,但并未直接對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程)等優(yōu)點(diǎn)。
當(dāng)然,也有人對(duì)此提出質(zhì)疑,認(rèn)為這種固態(tài)的神經(jīng)網(wǎng)絡(luò)對(duì)安裝精度和環(huán)境震動(dòng)要求比較嚴(yán)格,可行性有待考證。
更復(fù)雜的光學(xué)神經(jīng)網(wǎng)絡(luò)
最后,研究者還計(jì)劃擴(kuò)展全光學(xué)的這種方法,從而構(gòu)建具有復(fù)雜架構(gòu)的大規(guī)模全光學(xué)深度神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)能用于更復(fù)雜的圖像識(shí)別等任務(wù)。該論文的作者說(shuō):「盡管我們的工作是概念性驗(yàn)證,但它展示了全光學(xué)神經(jīng)網(wǎng)絡(luò)在未來(lái)人工智能中的可能性。下一代的 AI 硬件在本質(zhì)上應(yīng)該更快、更低能耗,從而高效支持復(fù)雜的 AI 應(yīng)用?!?/p>
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4773瀏覽量
100861 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7513瀏覽量
88155 -
神經(jīng)元
+關(guān)注
關(guān)注
1文章
363瀏覽量
18466
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論