比深度神經(jīng)網(wǎng)絡(luò)速度還快的是什么?
或許光子DNN可以回答這個問題。
現(xiàn)在,美國研究者開發(fā)的一個光子神經(jīng)網(wǎng)絡(luò)(photonic deep neural network,PDNN),讓圖像識別僅需1納秒。
1納秒是什么概念?它等于10-9秒,這與最先進(jìn)的微芯片單時鐘周期(最小的時間單位)相當(dāng)。
此外,研究者測試發(fā)現(xiàn),PDNN對圖像進(jìn)行2分類和4分類的準(zhǔn)確率分別高達(dá)93.8%和89.8%。
誠然,如今的大型多層神經(jīng)網(wǎng)絡(luò)高效且運算能力很強,但其也受到硬件的限制,往往需要消耗大量的電力資源等。
而賓夕法尼亞大學(xué)的工程師們研發(fā)的PDNN,能夠直接分析圖像,不需要時鐘、傳感器或大型存儲模塊,以有效降低耗能。相關(guān)研究成果于近日登上了Nature雜志。
光子DNN比傳統(tǒng)DNN更快
和傳統(tǒng)DNN相比,光子DNN的原理和性能有何不同?
先來看看傳統(tǒng)DNN:
圖a是傳統(tǒng)DNN的結(jié)構(gòu)示意圖,包括一個數(shù)據(jù)排列單元,然后是輸入層、幾個隱藏層,和一個提供分類輸出的輸出層。
圖b展示了傳統(tǒng)N輸入神經(jīng)元的結(jié)構(gòu):輸入的線性加權(quán)和,通過一個非線性激活函數(shù),產(chǎn)生神經(jīng)元的輸出。
圖c和圖d分別是一個PDNN芯片的神經(jīng)網(wǎng)絡(luò)示意圖和N輸入神經(jīng)元結(jié)構(gòu)。
首先在一個5×6光柵耦合器上形成輸入圖像,然后將其排列成4個重疊的子圖像,子圖像的像素被傳送到第一層神經(jīng)元,形成一個卷積層。
后面的神經(jīng)元與它們的前一層完全連接,該網(wǎng)絡(luò)產(chǎn)生2個輸出,可最多為4種圖像信息分類。
對于這些神經(jīng)元,其輸入都是光學(xué)信號。
在每個神經(jīng)元中,線性計算是通過光學(xué)方式進(jìn)行的,而非線性激活函數(shù)是通過光電子方式實現(xiàn)的,從而可使分類時間低于570ps(=0.57ns)。
論文的通訊作者,電氣工程師Firooz Aflatouni對這個PDNN的性能補充描述道:它每秒可以對近18億張圖像進(jìn)行分類,而傳統(tǒng)的視頻幀率是每秒24至120幀。
這里的PDNN芯片電路被集成在僅9.3 mm2 的面積內(nèi),不需要時鐘、傳感器以及大型存儲模塊。
一個激光器被耦合到芯片內(nèi),為各個神經(jīng)元提供光源;該芯片包含兩個5×6的光柵耦合器,分別作為輸入像素陣列和校準(zhǔn)陣列。
不過,均勻分布的供給光每個神經(jīng)元光提供了相同的輸出范圍,顯然這將允許將其擴展到更大規(guī)模的PDNN。
光子DNN芯片的圖像分類測試
研究者們讓這個PDNN微芯片識別手寫字母。
一組實驗測試了PDNN芯片的二分類性能:需要對共計216個「p」和「d」字母組成的數(shù)據(jù)集進(jìn)行分類。
該芯片準(zhǔn)確率高于93.8%。((92.8%+94.9%)/2)
另一組實驗測試了PDNN芯片的四分類性能:需對共計432個「p」、「d」、「a」、「t」字母組成的數(shù)據(jù)集進(jìn)行分類。
該芯片分類準(zhǔn)確率高于89.8%。
這些結(jié)果表明,即使有更多的類(如分四類情況),且存在打印機引起的變化和噪聲,PDNN芯片仍取得了較高的分類精度。
為了比較這個PDNN和傳統(tǒng)DNN的圖像分類準(zhǔn)確性,研究者還測試了在Python中使用Keras庫實現(xiàn)的190個神經(jīng)元組成的DNN,結(jié)果顯示:它在相同圖像上的分類準(zhǔn)確率為96%。
審核編輯:郭婷
-
傳感器
+關(guān)注
關(guān)注
2552文章
51292瀏覽量
755171 -
芯片
+關(guān)注
關(guān)注
456文章
51023瀏覽量
425423 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4776瀏覽量
100952
原文標(biāo)題:Nature | 低于1納秒光速圖像識別
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論