0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用光速實現(xiàn)深度學習,探討光學神經(jīng)網(wǎng)絡(luò)的應(yīng)用

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-09-09 10:28 ? 次閱讀

UCLA研究人員利用3D打印打造“全光學深度衍射神經(jīng)網(wǎng)絡(luò)”,利用光的衍射路徑識別目標,可實現(xiàn)實時的目標識別和分類任務(wù),而且準確率相當高,網(wǎng)絡(luò)構(gòu)建成本不足50美元。

如果說GPU養(yǎng)大了深度學習,那么如今深度學習的胃口早已經(jīng)超越了GPU。

當然,GPU在不斷發(fā)展,也出現(xiàn)了TPU、IPU、MLU來滿足這頭巨獸。

深度學習對算力的需求沒有止境,但受制于能耗和物理極限,基于硅基的電子元件雖然現(xiàn)在還能支撐,但遠處那堵幾乎不可逾越的高墻已然顯現(xiàn)。

怎么辦?

光速深度學習!

今天,Science發(fā)表了加州大學洛杉磯分校(UCLA)研究人員的最新研究:All-optical machine learning using diffractive deep neural networks,他們使用 3D 打印打造了一套 “全光學” 人工神經(jīng)網(wǎng)絡(luò),可以分析大量數(shù)據(jù)并以光速識別目標。

論文地址:http://science.sciencemag.org/content/361/6406/1004

這項技術(shù)名為衍射深度神經(jīng)網(wǎng)絡(luò)(diffractive deep neural network,D2NN),它使用來自物體的光散射來識別目標。該技術(shù)基于深度學習的被動衍射層設(shè)計。

研究團隊先用計算機進行模擬,然后用 3D 打印機打造出 8 平方厘米的聚合物層。每個晶圓表面都是不平整的,目的是為了衍射來自目標的光線。

衍射深度神經(jīng)網(wǎng)絡(luò)由一系列聚合物層組成,每層大約 8 平方厘米。利用網(wǎng)絡(luò)區(qū)域內(nèi)的光的衍射傳播路徑來識別目標。

研究人員使用 THz 級頻率的光穿透 3D 打印的網(wǎng)絡(luò)層。每一層網(wǎng)絡(luò)由數(shù)萬個像素組成,光可以通過這些像素傳播。

研究人員為每類的目標分配像素,來自目標的光被衍射到已分配給該目標類型的像素上。這樣,衍射深度神經(jīng)網(wǎng)絡(luò)就能夠識別目標,其耗時與計算機 “看到” 目標所花費的時間相仿。

的。

D2NN: 光速實時學習,成本不到 50 美元

而隨著來自不同目標的光通過 D2NN, 研究人員利用深度學習訓練神經(jīng)網(wǎng)絡(luò),以學習每個目標產(chǎn)生的衍射光圖案。

“我們使用逐層制造的無源元件,并通過光的衍射將這些層相互連接起來,打造一個獨特的全光平臺,可以以光速執(zhí)行機器學習任務(wù)?!?該研究團隊負責人,加州大學洛杉磯分校教授 Aydogan Ozcan 表示。

“這就像一個由玻璃和鏡子構(gòu)成的復雜迷宮。光進入衍射網(wǎng)絡(luò),并在迷宮周圍反射,直到其離開該區(qū)域為止。系統(tǒng)能夠根據(jù)某目標產(chǎn)生的大部分光最終離開迷宮的路徑,確定究竟是哪個目標。”O(jiān)zcan 說。

在實驗中,研究人員將圖像放在 THz 級頻率的光源前。 D2NN 通過光學衍射對圖像進行觀察。研究人員發(fā)現(xiàn),該設(shè)備可以準確識別手寫的數(shù)字和衣服,這兩類對象都是人工智能研究中的常用目標。

圖為 D2NN 設(shè)備識別文本

在訓練中,研究人員還該將設(shè)備作為成像的鏡頭,就像一般的相機鏡頭一樣。

由于 D2NN 的組成可以由 3D 打印制造,成本低廉,可以構(gòu)建規(guī)模更大、數(shù)量更多的層,制造出包含數(shù)億個人工神經(jīng)元(像素)的設(shè)備。規(guī)模較大的設(shè)備可以同時識別更多的目標,執(zhí)行更復雜的數(shù)據(jù)分析。

D2NN 的組件成本低廉。研究人員表示,他們使用的 D2NN 設(shè)備成本不到 50 美元。

雖然這項研究使用的是 Thz 級光譜中的光,但 Ozcan 表示,也可以打造使用可見光、紅外線或其他頻率光譜的神經(jīng)網(wǎng)絡(luò)。他表示,除 3D 打印外,D2NN 也可以使用光刻或其他印刷技術(shù)打造。

全光學衍射深度神經(jīng)網(wǎng)絡(luò)(D2NN)的 3D 打印衍射板

D2NN的設(shè)計和性能:MNIST分類準確率達到91.75%

在論文中,研究人員介紹了D2NN框架的技術(shù)細節(jié)、實驗和測試性能。

在D2NN全光學深度學習框架中,神經(jīng)網(wǎng)絡(luò)物理上由多層衍射表面(diffractive surfaces)形成,這些衍射表面協(xié)同工作以光學地執(zhí)行網(wǎng)絡(luò)可以統(tǒng)計學習的任意功能。雖然這個物理網(wǎng)絡(luò)的推理和預測機制都是光學的,但其學習部分是通過計算機完成的。

研究者將這個框架稱為衍射深度神經(jīng)網(wǎng)絡(luò)( diffractive deep neural network,D2NN),并通過模擬和實驗證明了其推理能力。D2NN可以通過使用幾個透射和/或反射層進行物理創(chuàng)建,其中給定層上的每個點都傳輸或反射進來的光波,每個點代表一個人工神經(jīng)元,通過光學衍射連接到后續(xù)的層。如圖1A所示。

圖1:衍射深度神經(jīng)網(wǎng)絡(luò)D2NN

D2NN 中的人工神經(jīng)元通過由通過振幅和相位調(diào)制的次級波連接到下一層的其他神經(jīng)元。圖1D是標準深度神經(jīng)網(wǎng)絡(luò)的一個類比,可以將每個點或神經(jīng)元的傳輸或反射系數(shù)視為一個“bias”項,這是一個可學習的網(wǎng)絡(luò)參數(shù),在訓練過程中使用誤差反向傳播方法進行迭代調(diào)整。

經(jīng)過這一數(shù)值訓練階段, D2NN的設(shè)計就固定了,并且確定了各層神經(jīng)元的傳輸或反射系數(shù)。這種 D2NN設(shè)計可以以光速執(zhí)行所訓練的特定任務(wù),僅使用光學衍射和無源光學器件(passive optical components)或無需功率的層,從而創(chuàng)建一種高效、快速的方式來實現(xiàn)機器學習任務(wù)。

一般來說,每個神經(jīng)元的相位和振幅可以是可學習的參數(shù),在每一層提供復值調(diào)制(complex-valued modulation),這改善了衍射網(wǎng)絡(luò)的推理性能。 對于phase-only調(diào)制的同調(diào)傳輸網(wǎng)絡(luò),每層可以近似為一個薄的光學元件(圖1)。通過深度學習,在輸入層饋送訓練數(shù)據(jù)并通過光學衍射計算網(wǎng)絡(luò)輸出,每一層的神經(jīng)元的phase value迭代調(diào)整(訓練)來執(zhí)行一個特定的函數(shù)。

在計算目標輸出誤差的基礎(chǔ)上,通過誤差反向傳播算法優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)及其神經(jīng)元相位值。誤差反向傳播算法基于傳統(tǒng)深度學習中的隨機梯度下降法。

D2NN性能:MNIST手寫數(shù)字數(shù)據(jù)集

為了演示 D2NN框架的性能,我們首先將其訓練成一個數(shù)字分類器,對從0到9的手寫數(shù)字進行自動分類(圖1B)。

為了完成這項任務(wù),我們設(shè)計了一個五層的D2NN,其中包含來自MNIST手寫數(shù)字數(shù)據(jù)集的5.5萬張圖像(5000張驗證圖像)。我們將輸入數(shù)字編碼到D2NN輸入域的幅值中,訓練衍射網(wǎng)絡(luò)將輸入數(shù)字映射到10個檢測器區(qū)域,每個檢測器區(qū)域?qū)?yīng)一個數(shù)字。分類標準是尋找具有最大光信號的檢測器,相當于網(wǎng)絡(luò)訓練過程中的損失函數(shù)。

在訓練之后,使用來自MNIST測試數(shù)據(jù)集的10000個圖像(未用作訓練或驗證圖像集)對D2NN數(shù)字分類器進行數(shù)值測試,并且實現(xiàn)了91.75%的分類精度(圖3C)。

根據(jù)這些數(shù)值結(jié)果,我們將這個5層的D2NN 設(shè)計3D打印出來(下圖),每一層的面積為8cm×8cm,然后在衍射網(wǎng)絡(luò)的輸出平面定義10個檢測器區(qū)域(圖1B)。

圖2:3D打印的D2NN的實驗測試

然后,我們使用0.4 THz的連續(xù)波光照來測試網(wǎng)絡(luò)的推理性能(圖2,C和D)。

每一層神經(jīng)元的相位值用3D打印神經(jīng)元的相對厚度進行物理編碼。對這個5層的D2NN設(shè)計的數(shù)值測試顯示,在 ~10000幅測試圖像中,分類準確率達到91.75%(圖3C)。

圖3: D2NN手寫數(shù)字識別器的性能

D2NN性能:Fashion-MNIST數(shù)據(jù)集

接下來,為了測試D2NN框架的分類性能,研究者使用了一個更復雜的圖像數(shù)據(jù)集——Fashion-MNIST數(shù)據(jù)集,其中包含10個類別的時尚產(chǎn)品。

D2NN對Fashion-MNIST數(shù)據(jù)集的分類結(jié)果如下圖所示。具有N = 5個衍射層的phase-only和complex valued的D2NN的分類精度分別達到81.13%和86.33%。

通過將衍射層的數(shù)量增加到N = 10,并將神經(jīng)元的總數(shù)增加到40萬,D2NN的分類精度提高到86.60%。對比而言,在已有研究中,基于卷積神經(jīng)網(wǎng)絡(luò)的標準深度學習,使用~890萬可學習參數(shù)和~250萬個神經(jīng)元,F(xiàn)ashion-MNIST分類準確度的最高性能為96.7%。

光學神經(jīng)網(wǎng)絡(luò)的應(yīng)用

光學電路深度學習是一項重大突破,而且其現(xiàn)實應(yīng)用已經(jīng)逐漸

根據(jù)光學領(lǐng)域權(quán)威期刊Optica的報道,美國斯坦福大學的研究人員已經(jīng)證明,可以直接在光學芯片上訓練人工神經(jīng)網(wǎng)絡(luò)。這一重大突破表明,光學電路可以實現(xiàn)基于電子的人工神經(jīng)網(wǎng)絡(luò)的關(guān)鍵功能,從而可以以更便宜、更快速和更節(jié)能的方式執(zhí)行語音識別、圖像識別等復雜任務(wù)。

不僅如此,斯坦福的另一組研究人員還研究出一套小型AI成像系統(tǒng),采用雙層光學-電子混合計算技術(shù),成像精度和速度均達到電子計算處理器水平。具體說,研究人員在電子計算之前加上一層光學計算,這種AI成像系統(tǒng)在低光照條件下具備更強的成像能力,每個立體像素上的光電子密度最高可達幾十個,同時節(jié)約了大量本該用于計算的時間和成本。

具體到這項研究,UCLA的研究團隊表示,他們的 D2NN 設(shè)備可用于全光學圖像分析、特征檢測和對象分類任務(wù),還可以實現(xiàn)使用 D2NN 執(zhí)行任務(wù)的新相機設(shè)計和光學組件。

例如,使用該技術(shù)的無人駕駛汽車可以立即對停車標志作出反應(yīng),一旦收到從標志衍射來的光,D2NN 就可以讀取標志信息。該技術(shù)還可用于對大量目標的分類任務(wù),比如在數(shù)百萬細胞樣本中尋找疾病的跡象。

“這項研究為基于人工智能的被動設(shè)備提供了新機會,可以對數(shù)據(jù)和圖像進行實時分析,并對目標進行分類?!監(jiān)zcan 說?!斑@種光學人工神經(jīng)網(wǎng)絡(luò)設(shè)備直觀地模擬了大腦處理信息的方式,具備很高的可擴展性,可以應(yīng)用到新的相機設(shè)計和獨特的光學組件設(shè)計中,也可用于醫(yī)療技術(shù)、機器人、安全等領(lǐng)域?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:Science重磅!用光速實現(xiàn)深度學習,跟GPU說再見

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度學習中的卷積神經(jīng)網(wǎng)絡(luò)模型

    深度學習近年來在多個領(lǐng)域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經(jīng)網(wǎng)絡(luò)作為深度學習的一個分支,因其在圖像處理
    的頭像 發(fā)表于 11-15 14:52 ?362次閱讀

    簡單認識深度神經(jīng)網(wǎng)絡(luò)

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)作為機器學習領(lǐng)域中的一種重要技術(shù),特別是在深度學習領(lǐng)域,已經(jīng)取得了顯著的
    的頭像 發(fā)表于 07-10 18:23 ?1050次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的案例分析

    元之間的連接和信息傳遞機制,實現(xiàn)對復雜數(shù)據(jù)的處理、模式識別及預測等功能。本文將通過幾個具體案例分析,詳細探討人工神經(jīng)網(wǎng)絡(luò)在不同領(lǐng)域的應(yīng)用,同時簡要介紹深度
    的頭像 發(fā)表于 07-08 18:20 ?807次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指傳統(tǒng)神經(jīng)網(wǎng)絡(luò)或前向
    的頭像 發(fā)表于 07-04 13:20 ?921次閱讀

    深度神經(jīng)網(wǎng)絡(luò)的設(shè)計方法

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)作為人工智能領(lǐng)域的重要技術(shù)之一,通過模擬人腦神經(jīng)元之間的連接,實現(xiàn)了對復雜數(shù)據(jù)的自主
    的頭像 發(fā)表于 07-04 13:13 ?485次閱讀

    神經(jīng)網(wǎng)絡(luò)芯片與傳統(tǒng)芯片的區(qū)別和聯(lián)系

    應(yīng)運而生,成為解決深度學習計算問題的關(guān)鍵技術(shù)之一。本文將從多個角度探討神經(jīng)網(wǎng)絡(luò)芯片與傳統(tǒng)芯片的區(qū)別和聯(lián)系。 神經(jīng)網(wǎng)絡(luò)芯片與傳統(tǒng)芯片的基本概念
    的頭像 發(fā)表于 07-04 09:31 ?996次閱讀

    神經(jīng)網(wǎng)絡(luò)的基本原理及Python編程實現(xiàn)

    神經(jīng)網(wǎng)絡(luò)作為深度學習算法的基本構(gòu)建模塊,模擬了人腦的行為,通過互相連接的節(jié)點(也稱為“神經(jīng)元”)實現(xiàn)對輸入數(shù)據(jù)的處理、模式識別和結(jié)果預測等功
    的頭像 發(fā)表于 07-03 16:11 ?684次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓練的是什么

    、訓練過程以及應(yīng)用場景。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋深度學習模型,其核心思想是利用卷積
    的頭像 發(fā)表于 07-03 09:15 ?429次閱讀

    深度學習與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    到自然語言處理,深度學習和CNN正逐步改變著我們的生活方式。本文將深入探討深度學習與卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 18:19 ?921次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋
    的頭像 發(fā)表于 07-02 16:47 ?607次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學習是機器學習的一個分支,它通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實現(xiàn)對數(shù)據(jù)的自動學習
    的頭像 發(fā)表于 07-02 14:45 ?2317次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型cnn的基本概念、結(jié)構(gòu)及原理

    ,其核心是構(gòu)建具有多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,以實現(xiàn)對復雜數(shù)據(jù)的高效表示和處理。在眾多深度學習模型中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)因其在圖像識別等領(lǐng)域
    的頭像 發(fā)表于 07-02 10:11 ?9774次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型有哪些

    、Sigmoid或Tanh。 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN): 卷積神經(jīng)網(wǎng)絡(luò)深度學習中最重
    的頭像 發(fā)表于 07-02 10:00 ?1498次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機器學習領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運作方式,通過復雜的網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)信息的處理、存儲和傳遞。隨著
    的頭像 發(fā)表于 07-01 14:16 ?730次閱讀

    詳解深度學習、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    在如今的網(wǎng)絡(luò)時代,錯綜復雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境,讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年,深度學習逐漸走進人們的視線
    的頭像 發(fā)表于 01-11 10:51 ?2204次閱讀
    詳解<b class='flag-5'>深度</b><b class='flag-5'>學習</b>、<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>與卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的應(yīng)用