以深度學(xué)習(xí)為代表的人工智能技術(shù)已在包括自動駕駛、醫(yī)療診斷、語音翻譯等眾多領(lǐng)域帶來巨大的變革。隨著深度學(xué)習(xí)算法的迅猛發(fā)展,人工神經(jīng)網(wǎng)絡(luò)規(guī)模的不斷增大,迫切需要不斷提升計算處理器的運(yùn)算速度和能效。采用傳統(tǒng)電子計算方式已經(jīng)越來越難以滿足未來人工智能對處理器計算性能的需求。近年來,基于光計算高速、低功耗、高并行的顛覆性優(yōu)勢,通過光電融合的方式構(gòu)建光學(xué)神經(jīng)網(wǎng)絡(luò)與智能光電計算處理器已經(jīng)成為國際信息技術(shù)前沿的熱點研究領(lǐng)域。
然而,現(xiàn)有的光電智能計算技術(shù)距離實際應(yīng)用還面臨著以下挑戰(zhàn):(1)模型構(gòu)架簡單,現(xiàn)有的光學(xué)神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度較低,光學(xué)非線性實現(xiàn)較為困難,因此模型性能與電子的人工神經(jīng)網(wǎng)絡(luò)有較大的差距;(2)系統(tǒng)誤差難校正,光計算系統(tǒng)誤差大小和系統(tǒng)復(fù)雜度成正相關(guān),因此誤差校正算法對于構(gòu)建大規(guī)模智能光計算系統(tǒng)至關(guān)重要,然而迄今為止尚缺普適性的誤差校正方法;(3)系統(tǒng)重構(gòu)困難,現(xiàn)有光學(xué)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)難以重構(gòu),因此計算功能單一,而網(wǎng)絡(luò)參數(shù)編程則依賴較為復(fù)雜的光學(xué)效應(yīng),大規(guī)模參數(shù)的快速精準(zhǔn)寫入仍存在困難。
圖一:光電智能衍射計算處理器的基本原理
針對上述挑戰(zhàn),來自清華大學(xué)信息學(xué)院的戴瓊海教授研究團(tuán)隊提出并構(gòu)建了光電智能衍射計算處理器(Diffractive Processing Unit, DPU),能夠有效地重構(gòu)實現(xiàn)包含百萬神經(jīng)元的多類新型光電神經(jīng)網(wǎng)絡(luò),通過自適應(yīng)的在線訓(xùn)練算法實現(xiàn)了高性能的視覺分類任務(wù),并驗證了光電智能計算的優(yōu)越性。
DPU 的構(gòu)架采用了光學(xué)衍射的物理現(xiàn)象,能夠產(chǎn)生大規(guī)模的光學(xué)互聯(lián),從而助力構(gòu)建高復(fù)雜度的光學(xué)神經(jīng)網(wǎng)絡(luò)(圖一)。此外,該光學(xué)處理器原理充分利用了光的波粒二象性,神經(jīng)網(wǎng)絡(luò)權(quán)重的調(diào)整通過控制光波傳播的波前分布來實現(xiàn),采用光電效應(yīng)能夠?qū)崿F(xiàn)人工神經(jīng)元的功能。DPU 的運(yùn)行過程光計算部分則幾乎承擔(dān)所有的計算操作,采用高通量可編程的光電器件并結(jié)合電子計算的靈活特性,能夠?qū)崿F(xiàn)高速數(shù)據(jù)調(diào)控以及大規(guī)模網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的編程?!霸谶@項工作中我們定義了光電的衍射人工神經(jīng)元,能夠?qū)崿F(xiàn)對衍射光場的線性加權(quán)求和以及非線性激活響應(yīng),這是構(gòu)建復(fù)雜光電深度學(xué)習(xí)系統(tǒng)的基礎(chǔ)?!?林星特聘研究員說到。
通過軟件編程重構(gòu) DPU 實現(xiàn)了包括前饋和循環(huán)的多種類型的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),每個神經(jīng)網(wǎng)絡(luò)都包含數(shù)百萬個神經(jīng)元,具備較高的模型復(fù)雜度。這些神經(jīng)網(wǎng)絡(luò)通過所提出的自適應(yīng)在線訓(xùn)練方法校正系統(tǒng)誤差累積,從而優(yōu)化實驗計算性能。這種自適應(yīng)的訓(xùn)練方法通過測量神經(jīng)網(wǎng)絡(luò)內(nèi)部的狀態(tài)實現(xiàn)對計算參數(shù)的實時調(diào)整,因此不依賴網(wǎng)絡(luò)結(jié)構(gòu),能夠普適于現(xiàn)有的光電智能計算系統(tǒng)。
將所構(gòu)建的系統(tǒng)應(yīng)用于分類和識別任務(wù),并在深度學(xué)習(xí)的標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行了性能驗證,包括手寫數(shù)字圖像數(shù)據(jù)集(MNIST,圖二)、時尚物品圖像數(shù)據(jù)集(Fashion-MNIST),以及人類動作視頻數(shù)據(jù)集(Wetzmann 和 KTH,圖三)。光電智能計算模型性能首次超越了 LeNet-4 電子神經(jīng)網(wǎng)絡(luò)模型。系統(tǒng)還能實現(xiàn)高速、高精度的人類動作識別。運(yùn)行同樣的神經(jīng)網(wǎng)絡(luò),光電計算系統(tǒng)與特斯拉 V100 圖形處理器(GPU)相比,計算速度提高了 8 倍,系統(tǒng)能效提升超過一個數(shù)量級,核心模塊計算能效則能夠提升四個數(shù)量級。
戴瓊海教授指出,“當(dāng)前光電智能計算技術(shù)的潛力還有待深入挖掘,未來使用超材料構(gòu)建片上相控陣列,能夠極大提升處理器的計算性能,而實現(xiàn)光電計算機(jī)的目標(biāo)則需要多學(xué)科的交叉融合?!?未來已來,推動類腦光電子芯片的研發(fā)將極大促進(jìn)人工智能的發(fā)展,將為大規(guī)模數(shù)據(jù)的實時智能處理,高速低功耗智能化無人系統(tǒng),以及從十億像素到百億像素光場成像奠定基礎(chǔ),具備極為廣闊的應(yīng)用前景。
這項工作發(fā)表在 Nature Photonics 期刊上,周天貺博士研究生為該論文的第一作者,林星特聘研究員(清華腦與認(rèn)知科學(xué)研究院、未來芯片技術(shù)高精尖創(chuàng)新中心)、方璐副教授(清華電子系)、戴瓊海教授(北京信息科學(xué)與技術(shù)國家研究中心)為通訊作者。工作得到了國家科技部和國家自然科學(xué)基金委的支持。
原文標(biāo)題:清華團(tuán)隊打造光學(xué)人工智能,讓《三體》中的計算機(jī)成為現(xiàn)實
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
人工智能
+關(guān)注
關(guān)注
1793文章
47539瀏覽量
239389 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121372
原文標(biāo)題:清華團(tuán)隊打造光學(xué)人工智能,讓《三體》中的計算機(jī)成為現(xiàn)實
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論