目前英特爾和IBM在內(nèi)的企業(yè)正積極探索超低功耗神經(jīng)模態(tài)芯片在不同領(lǐng)域的應(yīng)用,在未來幾年內(nèi)隨著 AI+IoT 的發(fā)展,神經(jīng)模態(tài)計算將會迎來一波新的熱潮。
人工神經(jīng)網(wǎng)絡(luò)的概念以及基本神經(jīng)元模型于 1943 年就已提出,這正是試圖模擬腦皮層以神經(jīng)元網(wǎng)絡(luò)形式進行信息處理的體現(xiàn)。
卷積神經(jīng)網(wǎng)絡(luò)的局部感受野是受到大腦視覺系統(tǒng)的啟發(fā)。深度神經(jīng)網(wǎng)絡(luò)的層級構(gòu)建是源于腦皮層的分層通路。
只不過在深度學(xué)習(xí)的后續(xù)發(fā)展中,研究者更加偏重把神經(jīng)網(wǎng)絡(luò)視為一個黑匣,用于擬合從輸入到輸出的復(fù)雜映射關(guān)系:
只需要給網(wǎng)絡(luò)的輸出定義一個收斂目標(biāo)(目標(biāo)函數(shù),比如每張圖像的輸出對應(yīng)到正確的類別)并描述為一個優(yōu)化問題,然后用梯度下降的方式去更新系統(tǒng)參數(shù)主要是突觸權(quán)重,使得輸出逐漸逼近想要的結(jié)果。
原則上網(wǎng)絡(luò)越大,特征提取的能力就會越強,也就需要越多的數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò)更新參數(shù)使網(wǎng)絡(luò)收斂,因此計算量也大幅增加。
故而,深度學(xué)習(xí)也被稱為數(shù)據(jù)和算力驅(qū)動的智能。雖然深度學(xué)習(xí)以解決實際應(yīng)用為目標(biāo)而與神經(jīng)科學(xué)漸行漸遠,但近兩年也有科學(xué)家試圖在大腦中找到梯度下降的證據(jù)和吸收新的腦科學(xué)成果。
而機器學(xué)習(xí)是目前人工智能模型中最卓有成效的一個分支,而深度學(xué)習(xí)又是當(dāng)今機器學(xué)習(xí)的寵兒,其以人工神經(jīng)網(wǎng)絡(luò)為主要模型。
人工神經(jīng)網(wǎng)絡(luò)由大量神經(jīng)元通過突觸連接而成,從輸入到輸出呈現(xiàn)層級結(jié)構(gòu),當(dāng)層數(shù)較多時則被稱為深度神經(jīng)網(wǎng)絡(luò)。
相比于全連接神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)通過引入二維特征圖與突觸核的卷積操作獲得了強大的局部特征提取能力,被廣泛用于圖像處理領(lǐng)域。
而反饋神經(jīng)網(wǎng)絡(luò)通過引入反饋連接,建立時序動力學(xué)模型,被廣泛用于處理語音文本等時序數(shù)據(jù)。
神經(jīng)模態(tài)計算的重要意義
①目前的深度學(xué)習(xí)僅能實現(xiàn)人類大腦極小一部分的功能,距離人類的智能還有非常遠的距離,而使用神經(jīng)模態(tài)計算直接模仿神經(jīng)元系統(tǒng)在人工神經(jīng)元數(shù)量足夠多時,或?qū)⒂邢M軐崿F(xiàn)比起深度學(xué)習(xí)更好的效果,更接近人類大腦。
②目前深度學(xué)習(xí)計算在部署上遇到的困難是能效比和延遲問題,在對于功耗要求非常低的物聯(lián)網(wǎng)領(lǐng)域,以及對于延遲要求非常高的領(lǐng)域無人駕駛領(lǐng)域,部署深度學(xué)習(xí)會遇到很大的挑戰(zhàn)。
恰好神經(jīng)模態(tài)計算則可以解決這兩大問題。
①神經(jīng)模態(tài)計算的一大優(yōu)勢就是其計算功耗與輸入有關(guān),在輸入不會激活大量神經(jīng)元的情況下,其功耗可以做到非常低。
②對于物聯(lián)網(wǎng)應(yīng)用來說,神經(jīng)模態(tài)計算可以利用這樣的規(guī)律,僅僅在需要的時候激活神經(jīng)元消費能量來完成事件識別,而在其他沒有事件的時候由于神經(jīng)元未被激活因此功耗很低,從而實現(xiàn)遠低于深度學(xué)習(xí)芯片的平均功耗。
③神經(jīng)模態(tài)計算并非常規(guī)的馮諾伊曼架構(gòu),神經(jīng)模態(tài)計算芯片一般也不會搭配 DRAM 使用,而是直接將信息儲存在了神經(jīng)元里。這樣就避免了內(nèi)存墻帶來的功耗和延遲問題,因此神經(jīng)模態(tài)計算芯片的延遲和能效比都會好于傳統(tǒng)的深度學(xué)習(xí)。
國外技術(shù)寡頭優(yōu)勢明顯
近日,英特爾發(fā)布了基于其神經(jīng)模態(tài)計算芯片 Loihi 的加速卡 Pohoiki Beach,該加速卡包含了 64 塊 Loihi 芯片,共含有八百多萬個神經(jīng)元。
繼 IBM 發(fā)布 TrueNorth、英特爾發(fā)布 Loihi 之后,PohoikiBeach 又一次讓神經(jīng)模態(tài)計算走進了聚光燈下。
深度神經(jīng)網(wǎng)絡(luò)壓縮技術(shù),當(dāng)前,深度學(xué)習(xí)領(lǐng)域目前面臨的一大挑戰(zhàn)是,主流 DNNs 都是計算和存儲密集型的,這導(dǎo)致在邊緣和嵌入式設(shè)備的部署面臨巨大的挑戰(zhàn)。
為此,英特爾研究院提出了從動態(tài)網(wǎng)絡(luò)手術(shù) DNS、漸進網(wǎng)絡(luò)量化 INQ 到 MLQ 多尺度編碼量化的低精度深度壓縮解決方案。
通過這些布局可獲得百倍 DNN 模型無損壓縮性能。根據(jù) AlexNet 測試結(jié)果,該項簡潔的解決方案能夠超越主流深度壓縮方案至少一倍,在 2/4-bit 精度下達到超過 100 倍的網(wǎng)絡(luò)壓縮。
IBM 研究人員在活動上詳細介紹了數(shù)字和模擬 AI 芯片的 AI 新方法,它的數(shù)字 AI 芯片首次采用 8 位浮點數(shù)成功訓(xùn)練了深度神經(jīng)網(wǎng)絡(luò),同時在一系列深度學(xué)習(xí)模型和數(shù)據(jù)集上完全保持了準(zhǔn)確性。
這些更廣泛的問題需要更大規(guī)模的神經(jīng)網(wǎng)絡(luò)、更大的數(shù)據(jù)集和多模態(tài)數(shù)據(jù)集,為此 IBM 需要改變架構(gòu)和硬件來實現(xiàn)這一切。
IBM 大膽預(yù)測,GPU 在 AI 中的主導(dǎo)地位正在結(jié)束。GPU 能夠為圖形處理進行大量的并行矩陣乘法運算,這種矩陣乘法碰巧與神經(jīng)網(wǎng)絡(luò)所需的完全相同,這非常重要。
因為沒有那些 GPU,我們永遠無法達到我們今天在 AI 性能方面已經(jīng)達到的性能水平。隨著 IBM 掌握的更關(guān)于如何實現(xiàn)人工智能的知識,也在尋找設(shè)計出更高效硬件的方法和途徑。
對于 32 位計算來說,必須在 32 位上進行計算。如果可以在 16 位上計算,那基本上是計算能力的一半,或者可能是芯片面積的一半甚至更少。
如果可以降到 8 位或 4 位,那就更好了。所以,這是在面積、功率、性能和吞吐量方面的巨大勝利——關(guān)乎我們能夠以多快的速度完成這一切。
IBM 還在 IEDM 大會上展示了所謂的 8 位精度內(nèi)存乘法與設(shè)計中的相變內(nèi)存。IBM 發(fā)表了一項關(guān)于新型內(nèi)存計算設(shè)備的研究,與當(dāng)今的商業(yè)技術(shù)相比,該設(shè)備的計算能耗水平要低 100-1000 倍,非常適合于邊緣 AI 應(yīng)用,例如自動駕駛、醫(yī)療監(jiān)控和安全性。
IBM 的不同之處是相信完整的 AI 解決方案需要加速推理和訓(xùn)練,其正在開發(fā)和逐漸發(fā)展成熟可用于推理和訓(xùn)練的非易失性內(nèi)存元件。
結(jié)尾
隨著英特爾和 IBM 在內(nèi)的企業(yè)正積極探索超低功耗神經(jīng)模態(tài)芯片在不同領(lǐng)域的應(yīng)用,在未來幾年內(nèi)伴隨 AI+IoT 的發(fā)展,神經(jīng)模態(tài)計算將會迎來一波新的熱潮。
-
英特爾
+關(guān)注
關(guān)注
61文章
9974瀏覽量
171823 -
IBM
+關(guān)注
關(guān)注
3文章
1757瀏覽量
74708 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4772瀏覽量
100807
發(fā)布評論請先 登錄
相關(guān)推薦
評論