深鑒科技發(fā)明的人工智能芯片,結(jié)合了神經(jīng)網(wǎng)絡(luò)專用處理器和通用處理器的芯片結(jié)構(gòu),不僅可以提供一個靈活的系統(tǒng),并且可以適用于復(fù)雜的神經(jīng)網(wǎng)絡(luò)。
近年來,隨著人工智能領(lǐng)域的興起,越來越多的AI芯片公司出現(xiàn)在了人們的視野之中,AI芯片被廣泛應(yīng)用于金融、購物、安防、早教以及無人駕駛等領(lǐng)域。而這其中,深鑒科技也憑借著先進的技術(shù)在市場中嶄露頭角。
深鑒科技的AI芯片基于FPGA設(shè)計,其設(shè)計的亞里士多德架構(gòu)是針對卷積神經(jīng)網(wǎng)絡(luò)而設(shè)計的,其設(shè)計的笛卡爾架構(gòu)是專為處理DNN/RNN網(wǎng)絡(luò)而設(shè)計的,可對經(jīng)過結(jié)構(gòu)壓縮后的稀疏神經(jīng)網(wǎng)絡(luò)進行極致高效的硬件加速。
在人工智能領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)尤其在圖像處理領(lǐng)域有著非常廣泛的應(yīng)用,其具有訓(xùn)練方法簡單、計算結(jié)構(gòu)統(tǒng)一的特點。但是神經(jīng)網(wǎng)絡(luò)存儲計算量都很大。工程師們試圖在FPGA上搭建或者直接設(shè)計專用芯片來實現(xiàn)人工智能芯片,但是,這種專用神經(jīng)網(wǎng)絡(luò)加速器的硬件還是不夠靈活,且能夠完成的任務(wù)較為單一。
為了解決這樣的問題,深鑒科技在16年8月19日申請了一項名為“通用處理器與神經(jīng)網(wǎng)絡(luò)處理器的協(xié)同系統(tǒng)設(shè)計”的發(fā)明專利(申請?zhí)枺?01610695285.4),申請人為北京深鑒科技有限公司。
根據(jù)該專利目前公開的資料,讓我們一起來看看這項人工智能芯片專利吧。
如上圖,為把人工神經(jīng)網(wǎng)絡(luò)模型部署在專用硬件上的流程示意圖,這是一套為了加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程,從優(yōu)化流程的硬件架構(gòu)的角度提出了一整套的技術(shù)方案,其中顯示了如何壓縮CNN模型以減少內(nèi)存占用和操作數(shù)量,同時最大限度地減少精度損失。
這種硬件架構(gòu)包括PS和PL兩個模塊,其中:PS為通用處理系統(tǒng),其中包含有CPU和外部存儲器;PL為可編程邏輯模塊,其中包含有DMA、計算核、輸入輸出緩沖以及控制器等。計算核包括多個處理單元,其負責(zé)在人工智能網(wǎng)絡(luò)的卷積層以及全連接層的大多數(shù)計算任務(wù),是實現(xiàn)人工智能芯片的核心部件。
值得一提的是,在這種架構(gòu)中,雖然DMA分布在PL一側(cè),但是卻直接被CPU所控制,并且將數(shù)據(jù)從外部存儲區(qū)內(nèi)搬運到PL中。同時,這種硬件架構(gòu)僅僅是進行了功能上的劃分,PL和PS之間的界限并不絕對,例如PL和CPU都可以僅僅實現(xiàn)在SOC上,而外部存儲器可以由另一個存儲器芯片實現(xiàn)并于SOC芯片中的CPU相連接。
如上圖為優(yōu)化人工神經(jīng)網(wǎng)絡(luò)的整體流程圖,首先要對于模型進行壓縮,壓縮可以對CNN模型進行修剪,而網(wǎng)絡(luò)修剪是一種有效的方法,可以減少網(wǎng)絡(luò)的復(fù)雜性和過度擬合。其次,進行數(shù)據(jù)定點量化,目的是為了將浮點數(shù)轉(zhuǎn)換為定點數(shù)的同時得到最高精度。
之后再通過編譯,通過這樣的結(jié)構(gòu)設(shè)計得到人工神經(jīng)網(wǎng)絡(luò)加速器,從而可以做到輸入圖像、語音、文字,即可輸出識別的結(jié)果。這樣進行精簡后的結(jié)構(gòu)有利于硬件設(shè)計,同時省去了較為復(fù)雜的運算,進一步提高了人工智能芯片進行運算的效率。
如上圖,為使用CPU和專用加速器的協(xié)同設(shè)計來實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)的硬件架構(gòu),在這種硬件架構(gòu)中,CPU控制DMA,由DMA來負責(zé)調(diào)度數(shù)據(jù),具體而言,CPU可以控制DMA將外部存儲器中的指令搬運到FIFO(緩沖器)中,隨后,這種為神經(jīng)網(wǎng)絡(luò)設(shè)計的加速器從FIFO中取出指令并執(zhí)行。
在運行的時候,CPU需要時刻監(jiān)控DMA的狀態(tài):當(dāng)輸入緩沖區(qū)的數(shù)據(jù)未滿時,需要把數(shù)據(jù)從DDR中搬運到輸入緩沖區(qū)中;當(dāng)輸出緩沖區(qū)不為空時,需要將數(shù)據(jù)從輸出緩沖區(qū)中搬運回DDR中。
此外,這種結(jié)構(gòu)中使用的專用加速器包括:控制器、計算核以及緩沖區(qū),計算核包括卷機器、加法器樹和非線性模塊,這些結(jié)構(gòu)保證了人工智能芯片完成深度神經(jīng)網(wǎng)絡(luò)的運算,從而可以完成不同的復(fù)雜的人工智能任務(wù)。
以上就是深鑒科技發(fā)明的人工智能芯片,這種結(jié)合神經(jīng)網(wǎng)絡(luò)專用處理器和通用處理器的芯片結(jié)構(gòu),可以為人工智能應(yīng)用提供一個靈活的系統(tǒng),并能夠適用于復(fù)雜的神經(jīng)網(wǎng)絡(luò)。并且該方案實現(xiàn)了控制器與存儲器的分離,控制器和存儲器可以使用不同的SOC芯片完成,進而保證了系統(tǒng)的穩(wěn)定性。
關(guān)于嘉德
深圳市嘉德知識產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強企業(yè)工作多年的知識產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權(quán)法律理論和實務(wù),在全球知識產(chǎn)權(quán)申請、布局、訴訟、許可談判、交易、運營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會知識產(chǎn)權(quán)、跨境電商知識產(chǎn)權(quán)、知識產(chǎn)權(quán)海關(guān)保護等方面擁有豐富的經(jīng)驗。
責(zé)任編輯:tzh
-
FPGA
+關(guān)注
關(guān)注
1629文章
21754瀏覽量
604229 -
芯片
+關(guān)注
關(guān)注
456文章
50936瀏覽量
424669 -
AI
+關(guān)注
關(guān)注
87文章
31097瀏覽量
269429 -
人工智能
+關(guān)注
關(guān)注
1792文章
47409瀏覽量
238923
發(fā)布評論請先 登錄
相關(guān)推薦
評論