作為一種硬件可重構(gòu)的體系結(jié)構(gòu),FPGA經(jīng)常被用作專用芯片(ASIC)的小批量替代品,隨著全球數(shù)據(jù)中心的大規(guī)模部署,以及人工智能應用的落地,F(xiàn)PGA憑借強大的計算能力和高度的靈活性有了更多的用武之地。
FPGA最大的優(yōu)勢就是處理速度快,因為引腳比較多,而且其邏輯單元可以根據(jù)算法需求重組而產(chǎn)生定制化的數(shù)據(jù)通路,非常適合處理大批量的數(shù)據(jù)流。
簡單來說,CPU中有控制取指、譯碼等流程,數(shù)據(jù)處理流程復雜;而FPGA是可編程的,每個邏輯單元的功能在重編程(燒寫)時就已經(jīng)確定,不需要指令。其實FPGA和GPU內(nèi)都有大量的計算單元,計算能力都很強,但是GPU在數(shù)據(jù)處理過程中,需要反復調(diào)取片外存儲器中的數(shù)據(jù),F(xiàn)PGA只要數(shù)據(jù)一次性流入再流出,算法就完成了,因此在批量數(shù)據(jù)處理方面,F(xiàn)PGA完勝。
正是因為數(shù)據(jù)處理的優(yōu)勢,F(xiàn)PGA在數(shù)據(jù)中心加速和AI推理中成了香餑餑,銷量大漲,2018年全球FPGA市場達到了60億美金,MRFR預測FPGA在2025年有望達到約125.21億美元,Xilinx也預估數(shù)據(jù)中心對芯片的需求在未來五年將有67%的年復合增長率。
FPGA是否能夠獨立部署?
雖然FPGA有很強的計算能力,但是在數(shù)據(jù)中心都是和CPU協(xié)同工作,采用“CPU+FPGA”的異構(gòu)架構(gòu)進行加速。隨著FPGA應用范圍的增加,業(yè)內(nèi)有人也提出,未來FPGA是否會脫離CPU獨立部署?
賽靈思數(shù)據(jù)中心業(yè)務部產(chǎn)品規(guī)劃和市場營銷總監(jiān)Jamon Bowen在接受與非網(wǎng)記者的采訪中,用一個應用案例做了解釋,“這是合作伙伴開發(fā)的一個存儲盒的解決方案,采用了Alveo U50,其前端是以太網(wǎng),后端是固態(tài)硬盤,其中加速IP和存儲幾乎是放在了同一個空間里,有意思的是這個系統(tǒng)沒有CPU,是加速器和外圍直接連到網(wǎng)絡上,所以未來數(shù)據(jù)中心會被異構(gòu)計算驅(qū)動,沒有必要和這個系統(tǒng)連在同一個地方,也就是因為執(zhí)行的處理器的高性能,深度學習、存儲、加速等就沒有必要進行本地連接,可以做異地系統(tǒng)連接,這也預示著未來數(shù)據(jù)中心一個布局的趨勢?!?/p>
在終端,有些自動駕駛公司的車上系統(tǒng)中就采用了FPGA 完成一些實時檢測識別任務。小鵬汽車的副總裁、機器學習專家谷俊麗女士曾經(jīng)提到,F(xiàn)PGA 可以憑借信號處理和低能耗方面的優(yōu)勢,成為一個可靠的第二系統(tǒng),在汽車的第一系統(tǒng)出現(xiàn)失誤的時候,作為安全模式介入進來。
FPGA需要克服的難題
面對未來的大好前景,F(xiàn)PGA廠商自然喜笑顏開,但是FPGA想成為主流,也要克服更大的挑戰(zhàn)。
針對浮點運算,F(xiàn)PGA的計算速度似乎還難以超越GPU。英偉達的Tesla V100 ,在理論上最大運算速度可達15 TFLOPS(萬億次浮點運算/ 秒);搭載英特爾Statix 10的Nallatech 520C,理論最大運算速度為9.2 TFLOPS,功耗約為225 瓦特。英偉達曝光的最新Quadro GV100,能夠提供高達每秒7.4萬億次的雙精度浮點運算性能以及每秒14.8萬億次的單精度浮點運算性能和每秒118.5萬億次的深度學習浮點運算性能,從這一點來看,F(xiàn)PGA追趕GPU還需要一些時日。
另外,F(xiàn)PGA開發(fā)工程師反應,基于FPGA做設計的編譯時間很長,幾乎占到整個工程的80%,而且每次只要修改其中一個參數(shù)都需要重新編譯,造成了調(diào)試效率很低,這也成為FPGA走向主流的一大障礙。
責任編輯:lq6
-
FPGA
+關(guān)注
關(guān)注
1630文章
21781瀏覽量
604913 -
cpu
+關(guān)注
關(guān)注
68文章
10898瀏覽量
212527 -
人工智能
+關(guān)注
關(guān)注
1793文章
47566瀏覽量
239412
發(fā)布評論請先 登錄
相關(guān)推薦
評論