0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI計算系統(tǒng)選擇FPGA的六大疑惑與解答

電子工程師 ? 2017-11-24 08:54 ? 次閱讀

這幾天,已經(jīng)退役的AlphaGo又強(qiáng)行刷了一波頭條,不是又跟哪位世界高手對決,而是“新狗”通過無監(jiān)督式學(xué)習(xí),僅用3天時間就戰(zhàn)勝了李世石版的AlphaGo,然后用了21天時間戰(zhàn)勝了柯潔版本AlphaGo。AlphaGo讓我們真真切切地看到了AI計算的強(qiáng)大。

目前,在AI計算平臺使用最廣泛的兩種加速部件是GPUFPGA。GPU可適用于具備計算密集、高并行、SIMD(Single Instruction Multiple Data,單指令多數(shù)據(jù)流)應(yīng)用等特點的深度學(xué)習(xí)訓(xùn)練模型領(lǐng)域,并且GPU創(chuàng)建了包含CNN、DNN、RNN、LSTM以及強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)算法在內(nèi)的應(yīng)用加速平臺和生態(tài)系統(tǒng)。

但是,最近FPGA又頻頻被各AI領(lǐng)域的巨頭看好,比如微軟、百度、科大訊飛都對FPGA應(yīng)用前景有所期待。那么如果讓你選擇FPGA作為AI計算系統(tǒng)的主力軍,你會有什么樣的顧慮?

顧慮

一:FPGA有啥優(yōu)勢?什么樣的場景更適合FPGA?

首先,深度學(xué)習(xí)包含兩個計算環(huán)節(jié),即訓(xùn)練和推理環(huán)節(jié)。GPU在深度學(xué)習(xí)算法模型訓(xùn)練上非常高效,但在推理時對于小批量數(shù)據(jù),并行計算的優(yōu)勢不能發(fā)揮出來。

而FPGA 同時擁有流水線并行和數(shù)據(jù)并行,因此處理任務(wù)時候延遲更低。例如處理一個數(shù)據(jù)包有 10 個步驟,F(xiàn)PGA 可以搭建一個 10 級流水線,流水線的不同級在處理不同的數(shù)據(jù)包,每個數(shù)據(jù)包流經(jīng) 10 級之后處理完成。每處理完成一個數(shù)據(jù)包,就能馬上輸出。通常來說,F(xiàn)PGA 加速只需要微秒級的 PCIe 延遲。當(dāng)Intel 推出通過 QPI快速通道互聯(lián)的 Xeon + FPGA 之后,CPU 和 FPGA 之間的延遲甚至可以降到 100 納秒以下。

其次,F(xiàn)PGA是可編程芯片,算法燒錄更加靈活。目前來看,深度學(xué)習(xí)算法還未完全成熟,算法還在迭代衍化過程中,若深度學(xué)習(xí)算法發(fā)生大的變化,F(xiàn)PGA是軟件定義硬件,可以靈活切換算法,快速切入市場。

未來至少95%的機(jī)器學(xué)習(xí)計算都是用于推斷,只有不到5%是用于模型訓(xùn)練,而FPGA正是強(qiáng)在推斷。大幅提升推斷效率的同時,還能最小限度損失精確性,這正是FPGA的強(qiáng)項。

二:FPGA的計算性能能不能滿足我的需求?

與CPU和GPU不同,F(xiàn)PGA是一種典型的非諾依曼架構(gòu),是硬件適配軟件的模式,它能夠根據(jù)系統(tǒng)資源和算法特征靈活的調(diào)整并行度,達(dá)到最優(yōu)的適配,因此能效比高于CPU和GPU。

三:FPGA的開發(fā)周期得1年以上吧,這不能滿足我的業(yè)務(wù)上線需求?

傳統(tǒng)的FPGA的開發(fā)類似于芯片的開發(fā),采用硬件描述語言(HDL)開發(fā),HDL開發(fā)帶來的問題就會像芯片設(shè)計一樣周期會比較長,從架構(gòu)設(shè)計、到仿真驗證、再到最終完成,需要一年左右的開發(fā)時間。

但是互聯(lián)網(wǎng)的業(yè)務(wù)迭代速度極快,在幾個月時間內(nèi)就可能完成龐大用戶群的積累,因此業(yè)務(wù)對于數(shù)據(jù)中心的要求是“快”—計算力平臺的升級要盡量快地滿足業(yè)務(wù)的發(fā)展,因此FPGA的傳統(tǒng)開發(fā)模式動輒以半年或年為單位的開發(fā)周期難以滿足需求。

為此浪潮嘗試通過OpenCL高級語言開發(fā)方式,它把底層的硬件如總線、IO接口、訪存控制器等和底層軟件如驅(qū)動、函數(shù)調(diào)用等全部封裝,變成標(biāo)準(zhǔn)單元提供上層支持,用戶只需要關(guān)注算法本身,OpenCL開發(fā)的邏輯通過編譯工具直接映射到FPGA中,開發(fā)周期從至少1年縮短至4個月以內(nèi)。四:對于O經(jīng)驗的公司,怎樣快速上線FPGA應(yīng)用?

或許你還是有些顧慮,即時開發(fā)效率大幅提升、開發(fā)周期大大縮短,但是對于技術(shù)和團(tuán)隊儲備不足的中小型AI企業(yè)來說,F(xiàn)PGA仍是“高不可攀”的AI加速部件。

如果,有一種方案能夠?qū)④浖?、算法和硬件板卡整合,以軟硬一體化的形式,提供FaaS(FPGA as a Service)服務(wù)。你還有什么顧慮么?

目前,浪潮正在針對市場上需求最迫切的幾種應(yīng)用場景進(jìn)行算法的移植開發(fā),在圖像壓縮、文本數(shù)據(jù)壓縮及神經(jīng)網(wǎng)絡(luò)加速等應(yīng)用開發(fā)出業(yè)界領(lǐng)先的IP,省去客戶的算法開發(fā)周期,最小化FPGA落地門檻、最大化FPGA落地效率。

神經(jīng)網(wǎng)絡(luò)加速方案:基于F10A的AI線上推理加速方案,針對CNN卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)算法進(jìn)行優(yōu)化和固化,可加速ResNet等神經(jīng)網(wǎng)絡(luò),能夠應(yīng)用于圖片分類、對象檢測和人臉識別等應(yīng)用場景。

實測數(shù)據(jù)顯示,在進(jìn)行ResNet殘差網(wǎng)絡(luò)的圖片識別分類任務(wù)時,F(xiàn)10A加速方案圖片處理速度可達(dá)每秒742張,Top-5識別準(zhǔn)確率達(dá)到99.6%,相比同檔次GPU能效比提升3倍以上。而與通用CPU對比,在處理這種高并行、小計算量的任務(wù)時,F(xiàn)10A的優(yōu)勢將更明顯。

WebP圖片轉(zhuǎn)碼壓縮加速方案:針對圖片數(shù)據(jù)的壓縮應(yīng)用,嵌入基于FPGA計算環(huán)境下的WebP編解碼優(yōu)化算法,通過充分利用硬件流水設(shè)計和任務(wù)級并行,大大提升WebP圖像壓縮編碼算法的處理性能,能夠?qū)崿F(xiàn)JPEG-WebP圖片格式的快速轉(zhuǎn)換,比傳統(tǒng)實現(xiàn)方式的整體處理效率平均高9.13倍左右,最高性能可比CPU提高14倍。

數(shù)據(jù)壓縮加速方案:為解決傳統(tǒng)壓縮架構(gòu)的弊端,浪潮GZip算法加速方案充分利用板卡硬件流水設(shè)計和任務(wù)級并行,大幅提升了壓縮任務(wù)的吞吐量并有效降低CPU的負(fù)載,壓縮率(壓縮率=1-壓縮后文件/壓縮前文件)最高可達(dá)94.8%,壓縮速度達(dá)到1.2GB/s,10倍于傳統(tǒng)方案的壓縮效率。

五:我是做云的,F(xiàn)PGA咋管理?支持虛擬機(jī)么?

FaaS不僅僅是指板卡與軟件算法的一體化服務(wù),同時還可以支持公有云及在線遠(yuǎn)程管理和更新。FPGA解決方案能夠支持動態(tài)邏輯的在線可重構(gòu)、靜態(tài)邏輯的遠(yuǎn)程更新,并且通過優(yōu)化的監(jiān)控管理機(jī)制,提升板卡遠(yuǎn)程監(jiān)控管理的可靠性,通過它們可以實時的監(jiān)控FPGA芯片的溫度、板卡風(fēng)扇轉(zhuǎn)速、板卡內(nèi)存特性等從而調(diào)整FPGA的工作頻率。

同時FPGA也支持虛擬機(jī)的直接訪問,板卡本身也加入了很多RAS(可靠性、可用性、可擴(kuò)展性)特性,如高可靠內(nèi)存訪問等,支持并行(FPP)和串行(AS)雙加載模式,任何一種模式加載出現(xiàn)故障,都可以快速切換到另一種模式加載,保證了板卡大規(guī)模服務(wù)的可用性。

有了這些特性,就可以利用FPGA方案,快速搭建FPGA云所需要的基礎(chǔ)底層計算平臺,不論是對外提供公有云服務(wù),還是對內(nèi)實現(xiàn)FPGA計算力快速分配都能夠既高效又可靠。

六:我可不想當(dāng)小白鼠,有誰用過了?

對于FPGA這種新興的AI計算設(shè)備,“觀望”往往是明智的選擇,畢竟不是每家公司都想要作為新技術(shù)的小白鼠,而當(dāng)有第一個吃螃蟹的人出現(xiàn)后,“跟進(jìn)”則成為“飛豬”的必然之路。

目前,浪潮FPGA已經(jīng)在百度、阿里巴巴、騰訊、網(wǎng)易、科大訊飛取得批量的落地應(yīng)用或深度測試,F(xiàn)PGA在人工智能線上推理的能效優(yōu)勢已經(jīng)得到大部分互聯(lián)網(wǎng)和AI公司的認(rèn)可。

那么,F(xiàn)PGA可以應(yīng)用在哪些領(lǐng)域?我們可以聽聽騰訊云FPGA團(tuán)隊負(fù)責(zé)人怎么說:

在機(jī)器學(xué)習(xí)領(lǐng)域、金融領(lǐng)域、大數(shù)據(jù)領(lǐng)域、基因檢測領(lǐng)域都存在比較大的數(shù)據(jù)量需要分析計算,這些是FPGA可以發(fā)揮高吞吐優(yōu)勢的領(lǐng)域。

網(wǎng)絡(luò)安全領(lǐng)域有更安全、更低延時的需求,這些場景也可以發(fā)揮FPGA低延時的優(yōu)勢。

超大規(guī)模圖像處理,這些圖片的處理都使用FPGA來進(jìn)行處理加速,都可以得到滿意的效果。

現(xiàn)在比較熱門的自然語言處理和語音識別這些也都是FPGA可以發(fā)揮優(yōu)勢的場景。

當(dāng)FPGA成為一種計算力服務(wù),有著高效的硬件、成熟的IP和云化管理,你還在顧慮什么?

未來,CPU+FPGA或許將作為新的異構(gòu)加速模式,被越來越多的應(yīng)用領(lǐng)域采用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21738

    瀏覽量

    603463
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269130

原文標(biāo)題:讓FPGA替代GPU,你會有怎樣的顧慮?

文章出處:【微信號:asmag001,微信公眾號:安全自動化】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    六大PCB布線經(jīng)驗

    六大PCB布線經(jīng)驗
    發(fā)表于 09-21 15:51

    六大PCB布線經(jīng)驗

    六大PCB布線經(jīng)驗
    發(fā)表于 12-26 16:55

    為什么微軟選擇FPGAAI?

    微軟卻全面擁抱FPGA作為AI計算平臺。同時,亞馬遜和百度也是FPGA路線。百度在一個電路板上集成了CPU、GPU和FPGA,稱為“XPU”
    發(fā)表于 08-21 09:50

    Eesof EDA先進(jìn)設(shè)計系統(tǒng)選擇能實現(xiàn)您夢想的設(shè)計

    Eesof EDA先進(jìn)設(shè)計系統(tǒng)選擇能實現(xiàn)您夢想的設(shè)計
    發(fā)表于 09-17 13:58

    如何為未來的系統(tǒng)選擇最好的本地數(shù)據(jù)存儲?

    如何為未來的系統(tǒng)選擇最好的本地數(shù)據(jù)存儲?
    發(fā)表于 05-17 06:31

    系統(tǒng)選擇極佳的緩沖器與ADC組合

    本文主要講述的是為系統(tǒng)選擇極佳的緩沖器與ADC組合 。
    發(fā)表于 05-06 10:01 ?26次下載

    如何為系統(tǒng)選擇最好的緩沖器與ADC組合

    本文主要講述的是如何為系統(tǒng)選擇極佳的緩沖器與ADC組合 。
    發(fā)表于 05-08 10:06 ?7次下載

    如何為通信電源系統(tǒng)選擇整流模塊

    如何為通信電源系統(tǒng)選擇整流模塊 1引言 為一個通信電源系統(tǒng)選擇整流模塊要考慮很多因素。過去,大的壟斷性的電信
    發(fā)表于 07-18 14:03 ?2066次閱讀
    如何為通信電源<b class='flag-5'>系統(tǒng)選擇</b>整流模塊

    示波器使用者的六大常見問題解答

    電路教程相關(guān)知識的資料,關(guān)于示波器使用者的六大常見問題解答
    發(fā)表于 10-10 14:34 ?0次下載

    2020年云計算發(fā)展六大關(guān)鍵詞,以及六大關(guān)鍵詞背后的重要趨勢

    中國信通院云計算與大數(shù)據(jù)研究所副所長栗蔚在會上正式發(fā)布并解讀白皮書,披露了中國信通院基于對云計算市場的長期觀察和研究,總結(jié)出的2020年云計算發(fā)展六大關(guān)鍵詞,以及
    的頭像 發(fā)表于 08-24 11:02 ?1w次閱讀
    2020年云<b class='flag-5'>計算</b>發(fā)展<b class='flag-5'>六大</b>關(guān)鍵詞,以及<b class='flag-5'>六大</b>關(guān)鍵詞背后的重要趨勢

    如何為您的高壓系統(tǒng)選擇合適的電流檢測技術(shù)?

    如何為您的高壓系統(tǒng)選擇合適的電流檢測技術(shù)?
    發(fā)表于 10-31 08:23 ?0次下載
    如何為您的高壓<b class='flag-5'>系統(tǒng)選擇</b>合適的電流檢測技術(shù)?

    倉儲物流電子看板系統(tǒng)選擇

    倉儲物流電子看板系統(tǒng)選擇必須在實物上存放”,“前道工序按照看板取下的順序進(jìn)行生產(chǎn)。”根據(jù)這一規(guī)則,作業(yè)現(xiàn)場的管理人員能夠?qū)ιa(chǎn)的優(yōu)先順序能夠一目了然。并且通過觀察倉儲物流電子看板系統(tǒng)選擇,就能知道后道工序的作業(yè)進(jìn)展、庫存情況等等。因此,我們來探討一下倉儲物流電子看板
    的頭像 發(fā)表于 02-18 13:11 ?968次閱讀
    倉儲物流電子看板<b class='flag-5'>系統(tǒng)選擇</b>

    計算機(jī)視覺六大主要技術(shù)介紹

    本文將對計算機(jī)視覺應(yīng)用中最為廣泛的六大技術(shù)進(jìn)行介紹。
    的頭像 發(fā)表于 07-11 17:06 ?1009次閱讀

    淺談FPGA六大應(yīng)用領(lǐng)域

    FPGA 所能應(yīng)用的領(lǐng)域大概可以分成六大類,下面聽我一一道來。
    發(fā)表于 08-09 10:14 ?733次閱讀

    選擇場效應(yīng)晶體管的六大訣竅

    選擇場效應(yīng)晶體管的六大訣竅
    的頭像 發(fā)表于 12-05 15:51 ?508次閱讀