在今年的 Hot Chips 2017 會(huì)議上,微軟推出基于 FPGA 的超低延遲計(jì)算平臺(tái) Brainwave,用于在云端加速深度學(xué)習(xí)。該平臺(tái)采用英特爾 Stratix 10 FPGA,經(jīng)測(cè)試得出,Brainwave 不需要任何 batching 就能在大型 GRU(Gated recurrent unit)上達(dá)到 39.5 Teraflops 的性能。
微軟將 DPU 或者 DNN 處理單元合并到 FPGA 中,希望通過(guò)加強(qiáng)深度學(xué)習(xí)網(wǎng)絡(luò)的研究,更快地適應(yīng)其云服務(wù)基礎(chǔ)設(shè)施建設(shè),以應(yīng)對(duì)接近于實(shí)時(shí)的運(yùn)算處理需求。
同樣是在 Hot Chips 大會(huì)上,百度發(fā)布一款 256 核、基于 FPGA 的云計(jì)算加速芯片 XPU,其合作伙伴是著名 FPGA 廠商 Xilinx。XPU 的目標(biāo)是在性能和效率之間實(shí)現(xiàn)平衡,處理多樣化的計(jì)算任務(wù),而 FPGA 本身就擅長(zhǎng)于處理某些特定的計(jì)算。
百度研究員歐陽(yáng)劍表示:「FPGA 是高效的,可以專(zhuān)注于特定計(jì)算任務(wù)。傳統(tǒng) CPU 擅長(zhǎng)通用計(jì)算任務(wù),尤其是基于規(guī)則的計(jì)算任務(wù),同時(shí)非常靈活。GPU 瞄準(zhǔn)了并行計(jì)算,因此有很強(qiáng)大的性能,XPU 則專(zhuān)注于計(jì)算密集型、基于多規(guī)則的多樣化計(jì)算任務(wù),提高效率和性能,并帶來(lái)類(lèi)似 CPU 的靈活性?!?/span>
近兩年隨著人工智能浪潮的到來(lái),讓有些冷門(mén) FPGA 又重新煥發(fā)了生機(jī),其實(shí)各大科技廠商很早就發(fā)現(xiàn)了 FPGA 在 AI 領(lǐng)域所擁有的優(yōu)勢(shì),并開(kāi)始布局。
微軟在 Hot Chips 上展示 Brainwave
早在2015 年,微軟就提出了一種使用 FPGA 加速 Bing 搜索引擎的方案,這些 CPU + FPGA 混合器在當(dāng)年便投入了生產(chǎn)和布置,用以加速 Bing 的頁(yè)面排名功能。去年,亞馬遜 AWS 也推出了基于 FPGA 的云服務(wù) EC2 F1。事實(shí)上,百度、阿里云、騰訊云等巨頭也相繼推出了 FPGA 云服務(wù)。
FPGA 之所以普遍受到業(yè)界的關(guān)注,是源于 2015 年英特爾有史以來(lái)最大的一筆收購(gòu)案 —— 以 167 億美元的價(jià)格收購(gòu) FPGA 大廠 Altera。英特爾判斷, 2020 年 CPU + FPGA 的異構(gòu)計(jì)算將占據(jù)運(yùn)輸局中心市場(chǎng)的三分之一。
和傳統(tǒng)的 CPU 、GPU 相比,F(xiàn)PGA 無(wú)指令、無(wú)需共享內(nèi)存的體系結(jié)構(gòu)可以擁有更高的計(jì)算效率,在處理類(lèi)似矩陣運(yùn)算、圖像處理、機(jī)器學(xué)習(xí)、壓縮、Bing 搜索排序等計(jì)算密集型任務(wù)中有相當(dāng)優(yōu)秀的表現(xiàn)。另外,F(xiàn)PGA 擁有更低的功耗,百度在線上服務(wù)使用的 FPGA 版百度大腦,在同樣的功耗下,其性能是天河二號(hào)超級(jí)計(jì)算機(jī)的十倍以上。
摩爾定律已經(jīng)不再符合現(xiàn)今技術(shù)的發(fā)展?fàn)顟B(tài),而機(jī)器學(xué)習(xí)和 Web 服務(wù)的規(guī)模卻以指數(shù)級(jí)增長(zhǎng),技術(shù)和行業(yè)的快速發(fā)展,對(duì)處理器提出了可被重新編程以適應(yīng)新類(lèi)型計(jì)算任務(wù)的要求,F(xiàn)PGA 正是這樣一種可以重構(gòu)的體系結(jié)構(gòu),而這也是各科技巨頭如此看重 FPGA 的原因。
-
FPGA
+關(guān)注
關(guān)注
1630文章
21794瀏覽量
605110 -
gpu
+關(guān)注
關(guān)注
28文章
4767瀏覽量
129204 -
AI
+關(guān)注
關(guān)注
87文章
31463瀏覽量
269848 -
人工智能
+關(guān)注
關(guān)注
1793文章
47622瀏覽量
239571 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132906
原文標(biāo)題:CPU+GPU 搞不定的機(jī)器學(xué)習(xí)問(wèn)題,微軟和百度都采用 FPGA 解決
文章出處:【微信號(hào):shenzhenware,微信公眾號(hào):深圳灣】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論