0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于FPGA的異構(gòu)計算是趨勢

SwM2_ChinaAET ? 來源:未知 ? 作者:李倩 ? 2018-04-25 09:17 ? 次閱讀

算起來,人工智能AI)概念已經(jīng)提出60多年了,而最近兩年,得益于智能終端的普及帶來的數(shù)據(jù)爆發(fā)式增長,以及深度學習、神經(jīng)網(wǎng)絡算法的發(fā)展,AI市場受到了空前的關(guān)注,但AI要得以快速普及,還缺少高算力的推動,需要提供更好的硬件加速條件。

2018年4月17日,業(yè)界領(lǐng)先的異構(gòu)加速和業(yè)務卸載方案提供商杭州加速云信息技術(shù)有限公司在京舉辦了科技峰會及新產(chǎn)品發(fā)布會,隆重發(fā)布了四大創(chuàng)新產(chǎn)品(兩個系列硬件加速產(chǎn)品(SC-OPS, SC-VPX)、兩個IP庫 (FDNN, FBLAS))及三大解決方案(深度學習解決方案、高性能計算及數(shù)字信號處理解決方案、邊緣計算解決方案)。

搶先布局異構(gòu)計算

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO鄔剛是學習通信出身,最早跟隨中國程控電話交換機之父鄔江興院士進入通信行業(yè)。兩年之后,他加入了華為負責芯片設計。2007年開始創(chuàng)業(yè),創(chuàng)辦過3家公司,對CPU總線、多核處理器的發(fā)展有著清晰的理解。經(jīng)過多年的積累和對未來市場的預估,2015年9月,鄔剛先生創(chuàng)辦了加速云。

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO 鄔剛

加速云的解決方案可以廣泛應用于深度學習、人工智能、金融、機器視覺等領(lǐng)域。目前已與阿里、騰訊、科大訊飛等多家企業(yè)開展深入合作。

“加速云是從技術(shù)上推導出來的一家公司,起源于2014年我們家迎來第一個小朋友,在陪產(chǎn)過程中形成的一個想法?!?鄔剛先生提及創(chuàng)辦加速云的心路歷程,“在2014年,按照英特爾的發(fā)展,下一步一定是異構(gòu),我們當時認為異構(gòu),要么用GPU,要么用FPGA。英特爾在GPU上有一次失敗嘗試,加上GPU自身功耗太高等問題,F(xiàn)PGA會是異構(gòu)計算的一個理想選擇?!?/p>

事實上,在加速云誕生之初已經(jīng)擁有強大的技術(shù)儲備?;贔PGA來做異構(gòu)計算是鄔剛先生2014年4月就想出來的計劃,直等到2014年10月英特爾在IDF大會上宣布x86+FPGA處理器,他認為這個機會點來了,11月份正式開始研究,到2015年4月,研發(fā)出了第一代原型機,2015年9月開始量產(chǎn),加速云公司隨之注冊。

在深度學習中,做好算法只完成了1/3,在這個團隊里面,既需要很強的實現(xiàn)算法的能力,還要有非常強的工程化能力,這種工程化的能力,包括接口和實現(xiàn)量產(chǎn)的能力?!拔覀冎雷龀鲆粋€東西很容易,但是做好還是挺難的。我們有一個非常小的板卡,迭代了四代,每一次迭代都要花百萬人民幣,因為硬件投入很大,每次迭代有可能只改了一點,我們發(fā)現(xiàn)未來可能存在的一些風險問題,就把它改掉,這是我們團隊特別的地方。我們是一個工程化能力非常強的團隊,整體技術(shù)行不行是我們最重要的考量?!?鄔剛先生介紹。

基于FPGA的異構(gòu)計算是趨勢

目前處于AI大爆發(fā)時期,異構(gòu)計算的選擇主要在FPGA和GPU之間。盡管目前異構(gòu)計算使用最多的是利用GPU來加速,F(xiàn)PGA作為一種高性能、低功耗的可編程芯片,在處理海量數(shù)據(jù)時,F(xiàn)PGA計算效率更高,優(yōu)勢更為突出,尤其在大量服務器部署時,隱形的運營成本會得到顯著降低。

此外,低延遲、確定性延遲,也是FPGA天然的優(yōu)勢。

鄔剛表示:“人工智能已經(jīng)進入我們的生活,但是未來發(fā)展還存在瓶頸,需要硬件技術(shù)和算法方面的突破。異構(gòu)計算是計算架構(gòu)的未來趨勢,而FPGA 是實現(xiàn)異構(gòu)計算的完美選擇。加速云創(chuàng)新的異構(gòu)計算加速平臺解決方案,具有高性能、高效率、低延時特性以及可編程性和遠程可重構(gòu)能力,非常適合云上的彈性業(yè)務的需求。我們希望能夠通過我們的技術(shù),幫助更多的企業(yè)實現(xiàn)深度學習,在大數(shù)據(jù)時代贏得先機。”

全球最高性能FPGA加速卡

SC-OPS是加速云推出的全球首張Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工藝的Stratix10 GX2800 FPGA器件,單板支持12個200維雙精度線性方程求解,運算時間為466us,為x86系統(tǒng)60~120倍性能;單卡可以實現(xiàn)4500幀/S以上圖像分類(采用AlexNet卷積神經(jīng)網(wǎng)絡模型,int16)。

SC-OPS可以廣泛應用于數(shù)據(jù)中心云計算、機器視覺、深度學習、高性能計算、仿真、金融等領(lǐng)域。

全球最高集成度VPX業(yè)務卡

SC-VPX是全球計算密度最高的VPX刀片加速平臺,采用Intel Stratix 10 GX2800器件,兼容GX1650,構(gòu)造業(yè)界先進、靈活、高效的信號處理和深度學習架構(gòu),主要定位高校研究所等單位的雷達、通信、深度學習相關(guān)領(lǐng)域的產(chǎn)品原型快速搭建和算法開發(fā)與應用。

6U整機可以支持92T/50T FLOPS單精度浮點處理能力,整機可以通過交換板互聯(lián)構(gòu)筑更大的系統(tǒng);支持OpenCL、Verilog開發(fā),支持高性能計算庫。

RTL級深度學習加速庫

深度學習加速庫FDNN是國內(nèi)首個支持通用卷積神經(jīng)網(wǎng)絡的FPGA加速庫,基于RTL級代碼,可以提供很高的性能和靈活配置特性。

參數(shù)可配置的深度學習基礎庫:卷積、池化、全連接、非線性函數(shù);兼容CAFFE/TensorFlow模型數(shù)據(jù);常見各種模型:VGG16, Lenet, YOLO, SSD, ResNet。

RTL級高性能數(shù)學加速庫

高性能計算加速庫FBLAS是業(yè)界更高性能的RTL級數(shù)學加速庫。參數(shù)可配的OpenBlas庫Level2/3:矩陣乘、矩陣分解、矩陣求逆,線性方程求解、微分方程求解,三角函數(shù)、非線性求解、超越函數(shù),傅里葉變換。

FDNN是專門為深度學習設計的,F(xiàn)BLAS更多是偏向于數(shù)字信號處理和高性能計算。

三大解決方案

?深度學習加速解決方案-加速云推出一整套基于FPGA的深度學習加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫,滿足客戶對深度學習高性能、靈活性加速要求。為了方便客戶使用高層語言開發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開發(fā)環(huán)境,快速實現(xiàn)用戶自定義的深度學習加速方案。同時加速云也提供快速深度神經(jīng)網(wǎng)絡定制加速服務。

?數(shù)字信號處理解決方案-針對雷達、通信等數(shù)字信號處理系統(tǒng)的要求,結(jié)合Intel最新14nm工藝的 Stratix10 FPGA系列,加速云提供了一套完整的硬件和軟件相結(jié)合的解決方案,實現(xiàn)了高性能矩陣運算(矩陣乘、轉(zhuǎn)置、求逆、QR分解)和超高速FFT(傅立葉變換)。為了方便客戶使用高層語言開發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開發(fā)環(huán)境,快速實現(xiàn)用戶自定義的信號處理加速方案。

?邊緣計算解決方案-加速云智能工控解決方案采用高性能Intel Arria10 GX660器件, 具有模塊化設計,強實時特性和高性能的算法IP加速、完整的OpenCL異構(gòu)開發(fā)環(huán)境,可以實現(xiàn)新一代高性能邊緣計算網(wǎng)關(guān),應用于各種工業(yè)環(huán)境。

加速云最核心的競爭力在于其IP方面,除了用于數(shù)字信號處理和高性能計算的數(shù)學庫FBLAS,以及用于深度學習的FDNN庫,還具有很多接口類的IP(高速通信接口視頻接口)、協(xié)議類IP(壓縮、解壓縮、加解密),研發(fā)團隊在FPGA方面有著十多年的經(jīng)驗,積累了很多相關(guān)的IP。

憑借自身在FPGA上的技術(shù)優(yōu)勢,加速云獲得合作伙伴的大力支持,可以率先拿到英特爾第一批流片的內(nèi)部測試芯片,對加速云保持技術(shù)領(lǐng)先非常重要。

北京站是加速云“加速新科技,驅(qū)動智未來” 科技峰會的首站,接下來加速云將在上海、成都、西安三大城市分享其最新成果。過去兩年,加速云平均每年都有獲得一次融資,據(jù)悉,第三輪融資正在達成。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1643

    文章

    21925

    瀏覽量

    612421
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48485

    瀏覽量

    245211
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5548

    瀏覽量

    122338

原文標題:【市場觀察】異構(gòu)看好FPGA 加速云要為AI高算力加速

文章出處:【微信號:ChinaAET,微信公眾號:電子技術(shù)應用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 2人收藏

    評論

    相關(guān)推薦
    熱點推薦

    RAKsmart智能算力架構(gòu):異構(gòu)計算+低時延網(wǎng)絡驅(qū)動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計算資源池化與超低時延網(wǎng)絡為核心,重構(gòu)AI訓練基礎設施,助力企業(yè)實現(xiàn)訓練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?171次閱讀

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ? 異構(gòu)計算的興起:FPGA與CPU、GPU、ASIC等其他計算單元的融合成為趨勢。通過異構(gòu)計算架構(gòu),F
    發(fā)表于 03-03 11:21

    大數(shù)據(jù)與云計算是干嘛的?

    大數(shù)據(jù)與云計算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲、分析與價值挖掘;云計算通過虛擬化資源池提供彈性計算、存儲及服務能力。兩者結(jié)合,共同賦能企業(yè)決策、業(yè)務創(chuàng)新和效率提升。下面UU云小編將詳細剖析大數(shù)據(jù)與
    的頭像 發(fā)表于 02-20 14:48 ?382次閱讀

    RK3399處理器:高性能多核異構(gòu)計算平臺

    RK3399是一款高性能的多核異構(gòu)計算平臺,集成了強大的CPU、GPU以及豐富的多媒體和接口功能。其獨特的雙Cortex-A72+四Cortex-A53大小核CPU結(jié)構(gòu),使得RK3399在處理復雜
    的頭像 發(fā)表于 02-08 18:04 ?1111次閱讀

    異構(gòu)計算的概念、核心、優(yōu)勢、挑戰(zhàn)及考慮因素

    異構(gòu)計算就像是一支由“多才多藝”處理器組成的團隊,每個成員都有自己的強項和責任。 ? 什么是異構(gòu)計算????? “異構(gòu)計算”指的是在同一個計算平臺中,部署多種不同類型的處理單元(比如
    的頭像 發(fā)表于 01-13 11:43 ?749次閱讀

    融合計算是如何提出來的

    融合計算是微觀和宏觀視角算力提升策略的總結(jié),是三個維度融合(異構(gòu)融合x軟硬件融合x云邊端融合)的統(tǒng)稱,那么融合計算是如何提出來的?為什么融合計算有且僅有三個維度的融合? ? 性能和算力
    的頭像 發(fā)表于 12-10 09:51 ?386次閱讀
    融合<b class='flag-5'>計算是</b>如何提出來的

    【一文看懂】什么是異構(gòu)計算?

    隨著人工智能、深度學習、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計算需求的復雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復雜任務的要求,異構(gòu)計算因此應運而生,成為現(xiàn)代計算領(lǐng)域的一個重要方向。
    的頭像 發(fā)表于 12-04 01:06 ?2319次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>?

    詳解Arm計算平臺的優(yōu)勢

    對于人工智能 (AI) 而言,任何單一硬件或計算組件都無法成為適合各類工作負載的萬能解決方案。AI 貫穿從云端到邊緣側(cè)的整個現(xiàn)代計算領(lǐng)域,為了滿足不同的 AI 用例和需求,一個可以靈活使用 CPU、GPU 和 NPU 等不同計算
    的頭像 發(fā)表于 12-03 16:53 ?638次閱讀

    澎峰科技高性能計算庫PerfIPP介紹

    PerfIPP是專為計算機視覺處理和信號處理設計的優(yōu)化計算庫,計算驅(qū)動層基于OpenCL標準,支持異構(gòu)計算加速。
    的頭像 發(fā)表于 09-02 17:39 ?545次閱讀
    澎峰科技高性能<b class='flag-5'>計算</b>庫PerfIPP介紹

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應用場景

    關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應用場景淺談如下: 優(yōu)勢 異構(gòu)計算能力 : 異構(gòu)雙核設計結(jié)合了RISC-V的高效指令集和
    發(fā)表于 08-31 08:32

    打造異構(gòu)計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設計

    參考設計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設備,標志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進特性,可實現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?514次閱讀
    打造<b class='flag-5'>異構(gòu)計算</b>新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設計

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計算:解鎖算力潛能的新途徑

    范式,智慧地解鎖了計算潛能的新境界。異構(gòu)計算:多元并蓄的智慧之選首先,讓我們揭開異構(gòu)計算的神秘面紗。簡單來說,異構(gòu)計算是指將不同類型的計算
    的頭像 發(fā)表于 07-18 08:28 ?1.5w次閱讀
    <b class='flag-5'>異構(gòu)計算</b>:解鎖算力潛能的新途徑

    智能時代的路,將由異構(gòu)計算鋪就

    AI時代,在計算支持領(lǐng)域,云計算、邊緣計算等相繼崛起,我們能看到的算力形態(tài)逐漸多樣化。同時,在我們看不到的地方,算力需求依然旺盛。隨著“十四五”規(guī)劃的不斷落地,加快數(shù)字化發(fā)展,打造具有國際競爭
    的頭像 發(fā)表于 07-03 08:28 ?408次閱讀
    智能時代的路,將由<b class='flag-5'>異構(gòu)計算</b>鋪就

    目前國產(chǎn)fpga的發(fā)展有哪些趨勢

    如今國產(chǎn)fpga也是如火如荼,請問現(xiàn)在國產(chǎn)fpga芯片的發(fā)展有哪些趨勢呢?
    發(fā)表于 06-30 08:14

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品