0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA與ASIC的完美結(jié)合 Achronix Speedster 7t系列詳解

旺材芯片 ? 來源:yxw ? 2019-06-13 11:06 ? 次閱讀

提起FPGA,可能很多人第一時間都會想到FPGA大廠賽靈思Altera(已經(jīng)被英特爾收購),然而其實還有其他的一些非常有特色的FPGA廠商,比如基于FPGA的硬件加速器件和高性能嵌入式FPGA(eFPGA)半導(dǎo)體知識產(chǎn)權(quán)(IP)公司Achronix。

得益于近年來人工智能/機器學(xué)習(xí)的快速發(fā)展,新的算法不斷的出現(xiàn),這推動了可編程的FPGA市場的快速增長。根據(jù)市場調(diào)研公司SemicoResearch的預(yù)測,AI應(yīng)用中FPGA的市場規(guī)模將在未來4年內(nèi)增長3倍,達(dá)到52億美元。

根據(jù)市場研究機構(gòu)IP Nest近期發(fā)布的最新的IP市場分析報告顯示,Achronix是2018年全球增速最快的IP提供商,同比增長達(dá)到了250%,足見Achronix業(yè)務(wù)增長之迅速。

而為了進一步滿足人工智能/機器學(xué)習(xí)(AI/ML)和高帶寬數(shù)據(jù)加速應(yīng)用日益增長的需求,今年5月,Achronix公司推出了創(chuàng)新性的、全新的FPGA系列產(chǎn)品——Speedster 7t系列。

全新架構(gòu):ASIC和FPGA的完美結(jié)合

我們都知道,對于AI加速來說,相較于我們常見的CPU、GPU等通用型芯片以及可編程的FPGA來說,ASIC芯片的計算能力和計算效率都直接根據(jù)特定的算法的需要進行定制的,所以其可以實現(xiàn)體積小、功耗低、高可靠性、保密性強、計算性能高、計算效率高等優(yōu)勢。所以,在其所針對的特定的應(yīng)用領(lǐng)域,ASIC芯片的能效表現(xiàn)要遠(yuǎn)超CPU、GPU等通用型芯片以及可編程的FPGA。

但是,正如我們前面所提及的是,目前AI算法仍然處在一個不斷的快速更新迭代的階段,數(shù)值精度的可選擇性也越來越多。同時隨著AI的應(yīng)用場景快速發(fā)展演進,新的解決方案都要去應(yīng)對在高性能、靈活和上市時間等方面的不同需求。

而AISC是針對特定的算法加速所設(shè)計的,這也使得其在靈活性上遠(yuǎn)不如可通過編程快速適應(yīng)新的軟件算法的FPGA。但是,F(xiàn)PGA在體積、能效、成本上卻又不如AISC。那么是否能夠有這樣一款產(chǎn)品,能夠很好的將FPGA和ASIC的優(yōu)點結(jié)合在一起呢?Achronix的Speedster 7t系列或許就是這樣一款產(chǎn)品。

Achronix稱,Speedster 7t系列是基于一種高度優(yōu)化的全新架構(gòu),以其所具有的如同ASIC一樣的性能、可簡化設(shè)計的FPGA靈活性和增強功能,從而遠(yuǎn)遠(yuǎn)超越傳統(tǒng)的FPGA解決方案。

▲Achronix CEORobert Blake

Achronix Semiconductor總裁兼首席執(zhí)行官Robert Blake表示:“Speedster7t是Achronix歷史上最令人激動的發(fā)布,代表了建立在四個架構(gòu)代系的硬件和軟件開發(fā)基礎(chǔ)上的創(chuàng)新和積淀,以及與我們領(lǐng)先客戶之間的密切合作。Speedster7t是靈活的FPGA技術(shù)與ASIC核心效率的融合,從而提供了一個全新的‘FPGA+’芯片品類,它們可以將高性能技術(shù)的極限大大提升。”

Speedster7t FPGA系列詳解

根據(jù)Achronix的介紹來看,Speedster7t FPGA系列產(chǎn)品是專為高帶寬應(yīng)用進行設(shè)計的,其具有一個革命性的全新二維片上網(wǎng)絡(luò)(2D NoC,Network on Chip),以及一個高密度全新機器學(xué)習(xí)處理器(MLP)模塊陣列。通過將FPGA的可編程性與ASIC的布線結(jié)構(gòu)和計算引擎完美地結(jié)合在一起,Speedster7t系列產(chǎn)品創(chuàng)造了一類全新的“FPGA +”技術(shù)。

同時,Speedster7t系列產(chǎn)品還包括了高帶寬GDDR6接口、400G以太網(wǎng)端口和PCI Express Gen5等接口,所有這一切單元都互相連接以提供ASIC級帶寬,同時保留FPGA的完全可編程性。

而為了應(yīng)對接收來自多個高速來源的大量數(shù)據(jù),同時還需要將那些數(shù)據(jù)分發(fā)到可編程片上算法性和處理性單元中,然后以盡可能低的延遲來提供那些結(jié)果,所以在制程工藝上,Speedster7t器件選擇了采用臺積電最新的7nm FinFET工藝制造。

全新機器學(xué)習(xí)處理器陣列

對于傳統(tǒng)的帶DSP模塊的FPGA來說,其所能夠提供的AI性能是相對有限的,因為使用DSP模塊只能提供不高效的數(shù)值精度支持,使用外部LUT和內(nèi)存構(gòu)建AI/ML應(yīng)用程序,需要消除額外邏輯編輯和內(nèi)存資源,性能也受FPGA布線限制。

相比之下,Speedster7t FPGA則采用了全新機器學(xué)習(xí)處理器(MLP)中大規(guī)模的可編程計算單元平行陣列,它們可提供業(yè)界最高的、基于FPGA的計算密度。MLP是高度可配置的、計算密集型的單元模塊,每個MAC單元支持最多32個乘法器,可驅(qū)動可變精度加法器/累加器,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。

另外,每個MLP當(dāng)中還緊密耦合了內(nèi)存區(qū)塊,包括72K bits的RAM和2K bits的寄存器。這種運算和存儲級鏈接,使得MLP在不需要使用FPGA布線資源的情況下,實現(xiàn)更復(fù)雜的AI算法。

此外,MLP還與嵌入式存儲器模塊緊密相鄰,通過消除傳統(tǒng)設(shè)計中與FPGA布線相關(guān)的延遲,來確保以750 MHz的最高性能將數(shù)據(jù)傳送到MLP。

這種高密度計算和高性能數(shù)據(jù)傳輸?shù)慕Y(jié)合使得處理器邏輯陣列能夠提供基于FPGA的最高可用計算能力以每秒萬億次運算數(shù)量為單位(TOPS,Tera-OperationsPer Second)。

超高吞吐量的內(nèi)存帶寬和接口

高性能計算和機器學(xué)習(xí)系統(tǒng)的關(guān)鍵之處是高片外存儲器帶寬,從而為多個數(shù)據(jù)流提供存儲源和緩沖。Speedster7t器件是唯一支持GDDR6存儲器的FPGA,該類存儲器是具有最高帶寬的外部存儲器件。每個GDDR6存儲控制器都能夠支持512 Gbps的帶寬,Speedster7t器件中有多達(dá)8個GDDR6控制器,可以支持4 Tbps的GDDR6累加帶寬,并且以很小的成本就可提供與基于HBM的FPGA等效存儲帶寬。

“美光(Micron)樂于攜手Achronix去實現(xiàn)全球第一個面向高帶寬存儲需求而直接加載了GDDR6的FPGA產(chǎn)品,”美光計算與聯(lián)網(wǎng)業(yè)務(wù)部營銷副總裁Mal Humphrey?!跋襁@樣的創(chuàng)新的和可擴展的解決方案將推動人工智能領(lǐng)域內(nèi)的差異化,其中異構(gòu)計算可選方案與高性能的存儲是加速獲得數(shù)據(jù)內(nèi)涵的必需部分?!?/p>

除了這種超高吞吐量的存儲帶寬,Speedster7t器件還包括業(yè)界最高性能的接口端口,以支持極高帶寬的數(shù)據(jù)流。Speedster7t器件擁有多達(dá)72個業(yè)界最高性能的SerDes,可以達(dá)到1到112 Gbps的速度。還有帶有前向糾錯(FEC)的硬件400G以太網(wǎng)MAC,支持4x 100G和8x 50G的配置,以及每個控制器有8個或16個通道的硬件PCI Express Gen5控制器。

“Achronix全新的Speedster7t FPGA系列產(chǎn)品是創(chuàng)新性芯片架構(gòu)實現(xiàn)爆發(fā)的一個卓越案例,創(chuàng)造該架構(gòu)的目的是直接面向AI應(yīng)用處理大量的數(shù)據(jù),”Semico Research公司ASIC和SoC首席市場分析師Rich Wawrzyniak說道?!巴ㄟ^將數(shù)學(xué)函數(shù)、存儲器和可編程性整合到其機器學(xué)習(xí)處理器中,再結(jié)合交叉芯片、二維NoC結(jié)構(gòu),從而形成了消除瓶頸和確保整個器件中數(shù)據(jù)自由流動的絕佳方法。在AI / ML應(yīng)用中,內(nèi)存帶寬就是一切,Achronix的Speedster7t在這一領(lǐng)域提供了令人印象深刻的性能指標(biāo)?!?/p>

全新二維片上網(wǎng)絡(luò):提供超高效率的數(shù)據(jù)移動

來自Speedster7t高速I/O和存儲器端口的數(shù)萬兆比特數(shù)據(jù)量非常的大,傳統(tǒng)的FPGA面向比特位的可編程互連邏輯陣列的路由容量已不能滿足需求,因此Speedster7t架構(gòu)提供了一個可橫跨和垂直跨越FPGA邏輯陣列的創(chuàng)新性的、高帶寬的二維片上網(wǎng)絡(luò)(NOC)。

這個2D NOC可連接到所有FPGA的高速數(shù)據(jù)和存儲器接口。它們就像疊加在FPGA互連這個城市街道系統(tǒng)上的空中高速公路網(wǎng)絡(luò)一樣,Speedster7t的NoC支持片上處理引擎之間所需的高帶寬通信。NoC中的每一行或每一列都可作為兩個256位實現(xiàn),單向的、行業(yè)標(biāo)準(zhǔn)的AXI通道,工作頻率為2GHz,同時可為每個方向提供512 Gbps的數(shù)據(jù)流量。

通過在Speedster中實現(xiàn)專用2D NoC,極大地簡化了高速數(shù)據(jù)移動,并確保數(shù)據(jù)流可以輕松地定向到整個FPGA結(jié)構(gòu)中的任何自定義處理引擎。最重要的是,NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數(shù)據(jù)流中出現(xiàn)的擁塞和性能瓶頸。這種高性能網(wǎng)絡(luò)不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量。

以400G以太網(wǎng)總線帶寬操作所需頻率為例,傳統(tǒng)FPGA的最佳方案是總線大小為1024 bits,但是需要的頻率要達(dá)到724MHz,這在傳統(tǒng)的FPGA中是不可能實現(xiàn)的。顯然,對于任何400G以太網(wǎng)總線帶寬,傳統(tǒng)的FPGA運行速度都不夠快。

相比之下,Speedster7t FPGA則可以通過2D NOC以四個256bits的總線以506MHz的工作頻率來實現(xiàn)。

針對安全性至上和硬件確保應(yīng)用的安全防護功能

Speedster7t FPGA系列產(chǎn)品在面臨第三方攻擊的威脅時,可用最先進的比特流安全保護功能應(yīng)對,它們具有的多層防御能力可保護比特流的保密性和完整性。密鑰是基于防篡改物理不可克隆技術(shù)(PUF)進行加密,比特流由256位的AES-GCM加密算法進行加密和驗證。為了防止來自旁側(cè)信道的攻擊,比特流被分段,每個數(shù)據(jù)段使用單獨導(dǎo)出的密鑰,且解密硬件采用差分功率分析(DPA)計數(shù)器措施。此外,2048位RSA公鑰認(rèn)證協(xié)議被用來激活解密和認(rèn)證硬件。用戶可以確信的是當(dāng)他們加載其安全比特流時,它是預(yù)期的配置,這是因為它已通過RSA公鑰、AES-GCM私鑰和CRC校驗進行了身份驗證。

四款Speedster7t FPGA系列產(chǎn)品

Speedster7t FPGA系列目前共有4款產(chǎn)品,器件的大小范圍為從363K至2.6M 的6輸入查找表(LUT)。

在具體的性能指標(biāo)方面,Achronix透露,Speedster7t FPGA系列種最強的7t1500,在其最高頻率750MHz,80%利用率,每個MLP區(qū)塊支持16×Int8運算的情況下,在ResNet-50訓(xùn)練模型下,可以實現(xiàn)高達(dá)8600張/秒的圖像識別能力;而在Yolov2的算法之下,7t1500亦可實現(xiàn)1600張/秒的圖像識別能力。

據(jù)Achronix CEORobert Blake介紹,支持所有Achronix產(chǎn)品的ACE設(shè)計工具現(xiàn)已可提供,可支持包括Speedcore eFPGA和Speedchip?FPGA多晶粒封裝芯片(Chiplet)。第一批用于評估的Speedster7t FPGA系列器件和開發(fā)板將于2019年第四季度提供。

小結(jié):

從前面的介紹,我們不難看出,Speedster 7t系列FPGA,主要是通過其全新二維片上網(wǎng)絡(luò),以及高密度全新機器學(xué)習(xí)處理器模塊陣列,實現(xiàn)了將FPGA的可編程性與ASIC的布線結(jié)構(gòu)和計算引擎完美地結(jié)合在一起。而這與去年賽靈思推出的全新的ACAP架構(gòu)也有著異曲同工之處。

需要指出的是,Achronix是目前唯一一家既提供獨立FPGA芯片又提供Speedcore?嵌入式FPGA(eFPGA)半導(dǎo)體知識產(chǎn)權(quán)(IP)的公司。也就是說,芯片設(shè)計廠商可以通過購買授權(quán)的形式,將Achronix的Speedcore?嵌入式FPGA(eFPGA)的IP整合到自己的芯片設(shè)計當(dāng)中,設(shè)計出符合自身需求的芯片。

而Achronix在Speedcore eFPGA IP中采用了與Speedster7t FPGA中使用的同一種技術(shù),可支持從Speedster7t FPGA到ASIC的無縫轉(zhuǎn)換。這也意味著芯片設(shè)計廠商通過與Achronix合作,也可以獲得最新的Speedster7t FPGA系列的技術(shù),并可將其轉(zhuǎn)換為ASIC。Achronix CEORobert Blake表示,該技術(shù)有望幫助客戶節(jié)省高達(dá)50%的功耗并降低90%的成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21796

    瀏覽量

    605492
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51157

    瀏覽量

    426623
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    334

    文章

    27693

    瀏覽量

    221885
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1206

    瀏覽量

    120687
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47643

    瀏覽量

    239890

原文標(biāo)題:行業(yè) | FPGA與ASIC的完美結(jié)合,Achronix Speedster 7t系列詳解

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    FPGAASIC的區(qū)別 FPGA性能優(yōu)化技巧

    FPGAASIC的區(qū)別 FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)是兩種不同的集成電路技術(shù),它們在多個方面存在顯著的區(qū)別: FPGA
    的頭像 發(fā)表于 12-02 09:51 ?330次閱讀

    Achronix與BigCat Wireless建立戰(zhàn)略合作伙伴關(guān)系

    Speedster7t FPGA上的創(chuàng)新機器學(xué)習(xí)處理器(MLP)來滿足無線應(yīng)用中先進的信號處理要求,以及支撐未來的6G標(biāo)準(zhǔn)。此次合作旨在通過基于Achronix FPGA
    的頭像 發(fā)表于 11-21 10:58 ?339次閱讀

    Achronix Speedcore eFPGA的特性和功能

    Speedcore嵌入式FPGA(embedded FPGA,eFPGA)知識產(chǎn)權(quán)(IP)產(chǎn)品是Achronix公司于2016年推出的顛覆性技術(shù),并于當(dāng)年開始向最終客戶交付,目前出貨量
    的頭像 發(fā)表于 11-15 14:28 ?398次閱讀
    <b class='flag-5'>Achronix</b> Speedcore e<b class='flag-5'>FPGA</b>的特性和功能

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司聯(lián)合BittWare公司(Molex旗下的領(lǐng)先企業(yè)級FPGA加速器產(chǎn)品供應(yīng)商)推出的一類全新的、面向高性能計算和數(shù)據(jù)加速應(yīng)用的F
    的頭像 發(fā)表于 11-14 11:19 ?363次閱讀

    Xilinx 7系列FPGA PCIe Gen3的應(yīng)用接口及特性

    Xilinx7系列FPGA集成了新一代PCI Express集成塊,支持8.0Gb/s數(shù)據(jù)速率的PCI Express 3.0。本文介紹了7系列
    的頭像 發(fā)表于 11-05 15:45 ?1289次閱讀
    Xilinx <b class='flag-5'>7</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b> PCIe Gen3的應(yīng)用接口及特性

    FPGAASIC的優(yōu)缺點比較

    FPGA(現(xiàn)場可編程門陣列)與ASIC(專用集成電路)是兩種不同的硬件實現(xiàn)方式,各自具有獨特的優(yōu)缺點。以下是對兩者優(yōu)缺點的比較: FPGA的優(yōu)點 可編程性強 :FPGA具有高度的可編程
    的頭像 發(fā)表于 10-25 09:24 ?626次閱讀

    Achronix Speedster7t FPGA與GPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進一步說明硬件平臺的可編程可擴展的重要性,FPGA是其中一個不錯的選擇。
    的頭像 發(fā)表于 09-18 16:19 ?356次閱讀
    <b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>與GPU解決方案的比較

    Primemas選擇Achronix eFPGA技術(shù)用于Chiplet平臺

    高性能 FPGA 和嵌入式FPGA (eFPGA) IP 的領(lǐng)導(dǎo)者 Achronix Semiconductor Corporation 和使用Chiplet 技術(shù)開發(fā)創(chuàng)新 SoC H
    的頭像 發(fā)表于 09-18 16:16 ?589次閱讀

    基于Achronix Speedster7t FPGA器件的AI基準(zhǔn)測試

    Achronix半導(dǎo)體公司推出了為AI優(yōu)化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負(fù)載的強化計算引擎。隨著AI在
    的頭像 發(fā)表于 09-18 16:10 ?610次閱讀
    基于<b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>器件的AI基準(zhǔn)測試

    采用創(chuàng)新的FPGA 器件來實現(xiàn)更經(jīng)濟且更高能效的大模型推理解決方案

    本文根據(jù)完整的基準(zhǔn)測試,將Achronix Semiconductor公司推出的Speedster7t FPGA與GPU解決方案進行比較,在運行同一個Llama2 70B參數(shù)模型時,該項基于F
    的頭像 發(fā)表于 06-19 15:53 ?338次閱讀
    采用創(chuàng)新的<b class='flag-5'>FPGA</b> 器件來實現(xiàn)更經(jīng)濟且更高能效的大模型推理解決方案

    FPGA核心板 Xilinx Artix-7系列XC7A100T開發(fā)平臺,米爾FPGA工業(yè)開發(fā)板

    MYC-J7A100T核心板及開發(fā)板Xilinx Artix-7系列XC7A100T開發(fā)平臺,FPGA工業(yè)芯XC
    發(fā)表于 05-31 15:12 ?10次下載

    中高端FPGA如何選擇

    和Intel在高端FPGA的地位? 1.高速IP AchronixSpeedster7t支持PCIe Gen5和112G Serdes,而AMD的高端系列Virtex
    發(fā)表于 04-24 15:09

    Achronix FPGA增加對Bluespec提供的基于Linux的RISC-V軟處理器的支持,以實現(xiàn)可擴展數(shù)據(jù)處理

    Speedster?7t系列中。這是業(yè)界首創(chuàng),Bluespec的RISC-V處理器現(xiàn)在無縫集成到Achronix的二維片上網(wǎng)絡(luò)(2D NoC)架構(gòu)中,簡化了集成,使工程師能夠輕松地將可
    的頭像 發(fā)表于 04-19 18:08 ?735次閱讀

    fpgaasic的區(qū)別

    FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)是兩種不同類型的集成電路,它們在設(shè)計靈活性、制造成本、應(yīng)用領(lǐng)域等方面有著顯著的區(qū)別。
    的頭像 發(fā)表于 03-26 15:29 ?1848次閱讀

    AchronixFPGA有哪方面的優(yōu)勢?

    AchronixSpeedster7t支持PCIe Gen5和112G Serdes,而AMD的高端系列Virtex Ultrascale+也僅僅支持到PCIe Gen4,也只在最高端的FP
    發(fā)表于 03-18 10:55 ?378次閱讀
    <b class='flag-5'>Achronix</b>的<b class='flag-5'>FPGA</b>有哪方面的優(yōu)勢?