0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新型的FPGA器件將支持多樣化AI/ML創(chuàng)新進(jìn)程

半導(dǎo)體芯科技SiSC ? 來源:半導(dǎo)體芯科技SiSC ? 作者:半導(dǎo)體芯科技SiS ? 2024-04-02 15:25 ? 次閱讀

作者:郭道正

職務(wù):Achronix半導(dǎo)體中國區(qū)總經(jīng)理

近日舉辦的GTC大會(huì)把人工智能/機(jī)器學(xué)習(xí)AI/ML)領(lǐng)域中的算力比拼又帶到了一個(gè)新的高度,這不只是說明了通用圖形處理器(GPGPU)時(shí)代的來臨,而是包括GPU、FPGA和NPU等一眾數(shù)據(jù)處理加速器時(shí)代的來臨,就像GPU以更高的計(jì)算密度和能效勝出CPU一樣,各種加速器件在不同的AI/ML應(yīng)用或者細(xì)分市場中將各具優(yōu)勢,未來并不是只要貴的而是更需要對的。

此次GTC上新推出的用于AI/ML計(jì)算或者大模型的B200芯片有一個(gè)顯著的特點(diǎn),它與傳統(tǒng)的圖形渲染GPU大相徑庭并與上一代用于AI/ML計(jì)算的GPU很不一樣。在其他算力器件品種中也是如此,AI/ML計(jì)算尤其是推理應(yīng)用需要一種專為高帶寬工作負(fù)載優(yōu)化的新型FPGA,下面我們以Achronix的Speedster7t FPGA芯片為例來看看技術(shù)的演進(jìn)方向,以及在實(shí)際推理應(yīng)用中展現(xiàn)出來的在性價(jià)比和能效比等方面優(yōu)于先進(jìn)GPU的特性。

先來快速看看Speedster7t的產(chǎn)品亮點(diǎn):該器件集成了800K到1500K等效邏輯單元以及326K到692K 6輸入查找表(LUT),高達(dá)120T算力的機(jī)器學(xué)習(xí)處理單元(MLP),同時(shí)還配備了高性能存儲(chǔ)和I/O接口,以及最高可達(dá)190Mb的嵌入式存儲(chǔ)容量。在外部連接接口部署上,Speedster7t包含16個(gè)GDDR6通道,可提供高達(dá)4 Tbps的高速存儲(chǔ)帶寬;32對SerDes通道,支持1-112Gbps的數(shù)據(jù)速率;4個(gè)400G以太網(wǎng)端口(4× 400G或16× 100G)和2個(gè)PCIe Gen5端口,支持16通道(×16)和8通道(×8)配置。

Achronix的Speedster7t FPGA芯片被用戶認(rèn)為非常適合AI/ML推理原因是:足夠的算力,靈活可配的計(jì)算精度;高帶寬大容量低成本的GDDR6(4Tbps帶寬, 32GB容量);革命性的全新二維片上網(wǎng)絡(luò)(2D NoC)路由架構(gòu);靈活通用的芯片間互聯(lián);支持用戶基于該芯片開發(fā)自定義的推理系統(tǒng),比如單板多片F(xiàn)PGA甚至多板互聯(lián)以組成更高性能(如1TBbps/64GB,2TBbps/128GB, 4TBbps/256GB…等更高帶寬和更大容量的計(jì)算存儲(chǔ))以支持更大或超大模型推理部署。

簡而言之,相比傳統(tǒng)的推理算力平臺(tái),Speedster7t FPGA可以提供更高性價(jià)比和能耗比的大模型推理能力;另外,在傳統(tǒng)的FPGA處理功能中,越來越多的用戶在該系統(tǒng)中加入機(jī)器學(xué)習(xí)的能力, Speedster7t FPGA能很好勝任傳統(tǒng)FPGA功能和高性能機(jī)器學(xué)習(xí)融合在一起。

一類創(chuàng)新性的高性能FPGA系列產(chǎn)品

Achronix Speedster?7t系列FPGA基于革命性的FPGA架構(gòu),該架構(gòu)經(jīng)過了高度優(yōu)化提供了高速、高帶寬內(nèi)外連接,可以滿足日益增長的人工智能/機(jī)器學(xué)習(xí)、網(wǎng)絡(luò)密集型和數(shù)據(jù)加速應(yīng)用的需求。Speedster7t系列FPGA芯片具有一個(gè)革命性的全新二維片上網(wǎng)絡(luò),以及一個(gè)針對人工智能/機(jī)器學(xué)習(xí)進(jìn)行優(yōu)化的高密度的機(jī)器學(xué)習(xí)處理單元陣列。通過將FPGA的可編程性與類似ASIC路由架構(gòu)和計(jì)算引擎相結(jié)合,Speedster7t系列提高了高性能FPGA的標(biāo)準(zhǔn)。

全新的二維片上網(wǎng)絡(luò)(2D NoC)提供ASIC級(jí)別的性能

Speedster7t系列FPGA芯片具有革命性的2D NoC,可在整個(gè)FPGA邏輯陣列中傳輸數(shù)據(jù),并將數(shù)據(jù)傳輸?shù)礁咝阅躀/O和內(nèi)存子系統(tǒng),同時(shí)可提供高達(dá)20 Tbps的總帶寬。憑借2D NoC,在Speedster7t FPGA芯片不需要消耗任何可編程邏輯資源的情況下來進(jìn)行數(shù)據(jù)傳輸。在該芯片上的2D NoC提供了20 Tbps的二維片上網(wǎng)絡(luò)總帶寬;該2D NoC不僅覆蓋了芯片全域,而且還連接到各類高速接口和總帶寬高達(dá)4 Tbps的高速存儲(chǔ)接口。

高速接口

無論是支持輸入和輸出的數(shù)據(jù)流,還是存儲(chǔ)緩沖這些數(shù)據(jù),對于高性能計(jì)算、機(jī)器學(xué)習(xí)和硬件加速解決方案而言,都需要在片內(nèi)和片外傳輸數(shù)據(jù)。Speedster7t系列FPGA芯片的架構(gòu)可支持前所未有的帶寬。包括:

400G以太網(wǎng):Speedster7t系列FPGA芯片支持多達(dá)4個(gè)400GbE端口或16個(gè)100GbE端口,通過2D NoC連接到FPGA邏輯。

PCI Express Gen5:Speedster7t系列FPGA芯片配備了多個(gè)PCle Gen5接口,支持速率達(dá)32GT/s。

存儲(chǔ)接口:GDDR6 + DDR4/5

Speedster7t器件是唯一在片上支持GDDR6存儲(chǔ)器的FPGA,以最低的DRAM成本(每存儲(chǔ)位)提供最快的SDRAM訪問速度。Speedster7t系列FPGA芯片具有高達(dá)4 Tbps的GDDR6帶寬,以很低的成本就可提供相當(dāng)于基于HBM的FPGA存儲(chǔ)器帶寬。Speedster7t系列FPGA芯片包括了DDR4/5存儲(chǔ)器接口,以支持更深入的緩沖需求。PHY和控制器支持由JEDEC規(guī)范定義的所有標(biāo)準(zhǔn)功能。

機(jī)器學(xué)習(xí)處理單元

每個(gè)Speedster7t FPGA器件都具有可編程的數(shù)學(xué)計(jì)算單元,這些單元被集成至全新的機(jī)器學(xué)習(xí)處理單元(MLP)模塊中。每個(gè)MLP都是一個(gè)高度可配置的計(jì)算密集型模塊,具有多達(dá)32個(gè)乘法器/累加器(MAC),支持4到24位整數(shù)格式和各種浮點(diǎn)模式,包括Tensorflow的bfloat16格式以及高效的塊浮點(diǎn)格式,大大提高了性能。

MLP模塊包括緊密集成的嵌入式存儲(chǔ)器模塊,以確保機(jī)器學(xué)習(xí)算法將以750 MHz的最高性能運(yùn)行。這種高密度計(jì)算和高性能數(shù)據(jù)傳輸?shù)慕Y(jié)合造就了高性能機(jī)器學(xué)習(xí)處理結(jié)構(gòu),該結(jié)構(gòu)可提供市場上基于FPGA的極高TOPS級(jí)別運(yùn)算能力(TOPS即Tera-Operations Per Second,每秒萬億次運(yùn)算)。

wKgaomYLsuuAQtmXAACXryWEzHM364.jpg

圖中文字說明:Register File - 寄存器文件,F(xiàn)racturable Adder/Accumulator - 可拆分的加法器/累加器,F(xiàn)loat MAC - 浮點(diǎn)乘累加單元(MAC),Memory Cascade in - 存儲(chǔ)器級(jí)聯(lián),Operand Cascade in - 操作數(shù)級(jí)聯(lián)。

設(shè)計(jì)工具支持

Achronix Tool Suite工具套件是一個(gè)支持所有Achronix硬件產(chǎn)品的工具鏈。它可與行業(yè)標(biāo)準(zhǔn)的邏輯綜合和仿真工具結(jié)合使用,從而使FPGA設(shè)計(jì)人員能夠輕松地將其設(shè)計(jì)映射到Speedster7t FPGA器件中。Achronix Tool Suite工具套件包括Synopsys的Synplify Pro的優(yōu)化版本和Achronix Snapshot調(diào)試器。Achronix仿真庫由Siemens EDA的ModelSim、Synopsys的VCS和Aldec的Riviera-PRO提供支持。

展望:在推理等領(lǐng)域幫助開發(fā)者打造綜合性能優(yōu)于先進(jìn)GPU的應(yīng)用

隨著AI/ML技術(shù)在各個(gè)領(lǐng)域開始廣泛走進(jìn)應(yīng)用,Achronix根據(jù)Speedster7t FPGA器件的高性能和高帶寬特性,選擇了推理這一個(gè)應(yīng)用面非常廣的技術(shù)市場方向,與合作伙伴加大了在Speedster7t FPGA器件上的推理算法和IP的研發(fā),以期幫助更多的創(chuàng)新者實(shí)現(xiàn)突破。

該芯片提供了足夠的算力,并利用其片上搭載的二維片上網(wǎng)絡(luò)(2D NoC)和機(jī)器學(xué)習(xí)處理單元(MLP),各種高速接口和GDDR6高帶寬存儲(chǔ)接口,提供了用于大規(guī)模推理應(yīng)用需要的計(jì)算器件內(nèi)外連接、硬件加速和存儲(chǔ)調(diào)用等新技術(shù),從而可以支持開發(fā)者快速去實(shí)現(xiàn)創(chuàng)新。

這個(gè)策略取得了顯著的成果,其中一個(gè)領(lǐng)域是加速自動(dòng)語言識(shí)別(ASR)解決方案,它由搭載Speedster7t FPGA器件的VectorPath加速卡提供支持,運(yùn)行Myrtle.ai提供的基于Achronix FPGA的ASR IP,從而提供業(yè)界領(lǐng)先的、實(shí)時(shí)的、超低延遲的語音轉(zhuǎn)文本功能。運(yùn)行在服務(wù)器中的單張VectorPath加速卡可替代多達(dá)20臺(tái)僅基于CPU的服務(wù)器或10張GPU加速卡。

Speedster7t FPGA的技術(shù)創(chuàng)新為人工智能推理帶來了更高性價(jià)比和更高能效比以及可以讓用戶開發(fā)自定義的推理硬件平臺(tái)和系統(tǒng)。 在ASR實(shí)際性能方面,其出色的超低單詞錯(cuò)誤率和僅有最先進(jìn)GPU解決方案八分之一以下的端到端延遲(包括了預(yù)處理和后處理以及與CPU做數(shù)據(jù)交互的時(shí)間)顛覆了ASR領(lǐng)域。該解決方案可以在標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)框架中使用垂直應(yīng)用特定的或自定義的數(shù)據(jù)集進(jìn)行定制或重新訓(xùn)練。

對于越來越多的其他的推理應(yīng)用,Speedster7t FPGA的獨(dú)創(chuàng)高帶寬架構(gòu)也可以為這些應(yīng)用提供有力的支撐。Achronix正在通過不斷研發(fā),以完善其工具鏈和應(yīng)用生態(tài),將在2024年推出更好的工具來幫助各種推理應(yīng)用的開發(fā),使眾多的用戶更加便捷地使用Speedster7t FPGA器件或者VectorPath加速卡來實(shí)現(xiàn)性價(jià)比和能效提升,而不用去爭搶緊俏的高性能GPU加速卡。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1643

    文章

    21929

    瀏覽量

    612833
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4889

    瀏覽量

    130490
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33769

    瀏覽量

    274543
  • ML
    ML
    +關(guān)注

    關(guān)注

    0

    文章

    149

    瀏覽量

    34941
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2970

    瀏覽量

    3719
收藏 0人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Intel-Altera FPGA:通信行業(yè)的加速引擎,開啟高速互聯(lián)新時(shí)代

    Agilex(高端)、Stratix(高性能)、Arria(中端)、Cyclone(低成本)等系列,滿足從數(shù)據(jù)中心到工業(yè)自動(dòng)多樣化需求。技術(shù)特點(diǎn):可重構(gòu)性:支持“現(xiàn)場編程”,靈活適配AI
    發(fā)表于 04-25 10:19

    滿足多樣化需求的 MCX 連接器解決方案

    面對多樣化的市場需求,MCX 連接器充分發(fā)揮自身優(yōu)勢,為不同行業(yè)量身定制適配的解決方案。展望未來,隨著科技的持續(xù)創(chuàng)新與進(jìn)步,MCX 連接器必將繼續(xù)在各個(gè)領(lǐng)域發(fā)揮重要作用,以其可靠的性能為科技發(fā)展注入強(qiáng)勁動(dòng)力,推動(dòng)各行業(yè)邁向新的高度。
    的頭像 發(fā)表于 04-02 13:54 ?158次閱讀
    滿足<b class='flag-5'>多樣化</b>需求的 MCX 連接器解決方案

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    的國產(chǎn)。 5.未來發(fā)展趨勢? 高性能與低功耗并重:未來,FPGA朝著更高性能、更低功耗的方向發(fā)展,以滿足AI應(yīng)用對算力和能效的雙重需求。? 開源硬件與
    發(fā)表于 03-03 11:21

    當(dāng)我問DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    ,這為AI的持續(xù)創(chuàng)新提供了有力支持。 6.數(shù)據(jù)中心與云計(jì)算加速 ? 在云計(jì)算和數(shù)據(jù)中心中,FPGA被用作AI計(jì)算加速器,尤其是針對深度學(xué)習(xí)工
    發(fā)表于 02-19 13:55

    AMD攜多樣化產(chǎn)品組合亮相ISE 2025

    在 ISE 2025 上,AMD 展示其多樣化產(chǎn)品組合,這些產(chǎn)品組合支持多種 AV-over-IP、連接和視頻處理應(yīng)用,同時(shí)還支持基于 AI
    的頭像 發(fā)表于 02-06 11:13 ?572次閱讀

    AI開發(fā)框架集成介紹

    隨著AI應(yīng)用的廣泛深入,單一框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進(jìn)技術(shù)創(chuàng)新的關(guān)鍵路徑。以下,是對AI
    的頭像 發(fā)表于 01-07 15:58 ?396次閱讀

    NVIDIA Isaac Sim滿足模型的多樣化訓(xùn)練需求

    光輪智能借助?NVIDIA Isaac Sim,通過 3D 生成與建模技術(shù)構(gòu)建高度逼真的虛擬場景,現(xiàn)實(shí)世界的復(fù)雜場景抽象并轉(zhuǎn)化為高質(zhì)量的訓(xùn)練數(shù)據(jù)源,從而更有效地滿足模型的多樣化訓(xùn)練需求。 AI
    的頭像 發(fā)表于 11-23 14:55 ?1020次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    高效地篩選出具有潛力的藥物候選分子,加速新藥上市的進(jìn)程。在基因測序與編輯領(lǐng)域,AI技術(shù)提高基因數(shù)據(jù)的處理速度和準(zhǔn)確性,為個(gè)性醫(yī)療和精準(zhǔn)醫(yī)療提供有力
    發(fā)表于 10-14 09:21

    室內(nèi)人行與導(dǎo)航系統(tǒng)有哪些多樣化的功能?

    多樣化的功能設(shè)計(jì),滿足了不同場景下的多元需求。接下來我們一起了解一下關(guān)于室內(nèi)人行與導(dǎo)航系統(tǒng)有哪些多樣化的功能? 一、精準(zhǔn)定位與路徑規(guī)劃 室內(nèi)人行與導(dǎo)航系統(tǒng)核心的功能,室內(nèi)導(dǎo)航系統(tǒng)通過藍(lán)牙、Wi-Fi、RFID、UWB(超寬帶
    的頭像 發(fā)表于 10-09 11:28 ?417次閱讀
    室內(nèi)人行與導(dǎo)航系統(tǒng)有哪些<b class='flag-5'>多樣化</b>的功能?

    英銳恩科技引領(lǐng)微控制器MCU技術(shù)創(chuàng)新,賦能多元應(yīng)用!

    創(chuàng)新之路 英銳恩科技的MCU產(chǎn)品線豐富多樣,涵蓋從8位到32位的多個(gè)系列,滿足了不同行業(yè)、不同應(yīng)用場景的多樣化需求。其中,EN8F1812作為英銳恩的明星產(chǎn)品,是國內(nèi)首顆具有PIC18增強(qiáng)型內(nèi)核的8
    發(fā)表于 09-29 13:40

    基于Achronix Speedster7t FPGA器件AI基準(zhǔn)測試

    架構(gòu)創(chuàng)新,關(guān)注點(diǎn)放在了在所有深度神經(jīng)網(wǎng)絡(luò)處理的核心中添加足夠的計(jì)算能力來支持核心完成矩陣乘法運(yùn)算,同時(shí)靈活使用FPGA的邏輯陣列來實(shí)現(xiàn)AI處理所需的各種其他運(yùn)算。
    的頭像 發(fā)表于 09-18 16:10 ?873次閱讀
    基于Achronix Speedster7t <b class='flag-5'>FPGA</b><b class='flag-5'>器件</b>的<b class='flag-5'>AI</b>基準(zhǔn)測試

    雙路設(shè)計(jì),滿足光伏電站與充電樁多樣化計(jì)量需求——安科瑞丁佳雯

    在當(dāng)今快速發(fā)展的可再生能源與電動(dòng)汽車領(lǐng)域,光伏電站與充電樁的計(jì)量需求日益多樣化且復(fù)雜。為了應(yīng)對這一挑戰(zhàn),DJSF1352-RN電表以其創(chuàng)新的雙路設(shè)計(jì)脫穎而出,成為滿足光伏電站與充電樁多樣化
    的頭像 發(fā)表于 09-09 12:54 ?398次閱讀
    雙路設(shè)計(jì),滿足光伏電站與充電樁<b class='flag-5'>多樣化</b>計(jì)量需求——安科瑞丁佳雯

    射頻器件有哪些?測量射頻器件的標(biāo)準(zhǔn)流程是什么?

    納米軟件NSAT-1000射頻測試系統(tǒng)針對各類射頻器件性能測試提供自動(dòng)測試解決方案,綜合評估射頻器件的穩(wěn)定性和可靠性,為器件的數(shù)據(jù)分析提供多樣化
    的頭像 發(fā)表于 09-04 16:14 ?1100次閱讀
    射頻<b class='flag-5'>器件</b>有哪些?測量射頻<b class='flag-5'>器件</b>的標(biāo)準(zhǔn)<b class='flag-5'>化</b>流程是什么?

    創(chuàng)新科技,精準(zhǔn)導(dǎo)航:大核桃單北斗手持終端的獨(dú)特優(yōu)勢與多樣化應(yīng)用場景

    北斗手持終端”以其獨(dú)特的創(chuàng)新科技與精準(zhǔn)導(dǎo)航能力,正逐步成為市場關(guān)注的焦點(diǎn)。本文深入探討大核桃單北斗手持終端的獨(dú)特優(yōu)勢及其多樣化的應(yīng)用場景,展現(xiàn)其在現(xiàn)代生活中的無
    的頭像 發(fā)表于 08-07 15:57 ?484次閱讀
    <b class='flag-5'>創(chuàng)新</b>科技,精準(zhǔn)導(dǎo)航:大核桃單北斗手持終端的獨(dú)特優(yōu)勢與<b class='flag-5'>多樣化</b>應(yīng)用場景

    DC/AC電源模塊:實(shí)現(xiàn)電力系統(tǒng)的多樣化應(yīng)用

    家庭和商業(yè)建筑到工業(yè)設(shè)備和交通運(yùn)輸,都需要穩(wěn)定可靠的電力供應(yīng)。DC/AC電源模塊為這些需求提供了強(qiáng)大的支持。 DC/AC電源模塊:實(shí)現(xiàn)電力系統(tǒng)的多樣化應(yīng)用 首先,DC/AC電源模塊可以直流電源轉(zhuǎn)換為交流電源,使之能夠適應(yīng)更多的
    的頭像 發(fā)表于 06-18 13:14 ?667次閱讀
    DC/AC電源模塊:實(shí)現(xiàn)電力系統(tǒng)的<b class='flag-5'>多樣化</b>應(yīng)用

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品