0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(上)

Achronix ? 來源:Achronix ? 作者:黃侖 ? 2021-12-03 11:31 ? 次閱讀

1.概述

隨著互聯(lián)網(wǎng)時代的到來,人類所產(chǎn)生的數(shù)據(jù)發(fā)生了前所未有的、爆炸性的增長。IDC預(yù)測,全球數(shù)據(jù)總量將從2019年的45ZB增長到2025年的175ZB[1]。同時,全球數(shù)據(jù)中近30%將需要實時處理,因而帶來了對FPGA等硬件數(shù)據(jù)處理加速器的需求。如圖1所示。

在這樣的數(shù)據(jù)高速增長的情況下,用于傳輸數(shù)據(jù)的網(wǎng)絡(luò)帶寬和處理數(shù)據(jù)所需要的算力也必須急速增長。傳統(tǒng)的CPU已經(jīng)越來越不堪重負(fù),所以用硬件加速來減輕CPU的負(fù)擔(dān)是滿足未來性能需求的重要發(fā)展方向。未來的硬件發(fā)展需求對于用于加速的硬件平臺提出了越來越高的要求,可以概括為三個方面:算力、數(shù)據(jù)傳輸帶寬和存儲器帶寬。Achronix的新一代采用臺積電7nm工藝的Speedster 7t FPGA芯片根據(jù)未來硬件加速和網(wǎng)絡(luò)加速的需求,在這三個方面都做了優(yōu)化,消除了傳統(tǒng)FPGA的瓶頸。下面我們重點說一說為了提高存儲器帶寬,Achronix通過采用硬核GDDR6控制器所帶來的優(yōu)勢。2.

GDDR6的發(fā)展

在GDDR的設(shè)計之初,其定位是針對圖形顯示卡所特別優(yōu)化的一種DDR內(nèi)存。因為2000年后電腦游戲特別是3D游戲的發(fā)展和火爆,使運行電腦游戲的顯卡需要有大量的高速圖像數(shù)據(jù)交互需求,GDDR在這種情況下應(yīng)運而生。第一個GDDR標(biāo)準(zhǔn)是基于DDR的GDDR2,隨后發(fā)展到了基于DDR3的GDDR5,在一段時間中非常流行。

2016年,GDDR5X正式發(fā)布,它引入了具有16n預(yù)取的四倍數(shù)據(jù)速率模式,但代價是訪問粒度從GDDR5的32Byte提高到了64Byte。2018年,GDDR6發(fā)布,數(shù)據(jù)速率達(dá)到了16Gbps,帶寬幾乎是GDDR5X的兩倍,同時采用了雙通道設(shè)計,訪問粒度和GDDR5一樣是32Byte。

3.GDDR6和DDR4/5的比較

GDDR一直以來是針對圖形顯示卡所優(yōu)化的一種DDR內(nèi)存。因為顯卡處理圖像數(shù)據(jù),特別是3D圖像數(shù)據(jù)對顯存帶寬的要求更高,GPU和GDDR之間的數(shù)據(jù)交換非常頻繁。而DDR內(nèi)存專注于與CPU進(jìn)行數(shù)據(jù)交換的效率,因此對于整體存取性能、低延遲更為看重,所以在CPU和傳統(tǒng)的FPGA中基本都是用DDR4。

隨著硬件加速需求對于存儲器的帶寬提出了越來越高的要求,傳統(tǒng)的DDR4帶寬顯然已經(jīng)無法滿足要求,Achronix看重了GDDR6在數(shù)據(jù)存儲中的帶寬優(yōu)勢,創(chuàng)新地將GDDR6引入到了FPGA,徹底解決了傳統(tǒng)FPGA存儲帶寬不夠的瓶頸。2020年7月15日,JEDEC存儲協(xié)會正式發(fā)布了DDR5 SDRAM的標(biāo)準(zhǔn)(JESD79-5),內(nèi)存的頻率相對DDR4的標(biāo)準(zhǔn)頻率有了大幅的提升,總傳輸帶寬也提升了38%,但是還是和GDDR6的帶寬有一定的差距。GDDR6和DDR4/5的帶寬對比。

473c6de8-52b8-11ec-b2e9-dac502259ad0.png

圖2 GDDR與DDR帶寬發(fā)展對比

如果實現(xiàn)同一個大帶寬存儲的應(yīng)用,在提供相同的存儲器帶寬的情況下,無論在設(shè)計復(fù)雜度,PCB占用面積,還是在功耗方面,與DDR4相比,GDDR6的性能都有很大的提高,如圖3所示[2]。

476b1eae-52b8-11ec-b2e9-dac502259ad0.png

圖3 GDDR6和DDR4性能對比4.

GDDR6和HBM2的比較

HBM全稱High Bandwidth Memory,最初的標(biāo)準(zhǔn)是由JEDEC在2013年發(fā)布。2016年1月,HBM的第二代HBM2正式成為工業(yè)標(biāo)準(zhǔn)。HBM的出現(xiàn)也是為了解決存儲器帶寬問題。與GDDR6不同的是,HBM內(nèi)存一般是由4個或者8個HBM的Die堆疊形成,我們稱之為一個Stack。如圖4所示[4]。

4793243a-52b8-11ec-b2e9-dac502259ad0.png

圖4 HBM Die的堆疊

我們以市面上帶有HBM2的高端 FPGA為例,這個系列的FPGA集成了1~2個這樣的HBM2 Stack。兩個Stack之間是相互獨立的,各自有自己的地址空間。

每個Die都有獨立的兩個128bit的Channel,所以4個Die 8個通道就是1024bit的位寬,HBM2的頻率是900MHz,按DDR的方式訪問,一個Stack總共帶寬是 900(MHz)x 2(DDR)x 1024(位寬)/8 = 230GB/s,兩個Stack最高可以到460GB/s的帶寬。

Achronix的Speedster 7t FPGA集成了8個GDDR6的硬核,每個GDDR6的硬核支持雙通道??偟膸捠?16Gbps x 16(位寬)x 2(通道)x 8(控制器)/8 = 512 GB/s,略高于帶HBM2的FPGA存儲器帶寬。

從成本上來看,目前GDDR6與HBM2相比有著很大的優(yōu)勢,HBM2技術(shù)工藝要求高,目前芯片的良率和產(chǎn)量都會受到很大的影響。同時GDDR6使用起來更靈活,使用片外的DRAM,可以根據(jù)應(yīng)用要求,選擇不同速率,不同容量的GDDR6顆粒。HBM2的優(yōu)勢在于集成度高,不占用PCB板的面積。圖5是DDR4、GDDR6和HBM2在成本上的一個綜合比較。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21736

    瀏覽量

    603372
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7492

    瀏覽量

    163833
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    929

    瀏覽量

    40922
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    0

    文章

    380

    瀏覽量

    14758

原文標(biāo)題:GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(上)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    下一代高端顯卡標(biāo)配,容量和速度雙翻倍的GDDR7登場!

    電子發(fā)燒友網(wǎng)報道(文/周凱揚)要說起GPU的話,對其性能的一部分定義在其處理單元,比如英偉達(dá)的CUDA核心,或是AMD的CU等。然而還有一部分決定性能的因素在其片VRAM
    的頭像 發(fā)表于 03-08 09:04 ?1803次閱讀
    下一代高端顯卡標(biāo)配,容量和速度雙翻倍的<b class='flag-5'>GDDR</b>7登場!

    HBM與GDDR內(nèi)存技術(shù)全解析

    在高性能圖形處理領(lǐng)域,內(nèi)存技術(shù)起著至關(guān)重要的作用。本文介紹兩種主要的圖形內(nèi)存技術(shù):高帶寬內(nèi)存(HBM)和圖形雙倍數(shù)據(jù)速率(GDDR),它們在架構(gòu)、性能特性和應(yīng)用場景
    的頭像 發(fā)表于 11-15 10:47 ?938次閱讀
    HBM與<b class='flag-5'>GDDR</b>內(nèi)存技術(shù)全解析

    MXM 3.1 Type A GPU模塊MXM-ACMA:驅(qū)動人工智能的性能標(biāo)桿

    研揚科技推出了基于IntelArcA系列顯卡的MXM3.1TypeA顯卡模塊MXM-ACMA,為用戶提供強大而高效的圖形加速功能。該模塊配備了4GB的GDDR6顯存、支持光線追蹤技術(shù)以及
    的頭像 發(fā)表于 08-30 12:02 ?422次閱讀
    MXM 3.1 Type A GPU模塊MXM-ACMA:驅(qū)動人工智能的<b class='flag-5'>性能</b>標(biāo)桿

    英偉達(dá)推出搭載GDDR6顯存的GeForce RTX 4070顯卡

    面對全球GDDR6X顯存供應(yīng)的嚴(yán)峻挑戰(zhàn),英偉達(dá)今日宣布了一項靈活應(yīng)變的市場策略:正式推出搭載GDDR6顯存的GeForce RTX 4070顯卡,旨在有效緩解市場對這一熱門型號顯卡的急切渴望。此舉
    的頭像 發(fā)表于 08-21 15:09 ?578次閱讀

    電源紋波測試帶寬設(shè)置的應(yīng)用

    電源紋波測試是電子設(shè)備設(shè)計和制造過程中的一個重要環(huán)節(jié),它可以幫助我們評估電源系統(tǒng)的穩(wěn)定性和可靠性。在進(jìn)行電源紋波測試時,帶寬設(shè)置是一個關(guān)鍵因素,它直接影響測試結(jié)果的準(zhǔn)確性和可靠性。 一
    的頭像 發(fā)表于 08-02 09:50 ?586次閱讀

    基于FPGA的陣列相機(jī)的實時監(jiān)測和大容量存儲

    的實時存儲,下載,查詢,清空等功能。 2.2 各模塊介紹 2.2.1 GPU + A7 100t 交互處理模塊 本模塊完成了整個 FPGA 系統(tǒng)的主控和與 GPU 之間的通信
    發(fā)表于 06-20 20:10

    美光出樣業(yè)界容量密度最高新一代 GDDR7 顯存

    β(1-beta)DRAM 技術(shù)和創(chuàng)新架構(gòu),以優(yōu)化的功耗設(shè)計打造了速率高達(dá) 32 Gb/s 的高性能內(nèi)存。美光 GDDR7 的系統(tǒng)帶寬超過 1.5 TB/s,2?較 GDDR6 提升高
    的頭像 發(fā)表于 06-05 16:52 ?1028次閱讀

    美光出樣用于游戲和人工智能的新一代顯存

    設(shè)計打造了速率高達(dá) 32 Gb/s 的高性能內(nèi)存。美光 GDDR7 的系統(tǒng)帶寬超過 1.5 TB/s,[2] 較 GDDR6 提升高達(dá) 60%,[3]并配備四個獨立通道以優(yōu)化工作負(fù)載,
    發(fā)表于 06-05 15:31 ?880次閱讀
    美光出樣用于游戲和人工智能的新一代顯存

    AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個計算單元?

    因受限 RDNA 3 世代尷尬處境,AMD 下一代 RDNA4 游戲顯卡似乎選擇避開與英偉達(dá)在旗艦級別產(chǎn)品的競爭。據(jù)消息人士 Kepler 透露,AMD 下一代 RDNA4 游戲顯卡將全部采用 18Gbps 的 GDDR6 顯存,而英偉達(dá)則可能使用更強大的
    的頭像 發(fā)表于 04-28 14:29 ?716次閱讀

    中高端FPGA如何選擇

    為了使數(shù)據(jù)傳輸更加高效,Achronix FPGA的Memory資源也是非常力,不管是片Ram還是DDR接口,都比Virtex Ultrascale+有很大
    發(fā)表于 04-24 15:09

    Rambus推GDDR7內(nèi)存控制器IP滿足AI應(yīng)用需求

    據(jù)報道,該公司的 GDDR7 控制器采用 PAM3 信號,運行速度高達(dá) 40 Gbps,能為 GDDR7 存儲器設(shè)備提供 160 GB/s 的吞吐量,相比其自身研發(fā)的GDDR6 控制器
    的頭像 發(fā)表于 04-23 15:52 ?436次閱讀

    Introspect Technology發(fā)布全球首款GDDR7顯存測試系統(tǒng)

    據(jù)悉,Introspect已成功交付M5512 GDDR7顯存測試系統(tǒng),此乃全球首個正規(guī)解決方案,專門針對JEDEC全新的JESD239圖形雙倍數(shù)據(jù)速率(GDDR7)SGRAM規(guī)范。
    的頭像 發(fā)表于 03-28 09:43 ?571次閱讀

    英偉達(dá)、AMD新款顯卡或仍配備2GB GDDR7顯存

    據(jù)悉,現(xiàn)行GDDR6顯存每模塊采用8GB顯存容量,對此,@kopite7kimi援引內(nèi)部消息稱,英偉達(dá)即將發(fā)布的GeForce RTX 5090顯卡并無內(nèi)存翻倍的可能性。
    的頭像 發(fā)表于 03-08 14:54 ?714次閱讀

    三星展示GDDR7技術(shù):優(yōu)化TRX均衡與ZQ校準(zhǔn),提升傳輸速度

    GDDR7將運用PAM3編碼方式,這種介于PAM4和NRZ之間的技術(shù)可提高周期內(nèi)數(shù)據(jù)傳送率,相較NRZ技術(shù)降低了對高總線頻率的依賴,獲得比GDDR6更高性能且能耗更低的特性。
    的頭像 發(fā)表于 01-29 11:20 ?775次閱讀

    三星將展示16Gb GDDR7技術(shù),重點關(guān)注PAM3優(yōu)化TRX均衡和ZQ校準(zhǔn)

    該款高性能的 DRAM 采用 PAM3 編碼技術(shù),兼具 PAM4 和 NRZ 的優(yōu)點,相較于 NRZ,它能夠以更高的數(shù)據(jù)傳輸率運行,且無需過高的內(nèi)存總線頻率,表現(xiàn)優(yōu)于 GDDR6,能耗及成本則低于 GDDR6X。
    的頭像 發(fā)表于 01-29 10:13 ?1034次閱讀