存儲器子系統(tǒng)的主要功能是在云計(jì)算和人工智能 (AI)、汽車和移動等廣泛應(yīng)用中盡可能快速可靠地為主機(jī)(CPU 或 GPU)提供必要的數(shù)據(jù)或指令。片上系統(tǒng) (SoC) 設(shè)計(jì)人員可以選擇多種類型的存儲器技術(shù),每種技術(shù)都具有不同的特性和高級功能。雙數(shù)據(jù)速率 (DDR) 同步動態(tài)隨機(jī)存取存儲器 (SDRAM) 已成為主系統(tǒng)存儲器最主流的存儲器技術(shù),因?yàn)樗褂?a target="_blank">電容器作為存儲元件來實(shí)現(xiàn)高密度和簡單架構(gòu)、低延遲和高性能、無限存取耐力和低功耗。
選擇正確的存儲器技術(shù)通常是實(shí)現(xiàn)最佳系統(tǒng)性能的最關(guān)鍵決策。本文介紹了不同的存儲器技術(shù),旨在幫助 SoC 設(shè)計(jì)人員選擇最適合其應(yīng)用要求的正確存儲器解決方案。
DDR DRAM標(biāo)準(zhǔn)
設(shè)計(jì)人員不斷為他們的 SoC 添加更多內(nèi)核和功能;然而在保持低功耗和較小硅尺寸的同時提高性能仍然是一個至關(guān)重要的目標(biāo)。DDR SDRAM(簡稱 DRAM)通過在雙列直插式存儲模塊 (DIMM) 或分立式 DRAM 解決方案中提供密集、高性能和低功耗的存儲器解決方案,以滿足此類存儲器要求。JEDEC 定義并開發(fā)了以下三種 DRAM 標(biāo)準(zhǔn)類別,幫助設(shè)計(jì)人員滿足目標(biāo)應(yīng)用的功耗、性能和規(guī)格要求:
標(biāo)準(zhǔn) DDR?面向服務(wù)器、云計(jì)算、網(wǎng)絡(luò)、筆記本電腦、臺式機(jī)和消費(fèi)類應(yīng)用,支持更寬的通道寬度、更高的密度和不同的形狀尺寸。自 2013 年以來,DDR4 一直是這一類別中最常用的標(biāo)準(zhǔn);預(yù)計(jì) DDR5 設(shè)備會在不久的將來上市。
移動 DDR?面向移動和汽車這些對規(guī)格和功耗非常敏感的領(lǐng)域,提供更窄的通道寬度和多種低功耗運(yùn)行狀態(tài)。今天最主流的標(biāo)準(zhǔn)是 LPDDR4,預(yù)計(jì)在不久的將來會推出 LPDDR5 設(shè)備。
圖形 DDR?面向需要極高吞吐量的數(shù)據(jù)密集型應(yīng)用程序,例如圖形相關(guān)應(yīng)用程序、數(shù)據(jù)中心加速和 AI。圖形 DDR (GDDR) 和高帶寬存儲器 (HBM) 是這一類型的標(biāo)準(zhǔn)。
上述三種 DRAM 類別使用相同的 DRAM 陣列進(jìn)行存儲,以電容器作為基本存儲元件。但是,每個類別都提供獨(dú)特的架構(gòu)功能,旨在最好地滿足目標(biāo)應(yīng)用程序的要求。這些功能包括數(shù)據(jù)速率和數(shù)據(jù)寬度自定義、主機(jī)和 DRAM 之間的連接選項(xiàng)、電氣規(guī)格、I/O(輸入/輸出)端接方案、DRAM 電源狀態(tài)、可靠性特性等。圖 1 展示了 JEDEC 的三類 DRAM 標(biāo)準(zhǔn)。
圖 1:JEDEC 定義了三類 DRAM 標(biāo)準(zhǔn),以滿足各種應(yīng)用的設(shè)計(jì)要求
標(biāo)準(zhǔn) DDR
標(biāo)準(zhǔn) DDR DRAM 在企業(yè)服務(wù)器、數(shù)據(jù)中心、筆記本電腦、臺式機(jī)和消費(fèi)類應(yīng)用等應(yīng)用領(lǐng)域隨處可見,可提供高密度和高性能。DDR4 是這一類別中最常用的標(biāo)準(zhǔn),與其前代產(chǎn)品 DDR3 和 DDR3L(DDR3 的低功耗版本)相比具有多項(xiàng)性能優(yōu)勢:
與運(yùn)行速度最高為 2133Mbps 的 DDR3 相比,它的數(shù)據(jù)速率更高,最高可達(dá) 3200Mbps
工作電壓更低(相較于 DDR3 的 1.5V 和 DDR3L 的 1.35V,它只有 1.2V)
性能更高(例如存儲體組)、功耗更低(例如數(shù)據(jù)總線反轉(zhuǎn)),并且可靠性、可用性和可維護(hù)性 (RAS) 特性更優(yōu)(例如包裝后修復(fù)和數(shù)據(jù)循環(huán)冗余檢查)
由于各個 DRAM 晶圓尺寸從 4Gb 增加到 8Gb 和 16Gb,因此密度更高
正在 JEDEC 開發(fā)的 DDR5 預(yù)計(jì)將在 1.1V 的工作電壓下將運(yùn)行數(shù)據(jù)速率提高到 4800Mbps。DDR5 新增多種架構(gòu)和 RAS 特性,可有效處理這些高速運(yùn)行,同時盡量縮短因存儲器錯誤導(dǎo)致的系統(tǒng)停機(jī)時間。模塊上的集成穩(wěn)壓器、更好的刷新方案、旨在提高通道利用率的架構(gòu)、DRAM 上的內(nèi)部糾錯碼 (ECC)、用于提高性能的更多存儲體組以及更高的容量只是 DDR5 的一小部分關(guān)鍵特性。
移動 DDR
與標(biāo)準(zhǔn) DDR DRAM 相比,移動 DDR(也稱為低功耗 DDR (LPDDR) DRAM)具有一些可以降低功耗的附加功能,而降低功耗正是移動/電池供電應(yīng)用(如平板電腦、移動電話和汽車系統(tǒng),以及 SSD 卡)的核心要求。LPDDR DRAM 可以比標(biāo)準(zhǔn) DRAM 運(yùn)行得更快,以實(shí)現(xiàn)高性能并提供低功耗狀態(tài),幫助提高電源效率和延長電池壽命。
與標(biāo)準(zhǔn) DDR DRAM 通道(64 位寬)相比,LPDDR DRAM 通道通常為 16 位或 32 位寬。與標(biāo)準(zhǔn) DRAM 產(chǎn)品一樣,每個連續(xù)的 LPDDR 標(biāo)準(zhǔn)產(chǎn)品都瞄準(zhǔn)了比其前代產(chǎn)品更高的性能和更低的功耗目標(biāo),并且任何兩個 LPDDR 產(chǎn)品都不會彼此兼容。
LPDDR4 是這個類別中最常用的標(biāo)準(zhǔn),在 1.1V 的工作電壓下的數(shù)據(jù)速率最高可達(dá) 4267Mbps。LPDDR4 DRAM 通常是雙通道設(shè)備,支持兩個 x16(16 位寬)通道。各個通道都是獨(dú)立的,因此具有自己的專用命令/地址 (C/A) 引腳。雙通道架構(gòu)為系統(tǒng)架構(gòu)人員提供了靈活性,同時將 SoC 主機(jī)連接到 LPDDR4 DRAM。
LPDDR4X 是 LPDDR4 的一種變體,與 LPDDR4 完全相同,只是能夠通過將 I/O 電壓 (VDDQ) 從 1.1 V 降低到 0.6 V 來額外降低功耗。LPDD4X 設(shè)備也可以實(shí)現(xiàn)高達(dá) 4267Mbps 的速率。
LPDDR5 是 LPDDR4/4X 的后續(xù)產(chǎn)品,預(yù)計(jì)運(yùn)行速率高達(dá) 6400Mbps,并且正在 JEDEC 進(jìn)行積極開發(fā)。LPDDR5 DRAM 有望提供許多新的低功耗和可靠性特性,使其成為移動和汽車應(yīng)用的理想選擇。其中一種重要特性就是用于延長電池壽命的“深度睡眠模式”,有望顯著節(jié)省空閑條件下的功耗。此外,還有一些新的架構(gòu)特性使 LPDDR5 DRAM 能夠以低于 LPDDR4/4X 的工作電壓在此類高速條件下無縫運(yùn)行。
圖形 DDR
針對高吞吐量應(yīng)用(例如顯卡和 AI)的兩種不同的存儲器架構(gòu)是 GDDR 和 HBM。
GDDR 標(biāo)準(zhǔn)
GDDR DRAM 是專為圖形處理器 (GPU) 和加速器設(shè)計(jì)的。數(shù)據(jù)密集型系統(tǒng)(如顯卡、游戲控制臺和高性能計(jì)算,包括汽車、AI 和深度學(xué)習(xí))是 GDDR DRAM 設(shè)備常用的一些應(yīng)用。GDDR 標(biāo)準(zhǔn) (GDDR6/5/5X) 被架設(shè)為點(diǎn)對點(diǎn) (P2P) 標(biāo)準(zhǔn),能夠支持高達(dá) 16Gbps 的速率。GDDR5 DRAM 一直用作離散的 DRAM 解決方案,能夠支持高達(dá) 8Gbps 的速率,經(jīng)過配置后可在設(shè)備初始化期間檢測到的 ×32 模式或 ×16(折疊)模式下運(yùn)行。
GDDR5X 的目標(biāo)是每個引腳的傳輸速率為 10 到 14Gbps,幾乎是 GDDR5 的兩倍。GDDR5X 和 GDDR5 DRAM 的主要區(qū)別在于 GDDR5X DRAM 擁有的預(yù)加載為 16N,而不是 8N。與 GDDR5 每個芯片使用 170 個引腳相比,GDDR5X 每個芯片使用 190 個引腳。因此,GDDR5 和 GDDR5X 標(biāo)準(zhǔn)需要不同的 PCB。GDDR6 是最新的 GDDR 標(biāo)準(zhǔn),支持在 1.35V 的較低工作電壓下運(yùn)行高達(dá) 16Gbps 的更高數(shù)據(jù)速率,而 GDDR5 需要 1.5V 才能達(dá)到該速率。
HBM/HBM2 標(biāo)準(zhǔn)
HBM 是 GDDR 存儲器的替代品,可用于 GPU 和加速器。GDDR 存儲器旨在以較窄的通道提供更高的數(shù)據(jù)速率,進(jìn)而實(shí)現(xiàn)必要的吞吐量,而 HBM 存儲器通過 8 條獨(dú)立通道解決這一問題,其中每條通道都使用更寬的數(shù)據(jù)路徑(每通道 128 位),并以 2Gbps 左右的較低速度運(yùn)行。因此,HBM 存儲器能夠以更低的功耗提供高吞吐量,而規(guī)格上比 GDDR 存儲器更小。HBM2 是目前該類別中最常用的標(biāo)準(zhǔn),支持高達(dá) 2.4Gbps 的數(shù)據(jù)速率。
HBM2 DRAM 最多可疊加 8 個 DRAM 晶圓(包括一個可選的底層晶圓),可提供較小的硅片尺寸。晶圓通過 TSV 和微凸塊相互連接。通常可用的密度包括每個 HBM2 封裝 4 或 8GB。
除了支持更多的通道外,HBM2 還提供了一些架構(gòu)更改,以提高性能并減少總線擁塞。例如,HBM2 具有“偽通道”模式,該模式將每個 128 位通道分成兩個 64 位的半獨(dú)立子通道。它們共享通道的行和列命令總線,卻單獨(dú)執(zhí)行命令。增加通道數(shù)量可以通過避免限制性時序參數(shù)(例如 tFAW)以在每單位時間激活更多存儲體,從而增加整體有效帶寬。標(biāo)準(zhǔn)中支持的其他功能包括可選的 ECC 支持,可為每 128 位數(shù)據(jù)啟用 16 個錯誤檢測位。
預(yù)計(jì) HBM3 將在幾年內(nèi)上市,并提供更高的密度、更大的帶寬 (512GB/s)、更低的電壓和更低的成本。表 1 顯示了 GDDR6 和 HBM2 DRAM 的高級別比較結(jié)果:
表格 1:GDDR6 和 HBM2 為系統(tǒng)架構(gòu)人員帶來獨(dú)特的優(yōu)勢
AMD認(rèn)為GDDR5無法跟上GPU性能的增長速度,同時,GDDR5不斷上升的功耗可能很快就會大到阻止圖形性能的增長。相比之下,GDDR5需要更多的芯片和電路電壓才能達(dá)到高帶寬。
NAND、DRAM和Optics等技術(shù)將受益于片上集成技術(shù),而且在技術(shù)上并不兼容。HBM是一種低功耗、超寬帶通信通道的新型存儲芯片。它使用垂直堆疊的存儲芯片,通過被稱為“硅透”(TSV)的線相互連接,HBM突破了現(xiàn)有的性能限制。
此外,HBM相比GDDR5,減少了通信成本,單位帶寬能耗更低,制作工藝更高,所以極大減少晶元空間。
總結(jié)
為了提供具有獨(dú)特功能和優(yōu)勢的各種 DRAM 技術(shù),JEDEC 為 DDR 定義并制定了三大類標(biāo)準(zhǔn):標(biāo)準(zhǔn) DDR、移動 DDR 和圖形 DDR。標(biāo)準(zhǔn) DDR 面向服務(wù)器、數(shù)據(jù)中心、網(wǎng)絡(luò)、筆記本電腦、臺式機(jī)和消費(fèi)類應(yīng)用,支持更大的通道寬度、更高的密度和不同的外形尺寸。移動 DDR 或 LPDDR 面向非常注重規(guī)格和功耗的移動和汽車應(yīng)用,提供更窄的通道寬度和幾種低功耗 DRAM 狀態(tài)。圖形 DDR 面向需要極高吞吐量的數(shù)據(jù)密集型應(yīng)用。JEDEC 已將 GDDR 和 HBM 定義為兩種圖形 DDR 標(biāo)準(zhǔn)。SoC 設(shè)計(jì)人員可以在各種存儲器解決方案或標(biāo)準(zhǔn)中挑選,以滿足其目標(biāo)應(yīng)用的需求。選定的存儲器解決方案會影響其 SoC 的性能、功耗和規(guī)格要求。
審核編輯:湯梓紅
評論
查看更多