芯片制造商開始在同一個(gè)高級封裝中集成多種類型和風(fēng)格的DRAM,為日益分布式的存儲器和更復(fù)雜的設(shè)計(jì)創(chuàng)造了條件。
盡管多年來一直有人預(yù)測DRAM將被其他類型的內(nèi)存所取代,但它仍然是幾乎所有計(jì)算中的基本組件。它的足跡沒有消失,而是在增加,選擇的數(shù)量也在增加。
有幾個(gè)因素推動著這種擴(kuò)張。其中包括:
系統(tǒng)中計(jì)算元素的數(shù)量和密度不斷增加,以更快地處理更多數(shù)據(jù),特別是對于AI/ML和數(shù)據(jù)中心應(yīng)用。更多的內(nèi)核需要更多的內(nèi)存,因?yàn)樾枰幸粋€(gè)地方來存儲和處理數(shù)據(jù)。
通常情況下,這其中的大部分將在緩存中處理,SRAM一直是L1到L3緩存的首選內(nèi)存。但是SRAM不再以與數(shù)字邏輯相同的速度擴(kuò)展。因此,它在芯片上占據(jù)了更大比例的空間,DRAM速度的提高使得一些類型的緩存適合L3緩存。
來回移動數(shù)據(jù)受到帶寬和距離的限制,因此僅僅在一個(gè)物理位置添加更多內(nèi)存并不一定會提高性能。事實(shí)上,它可能會適得其反。
出于以上種種原因,芯片制造商正在使用更多的DRAM。在某些情況下,DRAM——尤其是高帶寬存儲器(HBM)——正在取代一些SRAM。DRAM在耐用性方面有著良好的記錄,也有成熟的工藝,而且比SRAM便宜得多。Objective Analysis總經(jīng)理吉姆漢迪(Jim Handy)表示,根據(jù)原始數(shù)據(jù),同樣容量的SRAM成本可能是DRAM的2500倍以上,具體取決于DRAM的類型。[1]
有一系列的動態(tài)隨機(jī)存取存儲器當(dāng)然可以。有些很快,比如英王陛下,而且還貴。其他類型較慢但便宜,如基本DDR DIMMs。不過,有所改變的是,在異構(gòu)架構(gòu)中,兩者都可以扮演重要的角色,此外還有多種其他類型的DRAM和更具針對性的內(nèi)存,例如MRAM或者ReRAM.
“我們正在尋找一種混合模式,在同一個(gè)系統(tǒng)中使用不同的DRAM技術(shù),”微軟高級技術(shù)營銷經(jīng)理科斯·吉切夫說節(jié)奏。“如果您真的需要非常高的性能,并且愿意為此付費(fèi),那么您可能會選擇HBM。您可以將它用于L3緩存,或者您需要立即訪問的任何東西。如果您仍然需要更多的內(nèi)存,但是有一點(diǎn)延遲,您可以在RDIMM(已注冊的雙列直插式內(nèi)存模塊)或MRDIMM(多路復(fù)用器等級的DIMM)。如果您正在尋找大容量,那么您可能會考慮后面的DRAM巨災(zāi)超賠分保。該技術(shù)開始針對非常特殊的應(yīng)用,具有真正的高帶寬和低功耗,更大的內(nèi)存占用,但延遲稍長。將所有這些結(jié)合在一起是每個(gè)人解決這些問題的方向?!?/p>
就像高級節(jié)點(diǎn)或高級打包中的幾乎每一項(xiàng)改進(jìn)一樣,解決一個(gè)問題會導(dǎo)致另一個(gè)問題。盡管如此,潛在的理論是合理的,在今天的市場上也有證據(jù)。例如,可能有必要讓一些功能以最高速度運(yùn)行,如AI,這將使高帶寬內(nèi)存成為最佳選擇。但并不是所有的功能都是必不可少的,也不是所有的功能都需要那樣的性能。在某些情況下,GDDR5或GDDR6可能就足夠了。在其他地方,可能是LPDDR,在其他地方可能是DDR4。所有這些都有不同的相關(guān)成本,這些成本可以通過來回移動數(shù)據(jù)的資源以及內(nèi)存芯片的貨幣價(jià)值來衡量。
另一方面,并非所有的DRAM都是一樣的,只是添加不同風(fēng)格的DRAM而沒有充分了解它們將如何影響其他組件會導(dǎo)致問題。重要的是以避免未來問題的方式集成它們,包括復(fù)雜的平面規(guī)劃,以避免信號完整性和防止熱量問題。眾所周知,DRAM和heat不太協(xié)調(diào)。但也有一些以前從未認(rèn)真考慮過的新問題。
“DRAMs發(fā)展的大問題分為兩類——常見的問題(更多的帶寬和容量、管理電源),以及一些新的問題(更具挑戰(zhàn)性的可靠性,導(dǎo)致片內(nèi)ECC和劃船錘保護(hù)),”斯蒂芬吳說,研究員和杰出的發(fā)明家蘭布斯。“對于新的挑戰(zhàn),在芯片上放置更多的電容會增加片內(nèi)錯誤的發(fā)生率,因此您現(xiàn)在看到的DRAMs會在數(shù)據(jù)返回控制器之前進(jìn)行一些片內(nèi)錯誤糾正。并且發(fā)生像RowHammer這樣的相鄰單元干擾問題,因?yàn)檫@些單元彼此非常接近,以至于訪問一組單元會導(dǎo)致非常接近的相鄰單元的位翻轉(zhuǎn)。”
哪里最有效
越來越多的選擇也讓人們很難決定使用哪些內(nèi)存。DRAM的選擇通常基于性能、功耗、成本、可靠性(糾錯碼,以及充分測試和供應(yīng)鏈安全)和容量。因此,如果DRAM將用于L3緩存,它可能需要高性能和低功耗。如果它將用于高級封裝中的低級功能,它可能是標(biāo)準(zhǔn)的DIMM。
但這些選擇中的每一種都會影響整體芯片或系統(tǒng)級封裝設(shè)計(jì),并帶來特定的設(shè)計(jì)考慮。
“過去,DDR4和LPDDR4并不復(fù)雜,”產(chǎn)品營銷高級經(jīng)理Graham Allan說新思科技。“一個(gè)客戶會啟用DDR4,另一個(gè)客戶會啟用LPDDR4,因此存在重疊。隨著DDR5和LPDDR5一代代的發(fā)展,這些應(yīng)用領(lǐng)域已經(jīng)完全不同,接口協(xié)議和物理信號也是如此。DDR5通常希望與成噸成噸的DRAMs(大容量)進(jìn)行通信,因此您主要是與寄存器DIMMs進(jìn)行接口。使用LPDDR,您通常只能與一個(gè)包裝或設(shè)備對話,并且該設(shè)備中最多有兩個(gè)負(fù)載。LPDDR也是地面終端。DDR端接到正電壓軌。這些是非常不同的物理接口和協(xié)議,這意味著客戶需要選擇一個(gè)或另一個(gè)。”
還有一些中間選項(xiàng)可以幫助在多個(gè)應(yīng)用程序中使用相同的設(shè)計(jì)。例如,根據(jù)工作負(fù)載的不同,MRDIMMs可以用于將容量或帶寬翻倍。Allan表示:“多路復(fù)用器級DIMMs的容量和速度是SDRAM(同步DRAM)的兩倍?!八拿烂钪幵谟贒RAMs不會改變。它以兩種不同的模式運(yùn)行。它的運(yùn)行方式類似于負(fù)載減少的DIMM,但速度不會翻倍。在這種模式下,您可以使用它來獲得更高的容量?;蛘咚远嗦放帕心J焦ぷ?,這使DRAMs和外部接口之間的帶寬加倍?!?/p>
那是畫面的一部分。另一部分是PHY或物理層,它為內(nèi)存提供物理接口。phy因使用的DRAM類型而異,隨著數(shù)據(jù)量的增加和設(shè)計(jì)的日益多樣化,phy變得尤為重要。
phy還可以鏈接在一起成為一種主堆棧,以便管理復(fù)雜設(shè)備中的內(nèi)存資源,無論該設(shè)備是GDDR6還是LPDDR4。這樣,所有類型的DRAM都可以被視為可用資源并進(jìn)行集中管理。
公司副總裁兼總經(jīng)理Balaji Kanigicherla表示:“通過管理帶寬的某種結(jié)構(gòu),一切都是可見和可尋址的瑞薩科技(公司名稱)基礎(chǔ)設(shè)施事業(yè)部?!斑@不僅僅是關(guān)于提高密度或記憶的物理學(xué),這是材料科學(xué)。存儲器的應(yīng)用架構(gòu)是行業(yè)的發(fā)展方向。密度需要提高,因?yàn)槟M谙嗤膸捪芦@得更大的容量。我們可以根據(jù)每美元或每千兆字節(jié)的路徑進(jìn)行混合搭配,并且可以在SSD、DRAM和本地片上SRAM緩存之間使用分層。這將轉(zhuǎn)變?yōu)檎麄€(gè)系統(tǒng)的總擁有成本,并考慮我們將為每一層支付的成本?!?/p>
這實(shí)質(zhì)上提高了內(nèi)存管理的抽象級別。Kanigicherla說:“你可以從當(dāng)前的模式發(fā)展到在全球?qū)用娼鉀Q內(nèi)存問題,并基本上創(chuàng)建足夠有效的互連來管理緩存或減少延遲?!斑@就像是全局可尋址內(nèi)存的一個(gè)分區(qū)。很明顯,你需要提供帶寬。但好消息是,對于人工智能工作負(fù)載,它們對延遲不太敏感,對帶寬更敏感。所以你可以把這項(xiàng)技術(shù)放大。在CXL和UCIe之間,應(yīng)該有一種更漸進(jìn)的方式來分解內(nèi)存,可能包括光學(xué)互連,并實(shí)現(xiàn)內(nèi)存的完整全局視圖。但這需要整個(gè)行業(yè)來實(shí)現(xiàn)。這可不簡單?!?/p>
圖:系統(tǒng)DRAM的集中控制。來源:瑞薩
內(nèi)存池是另一種選擇,并且在數(shù)據(jù)中心越來越受歡迎。內(nèi)存池對DRAM的作用相當(dāng)于超大規(guī)模擴(kuò)展對處理器內(nèi)核的作用。當(dāng)需要額外的內(nèi)存時(shí),可以通過與額外的計(jì)算核心相同的方式獲得,通常通過CXL接口。
Rambus‘ Woo在最近的一次演講中說:“池化背后的想法是,如果我有一組服務(wù)器,它們每個(gè)都有內(nèi)存,那么它們每個(gè)都不太可能同時(shí)使用所有的內(nèi)存容量?!笨ㄋ古潦录?。“更有意義的做法是,將部分容量放入外部機(jī)箱,并像資源池一樣對待它。當(dāng)處理器需要的內(nèi)存超過機(jī)箱內(nèi)的容量時(shí),它們可以在短時(shí)間內(nèi)取出并配置一些內(nèi)存,將其用于計(jì)算,然后將其放回池中。這是讓很多業(yè)內(nèi)人士感到興奮的新功能之一。再遠(yuǎn)一點(diǎn),一旦你做了這些類型的事情,你就可以開始考慮通過開關(guān)連接內(nèi)存和池。CXL標(biāo)準(zhǔn)也允許多級交換。這種靈活性將有助于提高各種應(yīng)用的性能和總擁有成本。”
其他記憶方法
除了更傳統(tǒng)的方法之外,DRAM正在向不同的方向發(fā)展。這部分是因?yàn)橄虍悩?gòu)集成和高級打包的轉(zhuǎn)變,以及更多的領(lǐng)域特定設(shè)計(jì),部分是因?yàn)樘幚砀咏鼣?shù)據(jù)源的好處。
“比較計(jì)算和DRAM,我們用17%的能量進(jìn)行計(jì)算,用63%的能量將數(shù)據(jù)從一點(diǎn)移動到另一點(diǎn),”的內(nèi)存技術(shù)專家Jongsin Yun說西門子數(shù)字工業(yè)軟件?!斑@是相當(dāng)大的能量。我們可以節(jié)約成本,提高速度和能效。當(dāng)前的解決方案是在緩存中增加更多的內(nèi)存,但這是一個(gè)昂貴的解決方案。我們不需要將所有數(shù)據(jù)都轉(zhuǎn)移到DRAM。我們可以在內(nèi)存中進(jìn)行一些計(jì)算,或者使用一些基于GPU的人工智能卷積,這樣我們就可以在不轉(zhuǎn)移內(nèi)存的情況下進(jìn)行計(jì)算?!?/p>
如今的選擇比以往任何時(shí)候都多,處于開發(fā)階段的選擇也更多。華邦例如,開發(fā)了一些基于DRAM的內(nèi)存解決方案,但它們超越了傳統(tǒng)的DRAM使用模式。一個(gè)是該公司的單模立方體(定制超帶寬元件)架構(gòu)。另一種是偽靜態(tài)DRAM,它介于SRAM和DRAM之間,不需要外部數(shù)據(jù)重寫。這兩者都是針對可穿戴設(shè)備和邊緣服務(wù)器等特定市場。
“現(xiàn)在最熱門的話題是生成式人工智能,”華邦電子美國公司的營銷主管CS林說。“但是,數(shù)據(jù)中心中發(fā)生的事情與我們關(guān)注的地方有著不同的要求,并且有著非常不同的密度。我們專注于16千兆字節(jié)/秒及以下的密度,但該解決方案可擴(kuò)展至256千字節(jié)/秒。它以非常接近HBM2的帶寬運(yùn)行,但具有非常低的功耗優(yōu)勢?!?/p>
圖:立方體方法,延遲約25ns,5X單位密度高于14納米SRAM。來源:華邦
Lin說,這種方法的好處是能夠使用標(biāo)準(zhǔn)DRAM來提高性能,而不是依賴最先進(jìn)的處理節(jié)點(diǎn)。通常,更高的密度會產(chǎn)生延遲,但CUBE架構(gòu)使用數(shù)千個(gè)硅通孔來傳輸數(shù)據(jù),這些通孔可以根據(jù)對更高帶寬或更高速度的需求進(jìn)行靈活分配。這允許更細(xì)粒度的系統(tǒng)架構(gòu),以及更小的占用空間。
另一種方法是均衡化。這個(gè)計(jì)劃已經(jīng)醞釀了一段時(shí)間,但最終似乎越來越有吸引力。Synopsys的Allan解釋說:“均衡改善了您在信道末端接收的數(shù)據(jù)?!昂唵蝸碚f,這就像符號間干擾。當(dāng)一系列位通過通道傳輸時(shí),當(dāng)一位完成時(shí),實(shí)際上已進(jìn)入下一位的時(shí)域。信號上升和下降以及從1到0的轉(zhuǎn)換需要超過一個(gè)單位的時(shí)間間隔。你不是從穩(wěn)態(tài)低電位開始的。你正從一個(gè)更高的狀態(tài)開始。您使用決策反饋均衡來偏移輸入接收器中的采樣點(diǎn)。那么,我現(xiàn)在如何優(yōu)化我的輸入接收器,使1和0檢測具有相似的裕量呢?我真的沒有感覺到有什么東西會把基準(zhǔn)電壓正好放在中間。”
內(nèi)存計(jì)算也即將出現(xiàn)。雖然已經(jīng)有一些使用MRAM的商業(yè)方法,但普林斯頓大學(xué)的研究人員在2019年紙展示了FPGA中的外部DRAM控制器,它可以與現(xiàn)成的DRAM一起使用,以創(chuàng)建大規(guī)模并行計(jì)算。研究人員聲稱,這種方法克服了所謂的內(nèi)存墻,即邏輯性能超過了內(nèi)存帶寬。
權(quán)衡
那么,與DRAM相比,SRAM的使用量有多大呢?這沒有簡單的公式,因?yàn)檫@不是蘋果與蘋果的比較。
“真的沒有什么神奇的方法可以做到這一點(diǎn),”首席技術(shù)官和聯(lián)合創(chuàng)始人王乘說Flex Logix?!拔覀兊拇蟛糠衷O(shè)計(jì)權(quán)衡來自模擬SRAM帶寬、SRAM容量和DRAM帶寬的性能評估。這是我們的三個(gè)主要旋鈕?;旧希覀冇兴姆N標(biāo)準(zhǔn)規(guī)模的計(jì)算,不同數(shù)量的SRAM和DRAM帶寬適用于我們的標(biāo)準(zhǔn)IP產(chǎn)品。這是基于我們運(yùn)行模型的經(jīng)驗(yàn)數(shù)據(jù),以確定什么更好。如果我們有兩倍的SRAM容量,一些型號可以運(yùn)行得更好。如果通過將SRAM增加一倍,您的性能幾乎可以增加一倍,并且您將另外20%的面積用于2倍性能,那就太好了。但是,還有許多其他型號無法從額外的SRAM中受益,這樣一來,你就白白增加了那個(gè)區(qū)域。這就是擁有準(zhǔn)確的周期性能評估非常重要的原因。在我們的例子中,它不精確到單個(gè)周期,但它精確到8%,這超過了我們所需要的。然后,您可以對適當(dāng)?shù)腟RAM/DRAM計(jì)算權(quán)衡進(jìn)行大量架構(gòu)分析,這可能因工作負(fù)載類型而異?!?/p>
這是復(fù)雜的數(shù)學(xué),隨著系統(tǒng)被分解成異構(gòu)元素,如小芯片,它變得更加復(fù)雜?!癝RAM需要每比特更多的晶體管來實(shí)現(xiàn)。的首席產(chǎn)品經(jīng)理Takeo Tomine說:“與DRAM相比,它的密度更低,價(jià)格更貴,讀寫時(shí)的功耗也更高?!盇nsys?!澳壳?,SRAM是在CPU通常采用的先進(jìn)finFET技術(shù)節(jié)點(diǎn)上設(shè)計(jì)的,由于finFET器件的熱阻較高,因此更容易受到熱效應(yīng)(自熱)的影響?!?/p>
在某些情況下,使用什么類型的內(nèi)存,以及在哪里使用,可能會歸結(jié)為設(shè)備的預(yù)期壽命?!坝袃蓚€(gè)主要的可靠性問題會導(dǎo)致記憶壽命的縮短,”Tomine說?!耙粋€(gè)是互連可靠性與技術(shù)節(jié)點(diǎn)縮小導(dǎo)致存儲器的壽命,因?yàn)樽詿釋?dǎo)致嚴(yán)重的電遷移(EM),這是最關(guān)鍵的可靠性問題之一。隨著技術(shù)的發(fā)展,材料和工藝技術(shù)不斷提高電磁壽命。第二是來自不同設(shè)備架構(gòu)的可靠性挑戰(zhàn)。在將器件架構(gòu)從finFETs轉(zhuǎn)移到納米片再到CFETs的過程中,熱阻率急劇增加,這意味著器件溝道的δT更高。器件自熱將與金屬焦耳熱耦合。器件的自熱會影響柵氧化層擊穿(時(shí)間相關(guān)的介電擊穿),還會降低HCI(熱載流子注入),這會惡化器件的BTI(偏置溫度不穩(wěn)定性)?!?/p>
可靠性是對存儲器設(shè)備在給定時(shí)間內(nèi)無故障運(yùn)行的能力的度量。智能手機(jī)的預(yù)期壽命為4年,而汽車、軍事或金融服務(wù)器應(yīng)用的預(yù)期壽命可能為10至15年(或更長),因此這一時(shí)間框架可能會有很大不同。能夠理解可能影響存儲器壽命的潛在交互是至關(guān)重要的,并且它們可能因架構(gòu)、存儲器類型和使用而異。
這也會影響所使用的內(nèi)存類型和整個(gè)系統(tǒng)架構(gòu)。因此,如果記憶可以被交換,那么壽命就沒有那些記憶被嵌入某種高級包裝并密封起來那么重要?!斑@就像有一個(gè)DRAM卡池,今天就可以升級,”瑞薩的Kanigicherla說?!笆褂肏BM,如果出現(xiàn)問題,你什么也做不了,所以你扔掉了一個(gè)非常昂貴的芯片。在CPU方面,服務(wù)器連接得非常緊密,您無法做太多事情來升級任何東西。這就是為什么這個(gè)全局共享內(nèi)存的概念是可行的。其中一些解決方案會自動出現(xiàn)?!?/p>
延遲增加了另一個(gè)權(quán)衡?!坝绕涫荋BM,你把處理器和DRAM放得很近,”Cadence IP Group產(chǎn)品營銷總監(jiān)Frank Ferro說?!斑@樣做有很多好處。HBM發(fā)展相當(dāng)迅速。我們幾乎每兩年就會看到性能的提高。所以曲線很陡。但是從系統(tǒng)設(shè)計(jì)的角度來看,2.5D仍然是一個(gè)挑戰(zhàn)。優(yōu)化內(nèi)插器并幫助客戶設(shè)計(jì),這確實(shí)是對話的關(guān)鍵部分?!?/p>
結(jié)論
自1967年發(fā)明以來,DRAM一直是計(jì)算的關(guān)鍵。雖然多年來無數(shù)的內(nèi)存技術(shù)對它提出了挑戰(zhàn),但沒有什么能取代它。鑒于圍繞這項(xiàng)技術(shù)的狂熱活動,在可預(yù)見的未來,沒有什么能取代它。
現(xiàn)在的DRAM不止一種類型,而是多種類型,每種類型都在不斷發(fā)展,并產(chǎn)生新的想法。從內(nèi)存到處理元件的物理連接,到服務(wù)器機(jī)架外的內(nèi)存池,每個(gè)層面都有創(chuàng)新。目前正在努力縮短信號在內(nèi)存和處理器內(nèi)核之間的傳輸距離,這將減少傳輸數(shù)據(jù)所需的電量和每個(gè)周期所需的時(shí)間。
總的來說,DRAM仍然是一個(gè)充滿活力和創(chuàng)新的領(lǐng)域,而且還會有更多的創(chuàng)新和不同的方法來整合一個(gè)對性能、成本、可靠性和壽命有重大影響的內(nèi)存解決方案。
審核編輯:黃飛
-
DRAM
+關(guān)注
關(guān)注
40文章
2315瀏覽量
183500 -
sram
+關(guān)注
關(guān)注
6文章
767瀏覽量
114691 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4778瀏覽量
72129 -
芯片制造
+關(guān)注
關(guān)注
10文章
623瀏覽量
28828 -
HBM
+關(guān)注
關(guān)注
0文章
380瀏覽量
14759
發(fā)布評論請先 登錄
相關(guān)推薦
評論