高帶寬存儲器(HBM, High Bandwidth Memory)是一種可以實現(xiàn)高帶寬的高附加值DRAM產品,適用于超級計算機、AI加速器等對性能要求較高的計算系統(tǒng)。隨著計算技術的發(fā)展,機器學習的應用日漸廣泛,而機器學習的基礎是自20世紀80年代以來一直作為研究熱點的神經網絡模型。作為速度最快的DRAM產品,HBM在克服計算技術的局限性方面發(fā)揮著關鍵的作用。
HBM的高帶寬離不開各種基礎技術和先進設計工藝的支持。由于HBM是在3D結構中將一個邏輯die與4-16個DRAM die堆疊在一起,因此開發(fā)過程極為復雜。鑒于技術上的復雜性,HBM是公認最能夠展示廠商技術實力的旗艦產品。
從2015年推出HBM1到2021年10月開發(fā)業(yè)界第一款HBM3 DRAM1,SK海力士一直是HBM行業(yè)的領軍企業(yè)。SK海力士的HBM產品大獲成功的首要因素是產品特性,具體而言,產品設計在保證市場競爭力方面發(fā)揮了重要作用。SK海力士HBM設計團隊負責將產品規(guī)格落實到實際電路中,同時開發(fā)配套的產品架構和設計技術,以確保準確實現(xiàn)產品功能、高性能和低功耗特性。得益于對產品的全面了解,HBM設計團隊還在未來產品規(guī)劃及規(guī)格定義方面發(fā)揮著至關重要的作用。此外,HBM設計團隊會聆聽客戶反饋,并圍繞問題展開分析。
產品特性通常分為三類:性能、功耗和面積,即PPA (Power, Performance, Area)。本文著重探討如何通過卓越的設計工藝來提高產品性能或創(chuàng)造速度優(yōu)勢。如前所述,HBM支持高帶寬,而帶寬指的是在特定單位時間內可以傳輸?shù)臄?shù)據(jù)量。由于具有高帶寬的特性,HBM主要應用于高性能計算場景。
通過機器學習解決偏移問題
過去八年來,HBM產品帶寬增加了七倍,目前已接近1TB/秒的里程碑節(jié)點。鑒于同期內其他產品的帶寬僅增加兩到三倍,我們有理由將HBM產品的快速發(fā)展歸功于存儲器制造商之間激烈的競爭。
<圖1:ISSCC上發(fā)表的HBM相關文章的趨勢 >
存儲器帶寬指單位時間內可以傳輸?shù)臄?shù)據(jù)量,要想增加帶寬,最簡單的方法是增加數(shù)據(jù)傳輸線路的數(shù)量。事實上,每個HBM由多達1024個數(shù)據(jù)引腳組成,HBM內部的數(shù)據(jù)傳輸路徑隨著每一代產品的發(fā)展而顯著增長,如圖2所示。
<圖2:各代HBM產品的數(shù)據(jù)傳輸路徑配置>
但是,芯片的尺寸限制了傳輸路徑的增加。因為增加的不僅是數(shù)據(jù)傳輸線路,還有使用每條傳輸線路的傳輸/接收電路。此外,隨著傳輸線路的增加,等量匹配每條傳輸線路長度和配置的難度加大,使得運行速度無法提升。
傳輸線路之間的時序差異就是我們所說的偏移。為了減少偏移,每條傳輸線路的總長度和電子元件應采用相似的設計。然而,HBM有數(shù)千條內部傳輸線路,逐一匹配幾乎是不可能的任務。為此,SK海力士引入了機器學習。強化學習(Reinforcement learning)技術可以在每條傳輸線路上附加多余的傳輸路徑,無需工程師手動作業(yè),即可精確地優(yōu)化偏移問題,由此減少整個傳輸路徑間的偏移。
<圖3:基于機器學習技術的信號線路優(yōu)化>
圖3顯示了這一優(yōu)化過程。一些90度彎曲的線路具有不同的特性,因此必須通過增加紅色附加線的方式來減少偏移(Skew)。與初始的隨機解決方案(如圖3左側所示)相比,強化學習技術的使用可以帶來最優(yōu)結果(如右圖所示)。通過這種方法,偏移從100皮秒(100 ps)縮短至70皮秒(70 ps),降幅達30%。
通過PVT感知時序優(yōu)化來提高速度
即使偏移問題得到優(yōu)化,各種信號之間相對時序關系的匹配仍然是一個難題。例如,每32個數(shù)據(jù)信號對應一個時鐘信號(clock signal)*,如果需要由時鐘信號來控制數(shù)據(jù)信號,那么時鐘信號必須采用與數(shù)據(jù)信號不同的電路。電路配置的差異也會導致關系的變化,具體取決于工藝、電壓、溫度(PVT)的變化。無論何種情況下,時鐘都必須位于數(shù)據(jù)的特定時序部分。但是,隨著運行速度的提升,時序部分會減少,由此增加了設計復雜度。
* 時鐘信號(clock signal):在同步數(shù)字電路中,時鐘信號在高位和低位狀態(tài)之間振蕩,并且像節(jié)拍器一樣用于協(xié)調數(shù)字電路的動作。
為了解決這一問題,SK海力士采用PVT感知時序優(yōu)化技術來檢測HBM3中的PVT變化,以找到最佳時序。這項技術可以確定單元電路的哪一個分級與精確循環(huán)的外部時鐘輸入具有相同的周期,并基于該數(shù)據(jù)自動優(yōu)化主時序裕量電路(timing margin circuit)中的電路配置。如圖4所示,隨著PVT的變化,時鐘時序通常會將時鐘移動到一側,而PVT感知時序優(yōu)化技術可以在任何情況下讓時鐘始終保持在中心位置,以此來提高速度。
<圖4:PVT感知時序優(yōu)化技術>
為了增加作為HBM關鍵性能指標的帶寬,SK海力士正在開發(fā)一系列設計技術,包括數(shù)據(jù)路徑優(yōu)化、基于機器學習的信號線路優(yōu)化、PVT感知時序優(yōu)化技術以及全新工藝技術等?;Adie與典型DRAM工藝的不同之處在于基礎die沒有單元,利用這一特性,我們正在開發(fā)HBM優(yōu)化工藝技術以及用于3D堆棧的先進封裝技術。
通過上述一系列努力,SK海力士實現(xiàn)了HBM的快速發(fā)展。然而,為了滿足客戶不斷增加的期望,打破現(xiàn)有框架進行新技術開發(fā)勢在必行。此外,SK海力士還在與HBM生態(tài)系統(tǒng)中的參與者(客戶、代工廠和IP公司等)通力合作,以提升生態(tài)系統(tǒng)等級。商業(yè)模式的轉變同樣是大勢所趨。作為HBM領軍企業(yè),SK海力士將致力于在計算技術領域不斷取得進步,全力實現(xiàn)HBM的長期發(fā)展。
文章來源:SK海力士
審核編輯 黃宇
-
DRAM
+關注
關注
40文章
2315瀏覽量
183483 -
帶寬
+關注
關注
3文章
929瀏覽量
40921 -
機器學習
+關注
關注
66文章
8418瀏覽量
132628 -
HBM
+關注
關注
0文章
380瀏覽量
14755
發(fā)布評論請先 登錄
相關推薦
評論