0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于Gen-Z的性能和原理分析

lC49_半導體 ? 來源:djl ? 作者:PLDA ? 2019-08-29 15:45 ? 次閱讀

我們所知道的計算機系統(tǒng)是建立在網絡和存儲速度較慢,而CPU內存的反應速度較快基礎上的。多年來,設計人員為這些組件開發(fā)了相應的語言和接口,需要多層軟件將內存命令轉換為網絡和存儲命令,反之亦然。

到目前為止,CPU內存對相對于網絡和存儲I / O的速度使得這些軟件層對系統(tǒng)性能的影響很小。

然而,隨著摩爾定律的發(fā)展,網絡和存儲技術正迅速趕上CPU內存速度,現在幾代軟件層發(fā)揮的作用變得越來越重要。

在本文中,我們將Gen-Z結構視為消除現有系統(tǒng)瓶頸的解決方案,并通過統(tǒng)一通信路徑并使用CPU內存加載/存儲語言簡化軟件來顯著提高系統(tǒng)效率和性能。

邁向新的計算架構

如圖1所示,計算架構正在迅速發(fā)展為異構系統(tǒng),包括多種計算單元(CPU / SoC,GPU,FPGA)和不同類型的內存/存儲元件(DRAM,存儲器),在本地互連在一起或遠程通信。

此類體系結構應通過允許添加或刪除資源,或在更新版本/技術可用時替換此類資源來提供更好的靈活性和可伸縮性。

關于Gen-Z的性能和原理分析

圖1 - 新的計算架構

以CPU為中心的方法

利用當今以CPU內存為中心的方法,圖1中的系統(tǒng)使用各種硅組件、接口和軟件層實現,如圖2所示。

關于Gen-Z的性能和原理分析

圖2 - 以CPU內存為中心的系統(tǒng)架構

在計算系統(tǒng)的這種特定實現中,PCI Express被用來連接CPU內存、GPU / FPGA內存和高性能/低延遲存儲器。SSD陣列通過主機總線適配器或NIC連接,使用光纖通道、Infiniband、NVMe-oF或以太網作為傳輸接口。

其中一個CPU的DRAM中的數據必須在到達SSD陣列之前遍歷4個接口域,隨后會產生相關的軟件開銷和緩沖區(qū)復制操作。

這里,可擴展性是一個問題:升級到下一代SCM可能需要升級/更換相關的CPU / SoC。同樣,擴展SSD陣列可能需要HBA / NIC下游的結構交換機。

內存語義方法

Gen-Z是一種內存語義結構,它將CPU內存字節(jié)可尋址的加載/存儲模型擴展到整個系統(tǒng)。事實證明,加載/存儲模型是CPU與內存子系統(tǒng)通信的最快、最有效的方法。為了啟用此模型,Gen-Z將計算與介質分離,將介質特定功能與其正確所屬的介質放在一起。圖3說明了這個原理。

關于Gen-Z的性能和原理分析

圖3 - 從CPU內存接口到與介質無關的結構

這一重要變化允許系統(tǒng)中的每個計算實體都是介質不可知和分解的。使用Gen-Z內存語義結構,可以使用交換拓撲實現圖1中的系統(tǒng),如圖4所示。

關于Gen-Z的性能和原理分析

圖4 - 使用Gen-Z的系統(tǒng)架構

通過這種方法,所有設備彼此對等并通過簡化的、高性能、低延遲的通信路徑說出相同的加載/存儲語言,而不會導致當前總線體系結構的轉換懲罰和軟件開銷。

Gen-Z協議定義了大量的內存語義操作(通過OpCodes / OpClasses),可以實現高效的數據傳輸,以卸載計算資源,優(yōu)化互連使用并降低軟件開銷。在所示的示例中,可以使用適當的OpCode / OpClass在一次加載和一次存儲操作中將來自DRAM的數據復制到SSD陣列。

在可擴展性方面,系統(tǒng)可以通過獨立升級,添加或刪除計算,內存或存儲元素而不影響功能,為每個工作負載和環(huán)境精確定制。

關于Gen-Z

Gen-Z架構專注于提供高效率、高帶寬和低延遲。

通過利用經過驗證的裝載/存儲模型實現高效率。簡化了Gen-Z硬件接口層,從而最大限度地減少了對軟件層的需求。消除這種復雜性、開銷和誘導系統(tǒng)延遲可以顯著提高系統(tǒng)性能。

高帶寬以兩種方式實現。Gen-Z支持非對稱通信路徑,這意味著可以將更多通道專用于讀取路徑而不是寫入路徑,反之亦然。此外,Gen-Z支持多種信令速率,包括16,25,32,56和112 GT / s??偠灾@些功能將使Gen-Z能夠跟上行業(yè)不斷增長的速度需求,同時還允許將Gen-Z通信路徑調整為特定的工作負載流量模式。

通過減少軟件堆棧來實現低延遲。與傳統(tǒng)的服務器存儲和大量分層的網絡堆棧不同,Gen-Z采用輕量級軟件接口,直接對硬件進行內存讀寫操作。

芯片設計師需要的Gen-Z資源

希望成功開發(fā)Gen-Z產品的芯片設計師需要一些關鍵資源,具體如下:

Gen-Z控制器IP:SoC、交換機、存儲介質控制器和其他類型的Gen-Z設備都需要可配置的高質量控制器IP才能連接到Gen-Z結構。在撰寫本文時,兩家IP供應商,Gen-Z聯盟的成員已經宣布了Gen-Z控制器IP的當前和未來可用性。

Gen-Z PHY IP:初始Gen-Z實施將專注于經過驗證的、部署的NRZ PHY信令技術和速度,利用16和32 GT / s的PCIe PHY和25 GT / s的IEEE802.3 PHY的可用性。后期部署可能會利用先進的PAM4 PHY信令速率,如56和112 GT / s。

Gen-Z驗證IP:全面驗證IP(VIP)工具的可用性對于保證集成在SoC之前和之后Gen-Z IP的質量至關重要。在撰寫本文時,兩家供應商已宣布為Gen-Z提供驗證IP。

FPGA原型開發(fā)板:FPGA原型開發(fā)是確保系統(tǒng)級功能和互操作性的必要步驟。目前的FPGA技術允許Gen-Z原型設計高達56 GT / s(PAM4)和32 GT / s(NRZ)。還開發(fā)了連接器,以通過銅和光學連接以這些速率實現多通道Gen-Z信令。FPGA原型開發(fā)板可從多家供應商處獲得,預計基于FPGA技術的Gen-Z特定原型開發(fā)平臺即將推出。

Gen-Z聯盟包括來自各個技術領域的成員,這對于構建產品生態(tài)系統(tǒng)至關重要,其中所有必需的硬件和軟件組件彼此互操作。

結語

Gen-Z為計算機行業(yè)提供了一個獨特的機會,可以利用現有的CPU內存重新定義現代計算并克服當前的挑戰(zhàn)。隨著新公司繼續(xù)加入不斷發(fā)展的Gen-Z開放式生態(tài)系統(tǒng),構建模塊、產品和服務的可用性自然會增加,并使新設計和產品能夠應對新的工作負載和新出現的挑戰(zhàn)。

Gen-Z為創(chuàng)新的高性能、低延遲解決方案提供了機會,這些解決方案將是開放、簡單且經濟、高效的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 數據傳輸
    +關注

    關注

    9

    文章

    1920

    瀏覽量

    64680
  • 網絡
    +關注

    關注

    14

    文章

    7580

    瀏覽量

    88944
  • 傳輸接口
    +關注

    關注

    1

    文章

    15

    瀏覽量

    10341
收藏 人收藏

    評論

    相關推薦

    關于Gen-Z語義存儲(memory-semantic)體系架構探討

    不要與人口學中的千禧世代搞混了,Gen-Z是一種語義存儲(memory-semantic)體系架構,它已經發(fā)展到了一定程度,需要更好地定義來適應更大規(guī)模的規(guī)范與標準,例如在數據中心越來越受歡迎的成熟
    的頭像 發(fā)表于 10-23 15:38 ?7043次閱讀

    如何創(chuàng)建最佳的網絡和架構 一文解析Gen-Z架構

    不要與人口學中的千禧世代搞混了,Gen-Z是一種語義存儲(memory-semantic)體系架構,它已經發(fā)展到了一定程度,需要更好地定義來適應更大規(guī)模的規(guī)范與標準,例如在數據中心越來越受歡迎的成熟
    的頭像 發(fā)表于 02-05 16:03 ?5227次閱讀
    如何創(chuàng)建最佳的網絡和架構 一文解析<b class='flag-5'>Gen-Z</b>架構

    Linux性能分析工具大全

    今天浩道跟大家分享關于linux性能分析過程中常用到的分析工具!
    發(fā)表于 01-05 09:52 ?612次閱讀

    關于FPGAs的DSP性能分析

    關于FPGAs的DSP性能分析
    發(fā)表于 05-07 06:12

    EVAL-ADPD105Z-GEN信號是如何引入的,是否自帶發(fā)光管和接收管?

    想問一下EVAL-ADPD105Z-GEN,這個ADPD105評估板,信號是如何引入的,是否自帶發(fā)光管和接收管?
    發(fā)表于 12-11 06:16

    TE推出Sliver互連解決方案,具有高性能、靈活性、成本低等特點

    聯盟作為SFF-TA-1002多通道高速連接器的規(guī)范。包括On-Board Optics (COBO)、Gen-Z聯盟(Gen-Z)、開放計算項目(OCP)以及企業(yè)與數據中心SSD工作小組(EDSFF
    發(fā)表于 05-25 16:32 ?1745次閱讀

    關于Z軸TMR傳感器的性能介紹和應用分析

    多維科技董事長兼首席執(zhí)行官薛松生博士表示:“MDT 對 Z 軸 TMR 傳感器的發(fā)明是磁傳感器技術進步中的一項重大突破。我們克服了 Z 軸 TMR 傳感器開發(fā)過程中必然會遇到的艱難的工藝和設計挑戰(zhàn),同時保留了我們現有的平面感應 TMR 傳感器的優(yōu)異
    的頭像 發(fā)表于 10-28 15:24 ?3726次閱讀

    關于MDT推Z軸TMR傳感器的性能分析和應用介紹

    ,同時保留了我們現有的平面感應 TMR 傳感器的優(yōu)異性能。我們的客戶將可以沿用為霍爾效應方案設計的機械結構或磁鐵,同時采用 MDT 的 Z 軸 TMR 傳感器并享受諸多霍爾效應傳感器無法提供的 TMR 技術的優(yōu)點。
    的頭像 發(fā)表于 10-28 15:37 ?3478次閱讀

    關于USB 3.1 Gen 2 Type-C線纜配置和PVC護套的性能分析和介紹

    美國Infinite Electronics旗下品牌,有線和無線連接產品首選制造商L-com,近日宣布推出一系列用于數據存儲、視頻傳輸和數據采集應用的USB 3.1 Gen 2 Type-C線纜新產品。
    的頭像 發(fā)表于 10-14 09:54 ?3472次閱讀

    處理器和加速器互聯的開發(fā)將得到進一步發(fā)展

    Gen-Z聯盟正在開發(fā)一種開放系統(tǒng)互連,旨在通過直接連接、交換或互聯拓撲提供對數據和設備的內存訪問。下圖顯示了Gen-Z將如何為計算節(jié)點提供對外部內存池和計算加速器的訪問(在PCIe上運行CXL)。
    的頭像 發(fā)表于 06-11 17:20 ?2610次閱讀

    PCIe Gen 4協議分析儀的竟然那么強大!

    分析革命性創(chuàng)新的領導者,SerialTek公司的PCIe Gen 4和Gen 5協議分析儀不僅顛覆了傳統(tǒng)的PCIe協議分析儀架構設計,大大提
    的頭像 發(fā)表于 09-21 14:26 ?1.1w次閱讀

    最新PCIe Gen 5 switch芯片已內置SerialTek PCIe抓包分析功能

    2021年4月6日 Broadcom最新的PCIe Gen 5 switch芯片內置了SerialTek PCIe抓包分析功能,可以大大方便服務器、存儲系統(tǒng)廠商調試PCIe Gen 5在初始化等各
    的頭像 發(fā)表于 04-13 15:30 ?5722次閱讀
    最新PCIe <b class='flag-5'>Gen</b> 5 switch芯片已內置SerialTek PCIe抓包<b class='flag-5'>分析</b>功能

    iQOO Z6 Lite首發(fā)驍龍4 Gen 1處理器

      iQOO宣布,將于9月14日在印度發(fā)布iQOO Z6 Lite新機,全球首發(fā)驍龍4 Gen 1。iQOO放出的海報顯示,驍龍4 Gen 1采用6nm工藝,最高頻率2.0GHz,CPU性能
    的頭像 發(fā)表于 09-09 15:04 ?2628次閱讀

    高通驍龍8Gen3性能如何?

    驍龍8Gen3沒有用上3nm工藝,而是從N4升級為性能更強的N4P,性能強了6.6%。驍龍8Gen3這一次首次升級為1+5+2的全新架構,三級緩存從8MB增加至12MB。
    發(fā)表于 11-21 12:36 ?7675次閱讀
    高通驍龍8<b class='flag-5'>Gen</b>3<b class='flag-5'>性能</b>如何?

    三星Galaxy Z折疊屏手機無Exynos版本:均搭載驍龍8 Gen

    據悉,即將面世的Galaxy Z Flip 6及Galaxy Z Fold 6兩款折疊屏手機均搭載驍龍8 Gen 3處理器,無Exynos版本。消息人士指出,三星在折疊屏手機領域選擇高通處理器,主要是出于與高通的緊密合作關系以及
    的頭像 發(fā)表于 05-22 14:22 ?474次閱讀