流媒體,監(jiān)視和監(jiān)視數(shù)據(jù),連接的傳感器,社交媒體,在線協(xié)作,遠程學習,增強和虛擬現(xiàn)實,在線游戲……在線應用的無休止清單導致在線數(shù)據(jù)激增。在接下來的10年中,預計年度數(shù)據(jù)流量將增長400倍以上(圖1)。數(shù)據(jù)流量的這種快速增長將需要顯著提高數(shù)據(jù)接口IP的速度和延遲,尤其是在云基礎架構中。本文研究了有助于加快和管理數(shù)據(jù)中心之內(nèi)和之間,服務器內(nèi)以及片上系統(tǒng)(SoC)包內(nèi)的數(shù)據(jù)移動的技術發(fā)展。
圖1:到2030年的總數(shù)據(jù)流量預測。資料來源:“人工智能對電子和半導體行業(yè)的影響”,IBS,2020年4月。
數(shù)據(jù)中心內(nèi)部和之間的遠程數(shù)據(jù)移動
當今大多數(shù)大型數(shù)據(jù)中心都使用100Gbps以太網(wǎng)基礎結構來長距離移動數(shù)據(jù)(例如,在機架和數(shù)據(jù)中心之間)。遠程基礎設施通常依賴于25個或28 Gbps NRZ SerDes電連接的4個通道。但是,隨著數(shù)據(jù)量的增長,需要更高速度的基礎架構來維持數(shù)據(jù)移動。使用支持PAM-4編碼的56 Gbps和112 Gbps SerDes IP,可以在當前部署的超大規(guī)模數(shù)據(jù)中心實現(xiàn)400Gbps以太網(wǎng)連接,并在將來達到800Gbps的速度(圖2)。領先的以太網(wǎng)交換機供應商已經(jīng)在開發(fā)基于112G SerDes IP的800Gbps交換機,并計劃在未來幾年內(nèi)推出1.6Tbps以太網(wǎng)(使用更快的下一代SerDes),以滿足不斷增長的數(shù)據(jù)量的需求。
機架內(nèi)服務器之間的數(shù)據(jù)通信由機架頂(ToR)交換機和每臺服務器內(nèi)的網(wǎng)絡接口卡(NIC)進行管理。在過去的幾年中,此級別的云數(shù)據(jù)中心中最常見的接口速度為25Gbps。但是,隨著基礎架構速度增加到400Gbps,機架內(nèi)的以太網(wǎng)速度也增加到100Gbps。
隨著數(shù)據(jù)速率的提高,接口功率(通常以皮焦耳/位為單位)和面積變得越來越重要。物理接口(PHY)IP可以最大限度地減少能源消耗,同時在所需的距離范圍內(nèi)可靠地傳輸數(shù)據(jù),具有明顯的優(yōu)勢,可以最大程度地降低基礎架構電源和冷卻能力的成本。硅面積高效的PHY解決方案將SoC成本降至最低,從而提高了SoC供應商的盈利能力。
圖2:超大規(guī)模數(shù)據(jù)中心基礎架構正在過渡到400 + GbE。
服務器內(nèi)的數(shù)據(jù)移動
一旦所有這些數(shù)據(jù)到達服務器,就需要高速接口以將其有效地在服務器內(nèi)的設備之間移動。例如,當數(shù)據(jù)以100Gbps的速度到達NIC時,必須迅速將其移至存儲,系統(tǒng)內(nèi)存,或者也許移至圖形或AI加速器進行處理。這是PCI Express(PCIe),Compute Express Link(CXL)和類似協(xié)議的領域。為了應對流量的快速增長,PCI-SIG在2019年發(fā)布了PCIe 5.0,與上一代產(chǎn)品相比帶寬增加了一倍,并計劃在2021年發(fā)布PCIe 6.0,這將使PCIe數(shù)據(jù)速率再次翻倍至64 GT / s (對于x16卡,最高可達128GB / s)(圖3)。
圖3:每個通道的PCI Express帶寬演進。資料來源:PCWorld。
由計算系統(tǒng)生成和處理的數(shù)據(jù)(尤其是非結構化數(shù)據(jù))的數(shù)量最近和持續(xù)增長,催生了新的體系結構,通常采用加速器來促進數(shù)據(jù)處理。將數(shù)據(jù)從一個處理器域復制到另一個處理器域是一個資源密集型過程,可能會增加數(shù)據(jù)處理的延遲。高速緩存一致性解決方案允許處理器和加速器共享內(nèi)存,而無需將數(shù)據(jù)從一個存儲空間復制到另一個存儲空間,既節(jié)省了存儲資源,又節(jié)省了復制數(shù)據(jù)所需的時間。
CXL是一種緩存一致性協(xié)議,它利用PCIe的數(shù)據(jù)速率和物理層來使CPU和加速器能夠訪問彼此的內(nèi)存。當多個設備需要訪問單個數(shù)據(jù)集時,集成CXL協(xié)議有效地減少了非一致性協(xié)議必須出現(xiàn)的數(shù)據(jù)副本的數(shù)量,從而減少了系統(tǒng)內(nèi)所需的傳輸次數(shù)。減少數(shù)據(jù)副本的數(shù)量有助于減少系統(tǒng)中已經(jīng)大量訂閱的內(nèi)存和IO接口的負載。
與其他外圍互連相比,CXL面向高性能計算工作負載,可顯著減少延遲。由于cxl.cache和cxl.mem事務的延遲僅為50-80ns,因此CXL延遲僅是PCIe延遲的一小部分。此外,CXL通過使用資源共享來提高性能并降低復雜性,這也可以降低總體系統(tǒng)成本。
SOC中的USR / XSR數(shù)據(jù)移動
許多現(xiàn)代服務器SoC在單個封裝中利用多個管芯,以在設計和制造約束下提供所需的性能。結果,需要高速管芯到管芯(D2D)通信,以在芯片內(nèi)的管芯之間傳遞大型數(shù)據(jù)集。超短距離/超短距離(USR / XSR)SerDes使這一切成為可能,當前使用112Gbps SerDes的設計以及未來幾年內(nèi)可能會出現(xiàn)更高的速度。
使用D2D接口技術的多芯片模塊可解決多種用例。所有D2D用例都減少了開發(fā)時間以及開發(fā)和制造成本。有些使用多個異類芯片或“小芯片”,它們利用可重復使用的功能組件,每個組件均使用針對其特定功能最佳的制造技術來構建。其他用例則通過創(chuàng)建大型高性能SoC來強調(diào)靈活性,該SoC使用較小的同類構建模塊來提高產(chǎn)量和可擴展性。
圖4:管芯到管芯互連的用例示例。
概要
云數(shù)據(jù)的快速增長推動了對更快,更高效的接口的需求,這些接口要求將云基礎架構中的數(shù)據(jù)從網(wǎng)絡和系統(tǒng)向下移動到芯片級數(shù)據(jù)通信。新的和正在開發(fā)的接口技術,包括400Gbps和更快的以太網(wǎng),PCIe 6.0和CXL外圍互連技術,以及用于管芯對管芯通信的新型高速SerDes,可實現(xiàn)支持不斷發(fā)展的云數(shù)據(jù)需求所需的基礎架構增強功能。
Synopsys的DesignWare?高速SerDes和以太網(wǎng)IP支持下一代數(shù)據(jù)中心網(wǎng)絡解決方案。90%的領先半導體公司都使用DesignWare PCIe IP,它是DesignWare CXL IP的穩(wěn)定可靠的基礎。DesignWare 112G USR / XSR SerDes IP為多管芯SoC提供了一種低成本,高能效的管芯到管芯接口。Synopsys提供了經(jīng)過硅驗證的DesignWare接口IP以及開發(fā)用于滿足當今和未來云基礎設施不斷發(fā)展的數(shù)據(jù)移動需求的高速,低功耗,高度可靠的SoC所必需的設計和驗證工具的完整產(chǎn)品組合。
編輯:hfy
-
以太網(wǎng)
+關注
關注
40文章
5455瀏覽量
172276 -
數(shù)據(jù)中心
+關注
關注
16文章
4836瀏覽量
72272
發(fā)布評論請先 登錄
相關推薦
評論