0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采用CXL計(jì)劃應(yīng)對異構(gòu)計(jì)算中的內(nèi)存解決方案

電子設(shè)計(jì) ? 來源:edn ? 作者:Jeff Hockert ? 2021-03-19 11:41 ? 次閱讀

在計(jì)算世界中,不可思議的事情之一是在數(shù)據(jù)中心中迅速采用人工智能AI)和云計(jì)算。這些和其他因素正在推動異構(gòu)計(jì)算-使用CPU,GPUFPGA,ASIC加速器,網(wǎng)絡(luò)接口控制器(NIC)和其他處理元件,所有這些元件都連接到越來越大的內(nèi)存池。

但是,高性能計(jì)算(HPC)需要更新以有效連接這些處理元素并共享日益昂貴的內(nèi)存的能力。參加旨在應(yīng)對異構(gòu)計(jì)算帶來的挑戰(zhàn)的Compute Express Link(CXL)計(jì)劃。它旨在提供高速緩存一致性以及在沒有不必要的成本的情況下添加新的內(nèi)存層的能力。

CXL聯(lián)盟吸引了廣泛的支持,有近100個(gè)成員公司和14個(gè)公司的董事會,其中包括幾乎所有主要供應(yīng)商,包括AMD,Arm,IBM,Intel和Xilinx。

就像Intel發(fā)起USB,PCI和PCI Express一樣,當(dāng)Intel向最初由9家公司組成的工作組貢獻(xiàn)了該技術(shù)的第一個(gè)迭代時(shí),CXL聯(lián)盟便開始起步。2019年9月,成立了董事會,擁有96家成員公司。

在致力于成為正式成員之前,任何公司都可以訪問CXL網(wǎng)站,免費(fèi)獲得點(diǎn)擊許可,并下載該規(guī)范當(dāng)前版本的評估版。參與人員能夠指導(dǎo)工作的進(jìn)展,工程師現(xiàn)在可以在開發(fā)階段接受有關(guān)2.0規(guī)范的培訓(xùn)課程。

CXL建立在PCIe互連標(biāo)準(zhǔn)的基礎(chǔ)上,CXL 2.0(將于2020年12月推出)將補(bǔ)充PCIe 5.0標(biāo)準(zhǔn)的使用,其每通道32 Gbps的信號速度,預(yù)計(jì)將在2021年發(fā)布。隨后的PCIe 6.0規(guī)格有望提高一倍。具有三個(gè)協(xié)議套件的CXL利用PCIe內(nèi)具有備用協(xié)議的功能。

第一個(gè)CXL.io取代了PCIe并處理標(biāo)準(zhǔn)設(shè)置功能。將CXL卡插入PCIe插槽后,CXL.io會識別出正在使用CXL,然后關(guān)閉PCIe并啟動CXL.io協(xié)議。它允許系統(tǒng)使用同一組電線和標(biāo)準(zhǔn)PCIe插槽,并根據(jù)需要混合CXL和PCIe資源,這是節(jié)省資源和系統(tǒng)成本的重要手段。

第二個(gè)和第三個(gè)協(xié)議CXL.cache和CXL.memory支持維護(hù)緩存一致性,減少延遲以及使用新的內(nèi)存類型的能力,以及其他優(yōu)勢。

圖1CXL事務(wù)層在單個(gè)鏈路上包含三個(gè)動態(tài)多路復(fù)用子協(xié)議。資料來源:英特爾

從許多方面來看,CXL都是關(guān)于驅(qū)動異構(gòu)計(jì)算的,異構(gòu)計(jì)算正是其中的許多創(chuàng)新之源。在當(dāng)今的異構(gòu)計(jì)算世界中,內(nèi)存連接到CPU,其他存儲庫連接到加速器設(shè)備:GPU,自定義邏輯,F(xiàn)PGA,NIC等。這些內(nèi)存池位于兩個(gè)不同的域中,不同類別的設(shè)備通過不同的機(jī)制與內(nèi)存通信。保持高速緩存一致性是一項(xiàng)挑戰(zhàn)。

連接CPU和連接加速器的內(nèi)存池具有PCI對等訪問。借助CXL及其以內(nèi)存為中心的體系結(jié)構(gòu),它可以將內(nèi)存體系結(jié)構(gòu)和內(nèi)存語義引入到傳統(tǒng)上在I / O總線上的功能。

使用PCIe的替代協(xié)議

CXL利用PCIe中的替代協(xié)議選項(xiàng)。當(dāng)我們使用CXL時(shí),PCIe會關(guān)閉,CXL會接管工作,并為我們提供內(nèi)存類的延遲,而不是I / O類的延遲。

在數(shù)據(jù)中心中,CXL主要在互連體系結(jié)構(gòu)的節(jié)點(diǎn)級層上運(yùn)行,以實(shí)現(xiàn)芯片到芯片的互連。對于機(jī)架和行級別,開放系統(tǒng)Gen-Z互連可以通過直接連接,交換或結(jié)構(gòu)拓?fù)涮峁?shù)據(jù)和設(shè)備的存儲器語義訪問。

CXL和Gen-Z非?;パa(bǔ),前者用于節(jié)點(diǎn),后者用于節(jié)點(diǎn)之外。從CXL的角度來看,Gen-Z可以幫助我們變得更加流暢,當(dāng)同時(shí)部署兩者時(shí),我們將看到很多協(xié)同作用。實(shí)際上,我們認(rèn)為互補(bǔ)性將隨著時(shí)間的流逝而發(fā)展。

CXL與Gen-Z有著很好的關(guān)系,包括正式協(xié)議。目的是使Gen-Z非常有效地連接到CXL。如果工程師希望結(jié)構(gòu)能夠可靠地工作,則任何結(jié)構(gòu)都需要與CPU保持一致的接口。因此,讓Gen-Z在CXL上方的機(jī)架級和行級進(jìn)行更多操作是很有意義的。

非對稱復(fù)雜性是關(guān)鍵

CXL中的一項(xiàng)功能是能夠非對稱地“偏置”系統(tǒng)中的計(jì)算資源。為了保持高速緩存一致性,操作通常會保持“ CPU偏差”,因?yàn)檫@是確保高速緩存一致性最經(jīng)常發(fā)生的地方,是在CPU的“本地代理”處。加速器大多數(shù)時(shí)候都使用特定類別的數(shù)據(jù),它們將使用稍微更簡單的“設(shè)備偏差”。

通過這種非對稱方法,CXL提供了緩存一致性的好處,而不會陷入CPU上本地代理的復(fù)雜性中??偠灾?,非對稱復(fù)雜性是CXL的關(guān)鍵功能,它減輕了緩存一致性接口設(shè)計(jì)的負(fù)擔(dān)。

圖2CXL中的非對稱復(fù)雜性減輕了緩存一致性接口設(shè)計(jì)的負(fù)擔(dān)。資料來源:英特爾

降低CXL的復(fù)雜性將使來自不同供應(yīng)商的處理器能夠輕松建立一致的緩存,這在業(yè)界尚屬首次。CXL的一項(xiàng)關(guān)鍵價(jià)值主張是,利用CPU中的復(fù)雜性而不是在加速器中復(fù)制復(fù)雜性來分解復(fù)雜性的概念。

在CXL中,我們從CPU開始,向北和向南都有可緩存的內(nèi)存,既有它自己的內(nèi)存,也有加速器內(nèi)存。加速器也具有完全相同的功能??梢栽L問CPU內(nèi)存的PCI設(shè)備現(xiàn)在可以訪問CXL下的加速器內(nèi)存。我們對內(nèi)存的兩個(gè)部分都具有這種對稱能力。這兩個(gè)池將成為兩臺機(jī)器均可訪問的一致性內(nèi)存池的一部分。

負(fù)擔(dān)得起地增加存儲容量

數(shù)據(jù)中心系統(tǒng)不可避免地需要增加存儲容量和帶寬。一種解決方案是在DRAM和固態(tài)驅(qū)動器(SSD)之間添加一類持久性存儲器,在許多情況下,它們足以存儲整個(gè)數(shù)據(jù)庫。這種單獨(dú)的存儲層(比DRAM便宜)可以用于各種存儲創(chuàng)新中。

CXL定義了三種類型的設(shè)備:類型1包括具有自己的緩存但沒有附加內(nèi)存的加速器。類型2類的設(shè)備包括已附加內(nèi)存的加速器。在這兩種情況下,都可以保證高速緩存的一致性。

第三類設(shè)備包括支持內(nèi)存緩沖區(qū)和內(nèi)存擴(kuò)展設(shè)備的控制器。系統(tǒng)可以添加更多的DRAM和/或持久性內(nèi)存,但將其移出DDR接口。從邏輯上講,出現(xiàn)的內(nèi)存緩沖區(qū)與其在主內(nèi)存總線上的內(nèi)存緩沖區(qū)沒有什么不同。

啟用分類內(nèi)存

CXL是一種高速互連,并且該聯(lián)盟已致力于顯著減少等待時(shí)間,以實(shí)現(xiàn)分類內(nèi)存。用高效,低延遲的訪問機(jī)制創(chuàng)建共享內(nèi)存池與聯(lián)盟實(shí)現(xiàn)異構(gòu)資源共享的總體目標(biāo)是一致的。

CXL中對Type 3設(shè)備的支持為分離內(nèi)存控制器提供了機(jī)會。隨著數(shù)據(jù)中心處理各種用例,第3類設(shè)備可以更輕松地提供對持久性介質(zhì)或尚未投入生產(chǎn)的新內(nèi)存類型的訪問。

事實(shí)證明,僅僅增加更多的直接連接DRAM太昂貴了。不僅DRAM成本的增長步伐很慢,而且PCB上更多路由層和控制器上更多引腳的復(fù)雜性也很昂貴。

與其增加板上的內(nèi)存,不如增加CXL鏈路的數(shù)量是一種更簡單的方法,它不依賴于并行高速總線。并行DDR接口需要200個(gè)以上的引腳,而CXL可以使每個(gè)封裝的引腳數(shù)更少,并減少PCB層數(shù)。使用CXL串行接口,可以在更理想的位置存儲更長的內(nèi)存,從而改變了存儲設(shè)備上的氣流。

供應(yīng)商可以使用特定于媒體的控制器來構(gòu)建CXL內(nèi)存擴(kuò)展器設(shè)備。一個(gè)系統(tǒng)可以支持多種不同的存儲器類型,包括DDR3,DDR4或DDR5,以及持久性存儲器,低功耗DRAM等,每種類型都具有特定于媒體的控制器,該控制器支持非對稱或不確定的定時(shí)和錯(cuò)誤處理。較慢的內(nèi)存層可以與主層完全隔離,而對直接連接的DRAM雙列直插式內(nèi)存模塊(DIMM)的干擾最小。

圖3代表性的CXL用法簡化了編程模型并提高了性能。資料來源:英特爾

使用CXL,開發(fā)人員可以撥入最適合其應(yīng)用程序的內(nèi)存帶寬,使用持久性內(nèi)存選項(xiàng),并根據(jù)應(yīng)用程序的需要進(jìn)行混合匹配。該聯(lián)盟的目標(biāo)是召集許多不同的行業(yè)參與者,以確保一個(gè)健壯的,不斷發(fā)展的生態(tài)系統(tǒng)。我們確實(shí)需要通過互操作性來進(jìn)行工作,但是盡管我們在PCIe方面擁有良好的記錄,但是我們還需要通過電源,機(jī)械和管理接口來構(gòu)建健壯的CXL生態(tài)系統(tǒng)。

Jeff Hockert是英特爾技術(shù)領(lǐng)導(dǎo)力營銷團(tuán)隊(duì)的高級營銷經(jīng)理。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    16361

    瀏覽量

    178069
  • PCIe
    +關(guān)注

    關(guān)注

    15

    文章

    1239

    瀏覽量

    82657
  • 異構(gòu)計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    101

    瀏覽量

    16299
收藏 人收藏

    評論

    相關(guān)推薦

    內(nèi)存擴(kuò)展CXL加速發(fā)展,繁榮AI存儲

    和IO墻的瓶頸。它通過PCI Express的物理層,提供低延遲和高帶寬的連接,旨在支持下一代數(shù)據(jù)中心的高性能計(jì)算內(nèi)存密集型工作負(fù)載。 ? CXL主要有CXL.io、
    的頭像 發(fā)表于 08-18 00:02 ?4875次閱讀
    <b class='flag-5'>內(nèi)存</b>擴(kuò)展<b class='flag-5'>CXL</b>加速發(fā)展,繁榮AI存儲

    【一文看懂】什么是異構(gòu)計(jì)算?

    隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計(jì)算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計(jì)算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求,異構(gòu)計(jì)算因此應(yīng)運(yùn)而生,成為現(xiàn)代計(jì)算領(lǐng)域的一個(gè)重要方向。
    的頭像 發(fā)表于 12-04 01:06 ?1420次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計(jì)算</b>?

    詳解Arm計(jì)算平臺的優(yōu)勢

    對于人工智能 (AI) 而言,任何單一硬件或計(jì)算組件都無法成為適合各類工作負(fù)載的萬能解決方案。AI 貫穿從云端到邊緣側(cè)的整個(gè)現(xiàn)代計(jì)算領(lǐng)域,為了滿足不同的 AI 用例和需求,一個(gè)可以靈活使用 CPU、GPU 和 NPU 等不同
    的頭像 發(fā)表于 12-03 16:53 ?288次閱讀

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

    關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應(yīng)用場景淺談如下: 優(yōu)勢 異構(gòu)計(jì)算能力 : 異構(gòu)雙核設(shè)計(jì)結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性,能夠針對特定
    發(fā)表于 08-31 08:32

    三星電子計(jì)劃2024年下半年推出CXL存儲

    隨著人工智能(AI)領(lǐng)域數(shù)據(jù)處理需求的爆炸性增長,全球存儲廠商正競相研發(fā)下一代存儲解決方案,以應(yīng)對這一挑戰(zhàn)。三星電子在這一賽道上尤為亮眼,其在Compute Express Link(CXL)高速互聯(lián)存儲技術(shù)上的領(lǐng)先地位尤為顯著
    的頭像 發(fā)表于 08-19 15:36 ?661次閱讀

    打造異構(gòu)計(jì)算新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

    參考設(shè)計(jì)是首個(gè)支持異構(gòu)計(jì)算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計(jì)算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL
    的頭像 發(fā)表于 08-06 14:19 ?320次閱讀
    打造<b class='flag-5'>異構(gòu)計(jì)算</b>新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款<b class='flag-5'>CXL</b>混合資源池參考設(shè)計(jì)

    新思科技CXL 3.1驗(yàn)證解決方案

    、內(nèi)存緩沖區(qū)、智能網(wǎng)絡(luò)接口卡、持久存儲器和固態(tài)驅(qū)動器等設(shè)備之間的開放式行業(yè)標(biāo)準(zhǔn)互連接口。CXL基于PCIe靈活的數(shù)據(jù)帶寬提供了緩存一致性和存儲語義,同時(shí)實(shí)現(xiàn)比PCIe低得多的延時(shí)。
    的頭像 發(fā)表于 08-02 14:43 ?595次閱讀
    新思科技<b class='flag-5'>CXL</b> 3.1驗(yàn)證<b class='flag-5'>解決方案</b>

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計(jì)算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計(jì)算的功能。 在異構(gòu)多處理系統(tǒng),主核心和輔助核心的存在旨在共同協(xié)作,以實(shí)現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計(jì)算:解鎖算力潛能的新途徑

    在這個(gè)數(shù)據(jù)爆炸的時(shí)代,計(jì)算力是推動社會與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運(yùn)行到超級計(jì)算機(jī)的尖端模擬,均依賴強(qiáng)大的計(jì)算能力。但面對多樣化的復(fù)雜計(jì)算任務(wù),單一處理器難以勝任。于是,
    的頭像 發(fā)表于 07-18 08:28 ?7835次閱讀
    <b class='flag-5'>異構(gòu)計(jì)算</b>:解鎖算力潛能的新途徑

    SMART Modular 世邁科技推出高性能服務(wù)器專用全新CXL? 內(nèi)存擴(kuò)充卡系列

    CXL?)內(nèi)存擴(kuò)充卡(AIC)系列,可支持業(yè)界標(biāo)準(zhǔn) DDR5 內(nèi)存模塊。這也是同類產(chǎn)品第一款采用C
    的頭像 發(fā)表于 04-25 10:30 ?505次閱讀

    業(yè)界首創(chuàng)512GB CXL AIC內(nèi)存擴(kuò)展卡,江波龍革新AI與高性能計(jì)算領(lǐng)域內(nèi)存技術(shù)

    、大吞吐量的浮點(diǎn)運(yùn)算。在此背景下,江波龍日前在CFMS2024展出了一款基于Compute Express Link (CXL)技術(shù)的創(chuàng)新內(nèi)存擴(kuò)展設(shè)備——CXL 2.0 AIC內(nèi)存擴(kuò)展
    發(fā)表于 04-17 14:40 ?444次閱讀
    業(yè)界首創(chuàng)512GB <b class='flag-5'>CXL</b> AIC<b class='flag-5'>內(nèi)存</b>擴(kuò)展卡,江波龍革新AI與高性能<b class='flag-5'>計(jì)算</b>領(lǐng)域<b class='flag-5'>內(nèi)存</b>技術(shù)

    高通NPU和異構(gòu)計(jì)算提升生成式AI性能?

    異構(gòu)計(jì)算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計(jì)算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計(jì)的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?799次閱讀

    利用CXL技術(shù)重構(gòu)基于RDMA的內(nèi)存解耦合

    本文提出了一種基于RDMA和CXL的新型低延遲、高可擴(kuò)展性的內(nèi)存解耦合系統(tǒng)Rcmp。其顯著特點(diǎn)是通過CXL提高了基于RDMA系統(tǒng)的性能,并利用RDMA克服了CXL的距離限制。
    發(fā)表于 02-29 10:05 ?3143次閱讀
    利用<b class='flag-5'>CXL</b>技術(shù)重構(gòu)基于RDMA的<b class='flag-5'>內(nèi)存</b>解耦合

    什么是CXL技術(shù)?CXL的三種模式、類型、應(yīng)用

    CXL的目標(biāo):解決CPU和設(shè)備、設(shè)備和設(shè)備之間的內(nèi)存鴻溝。服務(wù)器有巨大的內(nèi)存池和數(shù)量龐大的基于PCIe運(yùn)算加速器,每個(gè)上面都有很大的內(nèi)存。內(nèi)存
    的頭像 發(fā)表于 01-11 16:53 ?2190次閱讀
    什么是<b class='flag-5'>CXL</b>技術(shù)?<b class='flag-5'>CXL</b>的三種模式、類型、應(yīng)用

    三星與Red Hat成功驗(yàn)證CXL內(nèi)存在真實(shí)用戶環(huán)境的運(yùn)行

    CXL因具備強(qiáng)大的接口功能,實(shí)現(xiàn)了CPU、GPU以及內(nèi)存之間的快速連接,被廣泛應(yīng)用于生成式人工智能、自動駕駛及內(nèi)存數(shù)據(jù)庫等項(xiàng)目。利用現(xiàn)有的設(shè)備體系,CXL可大幅度地提高速度、降低延遲并
    的頭像 發(fā)表于 01-04 11:46 ?366次閱讀