挑戰(zhàn)傳統(tǒng),打破限制,勇攀高峰,打破常規(guī)者們在尋求開創(chuàng)性解決方案的過程中重塑規(guī)則。繼SK海力士品牌短片《誰是打破常規(guī)者》播出后,將推出一系列文章,展示公司在重塑技術(shù)、重新定義行業(yè)標準方面采取的各種“打破常規(guī)”的創(chuàng)新舉措。本系列第七篇文章將深入探討SK海力士在CXL技術(shù)領(lǐng)域的研發(fā)進展。
當今世界離不開數(shù)據(jù)的運轉(zhuǎn)——網(wǎng)絡中不斷涌動的1和0的數(shù)據(jù)浪潮,為從流媒體服務到人工智能等各類應用提供了源源不斷的動力。為了應對這場數(shù)據(jù)洪流,數(shù)據(jù)中心必須采用更先進的存儲解決方案,以滿足日益增長的性能需求。
然而,傳統(tǒng)的存儲器擴展方法面臨諸多局限。處理器和存儲技術(shù)的限制,加之數(shù)據(jù)中心成本和能耗的不斷攀升,愈發(fā)凸顯了對革命性方法的迫切需求。因此,CXL(Compute Express Link)應運而生,這是一項具有變革意義的存儲器互聯(lián)技術(shù),旨在解決人工智能時代所帶來的挑戰(zhàn)。
本篇Rulebreakers’ Revolutions系列文章將介紹SK海力士在CXL解決方案領(lǐng)域的研發(fā)歷程,詳細講述公司如何克服行業(yè)規(guī)格缺失等挑戰(zhàn),并為CXL生態(tài)系統(tǒng)做出重要貢獻,最終確立其在CXL領(lǐng)域的領(lǐng)先地位。
使命:利用新型互聯(lián)技術(shù)擴展存儲容量
在人工智能時代,數(shù)據(jù)中心亟需不斷擴展其存儲容量,以應對日益增長的數(shù)據(jù)量。然而,采用傳統(tǒng)方法擴展存儲容量的成本過高且效率低下。例如,在單個CPU系統(tǒng)中添加太字節(jié)(TB)級存儲容量,將顯著增加總體擁有成本(TCO)1和功耗。試圖通過增加存儲通道或集成更大容量的存儲器來解決這一問題,往往會導致能耗和熱量的大幅上升,從而增加冷卻系統(tǒng)和管理成本。這些現(xiàn)象凸顯了設(shè)計創(chuàng)新型存儲系統(tǒng)的必要性,這些系統(tǒng)能夠以更快、更高效和更具成本效益的方式處理數(shù)據(jù)。
1總體擁有成本(TCO, Total Cost of Ownership):購置、安裝和維護產(chǎn)品的過程中產(chǎn)生的所有成本,其中包括了采買、能耗及維護費用。
數(shù)據(jù)中心亟需增加存儲容量,
以滿足人工智能時代日益增長的需求
過去十年間,為了滿足市場需求,業(yè)界持續(xù)致力于開發(fā)新的存儲器互聯(lián)技術(shù)。這一技術(shù)是指處理器和存儲器之間交換數(shù)據(jù)的方法,在數(shù)據(jù)處理速度和效率方面起到至關(guān)重要的決定性作用。在傳統(tǒng)的存儲架構(gòu)中,存儲器與附近的單個處理器通過物理方式連接,當應用程序未充分使用存儲器時,往往會導致存儲資源供應過剩。而如CXL等的新興存儲器互聯(lián)技術(shù),則可以通過允許多個處理器共享存儲容量來提高效率,從而解決這一問題。
這引發(fā)了業(yè)界對CXL的極大關(guān)注,然而,由于此項技術(shù)沒有先例可循,且初期缺乏行業(yè)制定的規(guī)格,所以其開發(fā)過程面臨諸多挑戰(zhàn)。JEDEC固態(tài)技術(shù)協(xié)會(JEDEC Solid State Technology Association)2所制定的規(guī)格通常是為DRAM產(chǎn)品而設(shè),在缺失此類行業(yè)規(guī)格的情況下,CXL的開發(fā)過程從根本上而言,比一般情況更為復雜。
2JEDEC固態(tài)技術(shù)協(xié)會(JEDEC Solid State Technology Association):一個擁有超過350家成員公司,負責制定全球微電子行業(yè)公開標準的領(lǐng)導機構(gòu)。
在缺乏行業(yè)規(guī)格指導的情況下,SK海力士面臨著開發(fā)全新CXL產(chǎn)品以突破存儲器擴展壁壘的挑戰(zhàn)。為了應對這一挑戰(zhàn),公司充分發(fā)揮其深厚的內(nèi)部專業(yè)知識,并積極與行業(yè)合作伙伴攜手并進。
探索未知:從零開始開發(fā)開創(chuàng)性CXL技術(shù)
自2019年CXL問世以來,SK海力士迅速意識到該技術(shù)能夠滿足日益增長的存儲容量擴展需求。作為一種開放性的行業(yè)互聯(lián)技術(shù),CXL統(tǒng)一了存儲器、存儲裝置和處理器等不同系統(tǒng)設(shè)備的接口,支持存儲容量共享等功能,使多個處理器能夠訪問同一存儲器,從而提升數(shù)據(jù)共享效率。同時,它還支持存儲池化(Memory Pooling),將來自共同存儲池的存儲器分配給不同處理器,以提高效率。此外,CXL還實現(xiàn)了存儲器切換功能,允許數(shù)百個設(shè)備(如處理器)在獨立處理數(shù)據(jù)的同時共享存儲資源。
除了這些創(chuàng)新功能外,SK海力士在觀察到市場和客戶對CXL技術(shù)認可度不斷增加,并意識到其在解決技術(shù)和成本挑戰(zhàn)方面的潛力后,對該技術(shù)的前景愈加堅定。然而,公司必須克服一個重大阻礙才能啟動項目,即首先解決行業(yè)規(guī)格缺失的問題。因此,在參與CXL標準化工作并與客戶合作確定規(guī)格后,SK海力士迅速著手制定了內(nèi)部基本需求文件。公司還與CXL控制器制造商合作,為規(guī)格文件制定了控制器要求。此外,SK海力士還與JEDEC固態(tài)技術(shù)協(xié)會和CXL聯(lián)盟(CXL Consortium)3合作,積極推動業(yè)內(nèi)CXL標準中DRAM相關(guān)規(guī)范的完善。
3CXL聯(lián)盟(CXL Consortium):一個致力于制定CXL技術(shù)規(guī)格的開放性行業(yè)標準組織。
通過擴展系統(tǒng)存儲容量和帶寬,SK海力士的CXL技術(shù)客服了存儲器擴展難題
在協(xié)助制定行業(yè)標準和開發(fā)相關(guān)規(guī)格后,SK海力士加快了CXL技術(shù)的研發(fā)。在此過程中,SK海力士確定了滿足客戶需求的關(guān)鍵標準,即成本效益、高容量、優(yōu)化帶寬和可靠性。
首先,成本效益在CXL研發(fā)過程中至關(guān)重要。抵消CXL控制器高昂成本的關(guān)鍵在于將模塊等存儲介質(zhì)的費用降至最低。鑒于高容量對促進大規(guī)模數(shù)據(jù)處理非常重要,公司認為CXL存儲器的存儲容量應達到現(xiàn)有DDR產(chǎn)品的2到4倍。此外,必須優(yōu)化帶寬設(shè)計,以充分發(fā)揮CXL模塊的性能潛力。最后,可靠性和數(shù)據(jù)完整性須與主機存儲器的高標準相匹配,從而贏得客戶的信任。
為了滿足這些標準,SK海力士的多個部門正在協(xié)同努力,致力于將TB級存儲器打造成更加經(jīng)濟高效的解決方案。一方面,公司開創(chuàng)性地研發(fā)了存儲池化技術(shù),以實現(xiàn)多個設(shè)備之間的資源共享。另一方面,還成功開發(fā)了近內(nèi)存處理(NMP, Near-Memory Processing)4技術(shù),從而在數(shù)據(jù)源附近進行數(shù)據(jù)處理。這些創(chuàng)新技術(shù)有望為高性能計算(HPC)、存儲器內(nèi)數(shù)據(jù)庫和人工智能等領(lǐng)域帶來顯著優(yōu)勢。
4近內(nèi)存處理(NMP, Near-memory processing):一種在數(shù)據(jù)存儲附近執(zhí)行計算的技術(shù),能夠降低延遲并提升人工智能和高性能計算(HPC)等高帶寬任務的性能。
通過這些不懈的努力,SK海力士已成功推進了開創(chuàng)性CXL產(chǎn)品的研發(fā),這些產(chǎn)品將徹底顛覆存儲器市場。
SK海力士不斷壯大的產(chǎn)品陣容推動CXL的未來發(fā)展
自2022年開發(fā)出首款基于DDR5的CXL樣品以來,SK海力士不斷加強其CXL產(chǎn)品陣容,其中包括創(chuàng)新型CMM-DDR5(CXL Memory Module-Double Data Rate 5)。采用第五代高速PCIe連接,CMM-DDR5可確保流暢、快速的數(shù)據(jù)處理。同時,CMM-DDR5提供高達128GB的容量,可滿足當今人工智能和高性能計算應用對高容量的需求。此外,該模塊還具有高水平的電源效率和安全性。
真實性能測試突顯了CMM-DDR5所帶來的變革性影響。與僅搭載DDR5 DRAM的系統(tǒng)相比,該產(chǎn)品可將系統(tǒng)帶寬提升82%,容量提升100%。測試結(jié)果進一步表明,在人工智能運行時,每秒令牌性能(Token Per Second Performance)提升高達31%。而在高性能計算領(lǐng)域,其吞吐量效率更是躍升33%。CMM-DDR5不僅展現(xiàn)出卓越的性能表現(xiàn),同時符合JEDEC固態(tài)技術(shù)協(xié)會和CXL聯(lián)盟的標準。目前,隨著CMM-DDR5產(chǎn)品逐步邁向量產(chǎn)階段,客戶正在積極開展對其進行驗證和認證的工作。
SK海力士基于CXL的CMM-DDR5,可有效提升人工智能和高性能計算的性能
SK海力士的其他CXL解決方案還包括Niagara 2.0,這是一款集成硬件和軟件的綜合性解決方案,允許多臺主機高效共享大型存儲池,從而最大限度地減少未利用或未被充分利用的存儲容量。此外,CMM-Ax(CXL Memory Module-Ax)則是一種針對計算工作負載而優(yōu)化設(shè)計的高性能內(nèi)存模塊,在提高人工智能和數(shù)據(jù)中心效率方面表現(xiàn)突出。
除了在硬件領(lǐng)域的顯著進步,SK海力士還開發(fā)了異構(gòu)存儲器軟件開發(fā)套件(HMSDK,Heterogeneous Memory Software Development Kit),以最大限度地發(fā)揮其CXL存儲器的潛力。該軟件工具包已成功集成到Linux操作系統(tǒng)中,進一步提高了其可訪問性和實用性。硬件和軟件解決方案的協(xié)同開發(fā)及其標準化工作,彰顯了SK海力士對致力于創(chuàng)建一個蓬勃發(fā)展的CXL生態(tài)系統(tǒng)的不懈追求。
打破常規(guī)者專訪:下一代存儲器與存儲裝置部,崔源夏(Thomas)
本文采訪了下一代存儲器與存儲裝置部門的杰出工程師(DE,Distinguished Engineer)5崔源夏(Thomas),深入探討了公司在CXL技術(shù)開發(fā)方面取得的突破性思維。崔源夏負責JEDEC固態(tài)技術(shù)協(xié)會和CXL聯(lián)盟的標準化工作,并為CXL等下一代存儲器開辟道路,采訪中他詳細闡述了CXL的發(fā)展歷程以及其未來可能帶來的影響。
5杰出工程師(DE, Distinguished Engineer):是SK海力士的資深工程師,在各自領(lǐng)域出類拔萃,負責解決技術(shù)難題并指導下一代人才。
Q在研發(fā)行業(yè)領(lǐng)先的CXL技術(shù)時,您和您的團隊如何展現(xiàn)出打破常規(guī)的思維?
A“在CXL研發(fā)過程中,我們秉持SK海力士VWBE6理念的工作原則,并借鑒DRAM和NAND閃存產(chǎn)品的豐富研發(fā)經(jīng)驗,主動向客戶提出工作方法和初步的CXL需求設(shè)想。提前明確需求為我們深入探索CXL技術(shù)創(chuàng)造了更多機會,最終成功研發(fā)出首款CXL存儲器產(chǎn)品。”
6自覺自愿地發(fā)揮才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理體系(SKMS)中強調(diào)的員工價值觀之一。
“對我而言,我構(gòu)想了一種將標準化和驗證方法相結(jié)合,以融合DRAM和NAND閃存的創(chuàng)新方法論,并在CXL聯(lián)盟中獨立提出并完善了與DRAM相關(guān)的功能。通過這些努力,我深感自豪能夠為公司最初的CXL部署戰(zhàn)略貢獻一份力量。這表明,即便像探索CXL那樣踏入未知領(lǐng)域,我們也可以憑借自身的創(chuàng)新精神和堅韌毅力,找到解決新問題的答案?!?/p>
“此外,我自愿在JEDEC固態(tài)技術(shù)協(xié)會和CXL聯(lián)盟中擔任要職,以此助力公司在標準化工作領(lǐng)域的地位不斷提升。”
Q您如何看待CXL在未來人工智能生態(tài)系統(tǒng)中的發(fā)展?
A“CXL有望被構(gòu)建成一個能夠?qū)崿F(xiàn)超大存儲容量共享的生態(tài)系統(tǒng)。若要在人工智能時代進一步拓展其應用,CXL亟需支持計算節(jié)點,以確保1TB以上的高性價比存儲器可以按需提供帶寬,并在存儲層面保持可靠性和安全性。這將有助于降低總體擁有成本,提高系統(tǒng)平臺內(nèi)的存儲器利用率?!?/p>
“構(gòu)建如此龐大的生態(tài)系統(tǒng),絕非SK海力士一己之力所能實現(xiàn)。這需要GPU和CPU制造商、CXL控制器和交換機供應商,以及CXL知識產(chǎn)權(quán)(IP)公司的緊密協(xié)作。我們計劃與這些機構(gòu)攜手合作,以進一步推動和壯大CXL生態(tài)系統(tǒng)?!?/p>
-
處理器
+關(guān)注
關(guān)注
68文章
19404瀏覽量
230957 -
存儲器
+關(guān)注
關(guān)注
38文章
7528瀏覽量
164243 -
人工智能
+關(guān)注
關(guān)注
1796文章
47643瀏覽量
239904 -
SK海力士
+關(guān)注
關(guān)注
0文章
973瀏覽量
38658
原文標題:[Rulebreakers’ Revolutions] CXL技術(shù)如何在人工智能時代擴展數(shù)據(jù)中心存儲容量的極限
文章出處:【微信號:SKhynixchina,微信公眾號:SK海力士】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論