0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息剖析智能時(shí)代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機(jī)遇

浪潮存儲 ? 來源:浪潮存儲 ? 2024-12-30 09:43 ? 次閱讀

在當(dāng)今數(shù)字化時(shí)代,算力與存力的協(xié)同增長已成為驅(qū)動(dòng)各行各業(yè)發(fā)展的關(guān)鍵力量。特別是在人工智能AI)這一前沿領(lǐng)域,隨著數(shù)據(jù)量的爆炸式增長,對存儲系統(tǒng)的需求日益復(fù)雜和多樣。近期,在首屆CCF中國存儲大會上,浪潮信息存儲首席架構(gòu)師孫斌深刻剖析了智能時(shí)代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機(jī)遇。

算力增長與新范式

近年來,數(shù)據(jù)中心計(jì)算性能的增長呈現(xiàn)出前所未有的態(tài)勢。據(jù)統(tǒng)計(jì),過去20年間,數(shù)據(jù)中心的計(jì)算性能已經(jīng)增長了超過1000倍。2018年,我們迎來了特定領(lǐng)域架構(gòu)(Domain Specific Architecture, DSA)發(fā)展的黃金時(shí)代,這標(biāo)志著算力增長的新范式已經(jīng)到來。這一范式以通用算力與AI算力的緊密結(jié)合為基礎(chǔ),通過集群擴(kuò)展和xPU多元編程模式,支撐未來20年計(jì)算性能的持續(xù)增長。

在傳統(tǒng)CPU場景中,邏輯控制遵循摩爾定律,盡管近年來性能增長放緩,但眾核與集群擴(kuò)展技術(shù)的應(yīng)用仍然推動(dòng)了性能的不斷提升。而在GPU/TPU/NPU多場景中,并行計(jì)算能力的迅速提升更是令人矚目,近6年來每年性能增長達(dá)2.5倍。CUDA、HIP、OneAPI等編程模型的出現(xiàn),為AI計(jì)算提供了強(qiáng)有力的支持。

智能時(shí)代多元存力需求

然而,隨著AI技術(shù)的廣泛應(yīng)用,智能時(shí)代對存力的需求也呈現(xiàn)出多維度、多層次的特征,數(shù)據(jù)的高效匯聚、析取、流動(dòng)與算子部署成為了關(guān)鍵所在。據(jù)預(yù)測,AI合成新數(shù)據(jù)的規(guī)模增速將顯著加快,到2025年,其在全球數(shù)據(jù)總量中的占比將達(dá)到10%。為了實(shí)時(shí)獲取洞察力并加速數(shù)據(jù)價(jià)值的變現(xiàn),存儲系統(tǒng)需要滿足計(jì)算、存儲、網(wǎng)絡(luò)吞吐率1:1:1的比例,而未來20年存力的增長需求更是高達(dá)100倍以上。

此外,智能時(shí)代的存儲需求還體現(xiàn)在多源、多維、多模、多態(tài)、多域等多個(gè)方面。數(shù)據(jù)來源于多個(gè)行業(yè)、設(shè)備、階段,形態(tài)也多種多樣,包括文本、二進(jìn)制、數(shù)據(jù)庫等。這些數(shù)據(jù)需要在云數(shù)據(jù)中心、邊緣數(shù)據(jù)中心和大型數(shù)據(jù)中心之間高效流動(dòng)和協(xié)同處理。

制約存儲性能提升的隱形枷鎖

盡管存儲系統(tǒng)在性能上取得了顯著進(jìn)步,但存儲節(jié)點(diǎn)仍面臨諸多挑戰(zhàn)。I/O棧依賴的硬件技術(shù)發(fā)展進(jìn)入平緩期,單核IOPS效率、多核擴(kuò)展性、內(nèi)存和IO帶寬與CPU核的比例均呈現(xiàn)下降趨勢。這意味著,保持成本與能耗不變的情況下,兩年翻番的紅利期已經(jīng)結(jié)束。

首先,存儲節(jié)點(diǎn)的緊耦合設(shè)計(jì)限制了其靈活性和擴(kuò)展性。傳統(tǒng)存儲節(jié)點(diǎn)通常采用2/4/5U固定高度,并靜態(tài)配置CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)設(shè)備。這種設(shè)計(jì)雖然簡化了部署和管理,但導(dǎo)致了資源利用率低的問題。由于器部件、設(shè)備、數(shù)據(jù)生命周期不匹配,部分硬件提前淘汰,從而造成資源浪費(fèi)。同時(shí),SSD存控耦合也限制了單盤容量的提升,進(jìn)一步制約了存儲性能的增長。

其次,以CPU為中心編程的I/O棧存在數(shù)據(jù)通量受限的問題。在處理小規(guī)模數(shù)據(jù)時(shí),這種設(shè)計(jì)可能表現(xiàn)良好,但隨著數(shù)據(jù)量的增加,CPU逐漸成為瓶頸,限制了數(shù)據(jù)通量。這使得CPU對數(shù)據(jù)I/O的五類算子(編碼、搬移、比較、查詢、插?。┑奶幚硇什桓?,導(dǎo)致單節(jié)點(diǎn)性能上限僅為百萬級IOPS。

此外,I/O驅(qū)動(dòng)的存儲架構(gòu)還導(dǎo)致AI就緒數(shù)據(jù)準(zhǔn)備周期長。AI就緒數(shù)據(jù)通常需要經(jīng)過清洗、轉(zhuǎn)換、聚合等多個(gè)預(yù)處理步驟,在I/O驅(qū)動(dòng)的存儲架構(gòu)下,這些步驟往往耗時(shí)較長,導(dǎo)致數(shù)據(jù)準(zhǔn)備時(shí)間占比超過80%,模型迭代緩慢。

面向未來數(shù)據(jù)中心的存儲底座

為了應(yīng)對數(shù)據(jù)洪流的洶涌澎湃,存力必須實(shí)現(xiàn)百倍的增長。這一需求不僅是對存儲容量的簡單擴(kuò)張,更是對存儲架構(gòu)設(shè)計(jì)范式的根本性變革。重構(gòu)存儲節(jié)點(diǎn)硬件資源的耦合設(shè)計(jì)、打破以CPU為中心的傳統(tǒng)編程模式,將成為支撐未來20年存儲效率與擴(kuò)展能力百倍提升的關(guān)鍵。

在此背景下,浪潮信息存儲首次提出了打造“機(jī)柜級存儲底座(Bottom of Rack, BoR)”和“數(shù)據(jù)中心級存儲底座(Bottom of Datacenter, BoD)”的創(chuàng)新理念。BoR支持近計(jì)算端按需組合存儲節(jié)點(diǎn)配置和軟件微服務(wù),能夠重構(gòu)多形態(tài)存儲系統(tǒng),滿足全場景綜合負(fù)載需求。而BoD則支持全域、全局、全生命周期的數(shù)據(jù)編制服務(wù),能夠解決數(shù)據(jù)孤島問題,提升數(shù)據(jù)流動(dòng)效率,為AI應(yīng)用提供高質(zhì)量的實(shí)時(shí)數(shù)據(jù),進(jìn)一步簡化部署和運(yùn)維。

浪潮信息在今年5月份CCF秀湖會議提出的“三層三面兩體”新型存儲架構(gòu)理念為BoR和BoD的實(shí)施提供了具體的方向:即向內(nèi)不斷優(yōu)化存儲算法、提升硬件性能、完善軟件功能,以實(shí)現(xiàn)對存儲資源的高效利用和靈活擴(kuò)展;向外積極與云計(jì)算、大數(shù)據(jù)、人工智能等新興技術(shù)融合,推動(dòng)存儲系統(tǒng)的智能化、自動(dòng)化和云化發(fā)展。

近年來,浪潮信息存儲積極探索新型存儲系統(tǒng)與架構(gòu)技術(shù),以應(yīng)對智能時(shí)代的存儲需求。其中,解耦可組合存儲硬件/軟件設(shè)計(jì)v2.0是關(guān)鍵的創(chuàng)新方向。這一研究深入探索控制/計(jì)算、多層異構(gòu)介質(zhì)硬件資源的解耦與互連,以及存儲功能軟件組件的微服務(wù)化與通信機(jī)制。通過AI統(tǒng)籌的存儲I/O棧微服務(wù)、線程、協(xié)程并發(fā)調(diào)度,實(shí)現(xiàn)近線性擴(kuò)展。同時(shí),基于新協(xié)議互連,實(shí)現(xiàn)軟件動(dòng)態(tài)定義邏輯控制節(jié)點(diǎn),實(shí)現(xiàn)存算資源按需彈性組合,SSD模組解耦控制服務(wù)軟硬件與定義盤控協(xié)同規(guī)范,從而支撐SSD容量密度達(dá)到PB級。

此外,浪潮信息存儲還致力于面向數(shù)據(jù)算子的xPU協(xié)同編程新模式的研究。該模式通過聚焦傳統(tǒng)存儲數(shù)據(jù)I/O流和AI就緒的數(shù)據(jù)算子硬件加速技術(shù),旨在建立xPU協(xié)同編程的新模式。通過分布式共享緩存架構(gòu)和數(shù)據(jù)算子硬件加速技術(shù),這一模式能夠?qū)崿F(xiàn)單節(jié)點(diǎn)千萬級IOPS高通量和跨節(jié)點(diǎn)近線性擴(kuò)展,從而大幅提升存儲系統(tǒng)的性能。

在全域全局全生命周期數(shù)據(jù)編織服務(wù)平臺方面浪潮信息存儲也進(jìn)行了深入研究。通過構(gòu)建全域、全局、全生命周期的數(shù)據(jù)編織服務(wù)平臺,實(shí)現(xiàn)API驅(qū)動(dòng)的數(shù)據(jù)容納、處理、安全、流動(dòng)、共享和管理。該平臺突破了數(shù)據(jù)與存儲系統(tǒng)解耦技術(shù),建立了數(shù)據(jù)流通技術(shù)規(guī)范,驅(qū)動(dòng)數(shù)據(jù)跨應(yīng)用、跨系統(tǒng)、跨云共享。同時(shí),主動(dòng)元數(shù)據(jù)管理引擎、數(shù)據(jù)與算子的統(tǒng)籌部署為AI實(shí)時(shí)提供高質(zhì)量的就緒數(shù)據(jù),進(jìn)一步提升了存儲系統(tǒng)的智能化和自動(dòng)化水平。

在智能時(shí)代的大背景下,浪潮信息存儲不斷探索和突破新型存儲系統(tǒng)與架構(gòu)技術(shù),以應(yīng)對日益復(fù)雜和多樣的存儲需求,通過創(chuàng)新舉措正逐步構(gòu)建起一個(gè)高效、可擴(kuò)展、智能化的存儲生態(tài)系統(tǒng)。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,浪潮信息存儲將繼續(xù)引領(lǐng)存儲行業(yè)的發(fā)展潮流,為數(shù)字經(jīng)濟(jì)的繁榮發(fā)展貢獻(xiàn)力量。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    462

    瀏覽量

    23880
  • 存儲系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    413

    瀏覽量

    40869
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    985

    瀏覽量

    14840

原文標(biāo)題:浪潮信息存儲首席架構(gòu)師孫斌:智能時(shí)代的新型存儲系統(tǒng)與架構(gòu)創(chuàng)新

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息如何應(yīng)對智能時(shí)代下的數(shù)據(jù)存儲需求

    隨著智能時(shí)代的全面到來,數(shù)據(jù)量呈現(xiàn)出爆炸性增長,這對存儲系統(tǒng)提出了前所未有的高標(biāo)準(zhǔn)要求。從早期的“百模大戰(zhàn)”演進(jìn)至“千模大戰(zhàn)”,現(xiàn)已邁入了一個(gè)以數(shù)據(jù)
    的頭像 發(fā)表于 11-26 13:42 ?221次閱讀

    浪潮信息AI存儲性能測試的領(lǐng)先之道

    AI技術(shù)的無限可能。近日,在MLCommons的子項(xiàng)目MLPerf Storage v1.0性能基準(zhǔn)評測中,浪潮信息再度展現(xiàn)了在AI存儲領(lǐng)域的卓越實(shí)力。
    的頭像 發(fā)表于 10-29 16:30 ?257次閱讀
    <b class='flag-5'>浪潮信息</b>AI<b class='flag-5'>存儲</b>性能測試的領(lǐng)先之道

    浪潮信息趙帥:開放計(jì)算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    北京2024年8月15日?/美通社/ -- 日前在2024開放計(jì)算中國峰會上,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,智能時(shí)代,開源模型和開放計(jì)算激發(fā)了人工智能產(chǎn)業(yè)生態(tài)的創(chuàng)新活力,面對大模
    的頭像 發(fā)表于 08-15 16:02 ?292次閱讀
    <b class='flag-5'>浪潮信息</b>趙帥:開放計(jì)算創(chuàng)新 應(yīng)對Scaling Law<b class='flag-5'>挑戰(zhàn)</b>

    浪潮信息引領(lǐng)數(shù)據(jù)編排新紀(jì)元,加速釋放數(shù)據(jù)潛能

    在2024年數(shù)據(jù)基礎(chǔ)設(shè)施技術(shù)峰會的璀璨舞臺上,浪潮信息分布式存儲產(chǎn)品線架構(gòu)師Lance Sun博士以其深厚的行業(yè)洞察與前瞻視角,發(fā)表了題為“高效數(shù)據(jù)編排,加速釋放
    的頭像 發(fā)表于 07-03 15:30 ?395次閱讀

    浪潮信息推出AIGC存儲解決方案

    近日,在科技創(chuàng)新的浪潮中,浪潮信息成功舉辦了“元腦中國行”全國巡展的杭州站活動(dòng),此次盛會不僅匯聚了業(yè)界的精英與目光,更見證了浪潮信息在AIGC(人工智能生成內(nèi)容)
    的頭像 發(fā)表于 07-03 11:16 ?731次閱讀

    浪潮信息推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案

    、新一代分布式存儲AS13000G7自身產(chǎn)品優(yōu)勢,新方案從容應(yīng)對大模型應(yīng)用對存儲性能、容量以及數(shù)據(jù)管理等方面的苛刻要求。同時(shí),浪潮信息嘗試性提出GPU計(jì)算集群算力與
    的頭像 發(fā)表于 07-01 19:00 ?1446次閱讀
    <b class='flag-5'>浪潮信息</b>推出基于新一代分布式<b class='flag-5'>存儲</b>平臺AS13000G7的AIGC<b class='flag-5'>存儲</b>解決方案

    CCF-TCIST走進(jìn)浪潮信息 共話AI時(shí)代存儲創(chuàng)新

    ”活動(dòng)啟動(dòng),來自CCF信息存儲技術(shù)專委會、清華大學(xué)、北京大學(xué)、華中科技大學(xué)、華東師范大學(xué)、上海交通大學(xué)、上海理工大學(xué)等單位的十余位存儲領(lǐng)域專家、學(xué)者走進(jìn)
    的頭像 發(fā)表于 06-07 14:27 ?291次閱讀
    CCF-TCIST走進(jìn)<b class='flag-5'>浪潮信息</b> 共話AI<b class='flag-5'>時(shí)代</b><b class='flag-5'>存儲</b>創(chuàng)新

    整數(shù)智能浪潮信息攜手,共創(chuàng)AI數(shù)據(jù)管理新紀(jì)元

    近日,整數(shù)智能浪潮信息兩大科技巨頭正式簽署元腦生態(tài)戰(zhàn)略合作協(xié)議,標(biāo)志著雙方在AI與數(shù)據(jù)科學(xué)領(lǐng)域的合作邁出了堅(jiān)實(shí)步伐。
    的頭像 發(fā)表于 05-31 11:21 ?668次閱讀

    整數(shù)智能浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議

    近日,整數(shù)智能浪潮信息兩大業(yè)界巨頭正式簽署元腦生態(tài)戰(zhàn)略合作協(xié)議,共同開啟AI與數(shù)據(jù)科學(xué)領(lǐng)域的新篇章。
    的頭像 發(fā)表于 05-27 11:35 ?666次閱讀

    整數(shù)智能浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議

    近日,整數(shù)智能浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將秉持協(xié)同共生、開放共贏的原則,在元腦生態(tài)的框架內(nèi)開展AI與數(shù)據(jù)科學(xué)領(lǐng)域的深度協(xié)作
    的頭像 發(fā)表于 05-27 11:21 ?459次閱讀
    整數(shù)<b class='flag-5'>智能</b>與<b class='flag-5'>浪潮信息</b>簽署元腦生態(tài)戰(zhàn)略合作協(xié)議

    浪潮信息發(fā)布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優(yōu)化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統(tǒng),結(jié)合新一代數(shù)據(jù)加速引擎DataTurbo,為用戶提供卓越的
    的頭像 發(fā)表于 05-14 10:03 ?577次閱讀

    【中心動(dòng)態(tài)】 走進(jìn)浪潮信息

    5月8日,RISC-V國際人才培養(yǎng)認(rèn)證中心主任蔣學(xué)剛一行,到訪浪潮電子信息產(chǎn)業(yè)股份有限公司(以下簡稱“浪潮信息”),受到深圳區(qū)域副總經(jīng)理段青云、產(chǎn)品經(jīng)理陶耀民的熱情接待。浪潮信息是全球
    的頭像 發(fā)表于 05-13 17:42 ?459次閱讀
    【中心動(dòng)態(tài)】 走進(jìn)<b class='flag-5'>浪潮信息</b>

    為大模型專門優(yōu)化 浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎
    的頭像 發(fā)表于 05-10 16:37 ?438次閱讀
    為大模型專門優(yōu)化 <b class='flag-5'>浪潮信息</b>發(fā)布分布式全閃<b class='flag-5'>存儲</b>AS13000G7-N系列

    浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

    近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎DataTurbo,
    的頭像 發(fā)表于 05-08 09:38 ?575次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布為大模型專門優(yōu)化的分布式全閃<b class='flag-5'>存儲</b>AS13000G7-N系列

    XEDP與KeyarchOS完成浪潮信息澎湃技術(shù)認(rèn)證

    澎湃技術(shù)認(rèn)證。 經(jīng)聯(lián)合測試, 雙方產(chǎn)品功能兼容性良好,整體運(yùn)行流暢,性能表現(xiàn)優(yōu)異,滿足用戶在云計(jì)算、大數(shù)據(jù)、人工智能領(lǐng)域對企業(yè)級數(shù)據(jù)存儲
    的頭像 發(fā)表于 02-27 17:56 ?478次閱讀
    XEDP與KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技術(shù)認(rèn)證