0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美光高管:AI PC存儲遠(yuǎn)超“基準(zhǔn)要求”,兩大策略應(yīng)對數(shù)據(jù)中心“存儲池”

花茶晶晶 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-10-18 09:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)生成式AI帶來的產(chǎn)業(yè)技術(shù)革新不僅在于性能越來越強大的GPU,它同時正在推進存儲產(chǎn)品的變化和技術(shù)的進步。近日,美光副總裁暨客戶端存儲事業(yè)部總經(jīng)理Prasad Alluri在接受包括電子發(fā)燒友網(wǎng)在內(nèi)的少數(shù)媒體采訪時指出,與過往不同,閃存和內(nèi)存曾各自為政,主要致力于提高密度。AI的興起帶來了兩大轉(zhuǎn)變,一是與系統(tǒng)架構(gòu)的協(xié)同優(yōu)化;二是將能效作為關(guān)鍵優(yōu)化參數(shù)。為此,美光科技正積極優(yōu)化存儲產(chǎn)品、賦能AI在數(shù)據(jù)中心、PC、智能手機乃至汽車等各領(lǐng)域的應(yīng)用與發(fā)展。

AI數(shù)據(jù)中心:兩大存儲池的不同存儲策略

Prasad Alluri表示,在探討AI基礎(chǔ)設(shè)施對數(shù)據(jù)中心存儲的具體影響時,我們可以將其視為兩個獨立的存儲池來分析。

首先,存在一個龐大的數(shù)據(jù)池,用于存儲供模型訓(xùn)練所需的數(shù)據(jù)。以GPT-4為例,據(jù)估算,其訓(xùn)練過程消耗了互聯(lián)網(wǎng)上約四分之一的數(shù)據(jù),這足以說明大模型所需數(shù)據(jù)的龐大規(guī)模。為了訓(xùn)練這類模型,必須具備存儲海量數(shù)據(jù)的能力,我們可以形象地稱之為“數(shù)據(jù)湖”,即所有待訓(xùn)練數(shù)據(jù)均匯聚于此。

對于這一存儲場景,最關(guān)鍵的屬性在于能夠高效且經(jīng)濟地傳輸數(shù)據(jù)。將容量與經(jīng)濟性相結(jié)合,意味著需要摒棄主要依賴大容量硬盤驅(qū)動器的傳統(tǒng)架構(gòu),轉(zhuǎn)而采用大容量SSD。此舉不僅能減少物理占用空間,還能降低能耗,從而提升整體能源經(jīng)濟性。在此方面,美光科技推出的6500 ION系列產(chǎn)品正是針對大容量存儲需求而優(yōu)化的理想解決方案。

另一方面是訓(xùn)練過程實際發(fā)生的存儲池,即緊鄰GPU的存儲池。此時,需考慮的是如何將數(shù)據(jù)湖中的數(shù)據(jù)高效送入GPU內(nèi)存以供訓(xùn)練。在此過程中,設(shè)備的讀寫性能至關(guān)重要,尤其是隨機讀取性能。對于這類靠近GPU訓(xùn)練集群的存儲,美光9550 SSD從設(shè)計之初便旨在滿足這些需求。9550 SSD隨機讀取性能領(lǐng)先業(yè)界,速率高達(dá)3,300 KIOPS,這正是訓(xùn)練集群所亟需的。

此外,美光9550 SSD提供業(yè)界領(lǐng)先的能效,并在支持各類AI工作負(fù)載方面表現(xiàn)出眾,包括使用大規(guī)模存儲加速器(BaM)進行圖神經(jīng)網(wǎng)絡(luò)(GNN)訓(xùn)練(SSD平均功耗降低高達(dá)43%,整體系統(tǒng)能耗減少高達(dá)29%)、NVIDIA Magnum IO GPUDirect Storage(每傳輸1TB數(shù)據(jù),SSD能耗降低高達(dá)81%)、MLPerf(SSD能耗降低高達(dá)35%,系統(tǒng)能耗降低高達(dá)13%)以及使用Microsoft DeepSpeed對Llama 大語言模型(LLM)訓(xùn)練進行微調(diào)(SSD能耗降低高達(dá) 21%)。

73f6c7253fc84771b38ea85c69216d33~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2024101809093961CDC802EC1C8B66A1C8&x-expires=2147483647&x-signature=1TAcqvFvlorBSVmzTuWM6nTjDgQ%3D

AI PC的存儲需求,將遠(yuǎn)超微軟的“基準(zhǔn)要求”

微軟為AI PC產(chǎn)品Copilot+設(shè)定了基準(zhǔn)要求,其中NPU的算力起始于40 TOPS,內(nèi)存方面則規(guī)定了至少16GB的容量,以及256GB的存儲空間作為最低配置。不過,Prasad Alluri表示,這些僅是基礎(chǔ)指導(dǎo)線,并未全面界定AI PC的真正內(nèi)涵。

“要深入理解AI PC,我們需將焦點放在用戶體驗上。AI PC的核心在于通過諸如翻譯或圖像編輯等任務(wù)來提升生產(chǎn)力,且這些任務(wù)需在設(shè)備上高效完成。正是這種整體體驗定義了AI PC,而非單純的技術(shù)規(guī)格。為了滿足用戶的這些期望,我們認(rèn)為所需的內(nèi)存量遠(yuǎn)超最低指導(dǎo)線。事實上,當(dāng)前多數(shù)OEM在打造AI PC時,已配備了24GB至32GB的DRAM?!?/p>

從存儲角度來看,盡管OEM目前提供的最低容量為512GB,但我們認(rèn)為對于AI工作負(fù)載而言,更理想的容量應(yīng)接近1TB。

不過,這不僅僅關(guān)乎容量大小,功耗效率和性能同樣至關(guān)重要。在存儲領(lǐng)域,目標(biāo)是以最高效的方式將AI模型從存儲加載到內(nèi)存中。為此,需要在不增加功耗的前提下,獲得盡可能高的吞吐量。美光高性能客戶端3500 SSD在相同功耗下提供了業(yè)界領(lǐng)先的性能。

針對于AI PC,美光科技加速了LPDDR5X在AI PC中的應(yīng)用普及。與同類SODIMM產(chǎn)品相比,LPDDR5X的性能提升了約1.5倍。此外,還專為AI個人電腦設(shè)計了一種新型內(nèi)存模塊——LPCAMM2。與傳統(tǒng)SODIMM產(chǎn)品相比,LPCAMM2不僅性能提升1.5倍,而且功耗降低高達(dá)58%,空間節(jié)省達(dá)64%。這款新產(chǎn)品于今年早些時候推出,主要圍繞三大目標(biāo)設(shè)計:提升性能、降低功耗以及減小體積。在標(biāo)準(zhǔn)PC中,通常需要兩個SODIMM并排放置,占用主板大量空間。而LPCAMM2則將這些功能集成到一個DIMM中,從而顯著提升了電源效率和性能。

在當(dāng)前的PC環(huán)境中,以我們內(nèi)部使用的Microsoft Copilot為例,它高度依賴云計算,將大部分復(fù)雜任務(wù)卸載到云端。然而,未來的AI個人電腦將能夠在本地處理部分工作負(fù)載,減少對云端的依賴。這樣,模型復(fù)雜性將降低,AI個人電腦能在保持高性能的同時,實現(xiàn)更高效的能源利用,提高數(shù)據(jù)處理的靈活性和速率。

在PC的本地存儲中完全可以放置多個模型,并根據(jù)用戶查詢的上下文加載這些模型。例如,如果用戶需要語音轉(zhuǎn)文本服務(wù),您可以加載相關(guān)模型;如果用戶需要圖像創(chuàng)建,您可以加載相應(yīng)的模型。在此過程中,關(guān)鍵在于以節(jié)能方式從存儲中加載數(shù)據(jù),因此,SSD的性能至關(guān)重要,它需在最低功耗下實現(xiàn)最高吞吐量,即充分利用PCIe 4.0 的四通道。

為此,美光科技的3500 SSD不僅在最低功耗下提供行業(yè)領(lǐng)先的性能。同時,該SSD中內(nèi)置了啟發(fā)式算法。當(dāng)檢測到AI工作負(fù)載時,驅(qū)動器可以主動加載所需的正確模型或數(shù)據(jù)。這些就是為實現(xiàn)高效能和電源效率所做的優(yōu)化。

QLC越發(fā)重要,閃存層數(shù)應(yīng)從縱橫向提升

當(dāng)本網(wǎng)記者問及當(dāng)前QLC對于AI存儲越來越重要,美光的看法與規(guī)劃,以及3D NAND閃存的層數(shù)將如何發(fā)展等問題時,Prasad Alluri也給出了詳細(xì)的分析。

Prasad Alluri表示,從NAND技術(shù)的視角來看,最關(guān)鍵的因素在于每平方毫米的容量密度。也就是我們最終追求的是比特面密度(Bit Areal Density),因為這將有助于降低成本。

但是,有多種方法可以實現(xiàn)這一目的。其中一種是對單個物理單元提升容量。這正是四階存儲單元(QLC)技術(shù)大顯身手的地方,而我們在這一領(lǐng)域始終保持領(lǐng)先地位,特別是在PC市場率先推出了這一技術(shù)。目前,美光科技在該領(lǐng)域的市場占有率位居前列。盡管我們尚未宣布針對數(shù)據(jù)中心的具體計劃,但我們?nèi)栽诔掷m(xù)投資QLC技術(shù),并致力于提高容量密度,這是推動技術(shù)進步的重要途徑之一。

另外,在NAND技術(shù)中可以通過堆疊更多層來增加單位面積內(nèi)的容量。美光科技最近推出了第九代(G9)TLC NAND技術(shù)。雖然目前尚不清楚3D NAND的層數(shù)何時會達(dá)到極限,但在未來的幾代產(chǎn)品中,美光的閃存層數(shù)將繼續(xù)增加。

bd448c41ffe9493195be5c4f4abf2a9c~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2024101809093961CDC802EC1C8B66A1C8&x-expires=2147483647&x-signature=%2Fg4nVUtolQuElK%2Fkqy2WFl3hcN4%3D

但他也強調(diào),層數(shù)并非實現(xiàn)比特面密度提升的唯一關(guān)鍵因素,因為橫向擴展同樣至關(guān)重要。除了關(guān)注3D堆疊層的數(shù)量外,還需要考慮單元之間水平位置的接近程度。這種橫向優(yōu)化是美光提高比特面密度的另一個關(guān)鍵領(lǐng)域。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4311

    瀏覽量

    85838
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4775

    瀏覽量

    72120
  • 美光
    +關(guān)注

    關(guān)注

    5

    文章

    712

    瀏覽量

    51419
  • AI PC
    +關(guān)注

    關(guān)注

    0

    文章

    123

    瀏覽量

    243
收藏 人收藏

    評論

    相關(guān)推薦

    科技推出業(yè)界首款PCIe 5.0 60TB數(shù)據(jù)中心SSD

    科技股份有限公司(納斯達(dá)克股票代碼:MU)近日宣布已開始與客戶進行6550 ION NVMe SSD的認(rèn)證。6550 ION SSD是全球速率領(lǐng)先的60TB
    的頭像 發(fā)表于 12-20 09:06 ?226次閱讀

    科技推出新款存儲解決方案

    隨著人工智能(AI)不斷改變行業(yè)并推動創(chuàng)新,數(shù)據(jù)中心需要能夠跟上存儲解決方案的發(fā)展步伐。為滿足這一需求,我很高興地宣布推出新款存儲解決方案——
    的頭像 發(fā)表于 11-18 10:32 ?215次閱讀
    <b class='flag-5'>美</b><b class='flag-5'>光</b>科技推出新款<b class='flag-5'>存儲</b>解決方案

    看2024年AI數(shù)據(jù)中心、AI PC存儲趨勢

    在接受包括電子發(fā)燒友網(wǎng)在內(nèi)的少數(shù)媒體采訪時指出,與過往不同,閃存和內(nèi)存曾各自為政,主要致力于提高密度。AI的興起帶來了兩大轉(zhuǎn)變,一是與系統(tǒng)架構(gòu)的協(xié)同優(yōu)化;二是將能效作為關(guān)鍵優(yōu)化參數(shù)。為此,
    的頭像 發(fā)表于 10-13 15:22 ?1404次閱讀
    <b class='flag-5'>美</b><b class='flag-5'>光</b><b class='flag-5'>高</b><b class='flag-5'>管</b>看2024年<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>、<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>的<b class='flag-5'>存儲</b>趨勢

    數(shù)據(jù)中心對MOS性能的要求

    數(shù)據(jù)中心作為現(xiàn)代信息技術(shù)的核心基礎(chǔ)設(shè)施,承載著數(shù)據(jù)存儲、處理和傳輸?shù)闹匾蝿?wù)。在這些任務(wù)中,MOS(金屬氧化物半導(dǎo)體場效應(yīng)晶體)作為關(guān)鍵
    的頭像 發(fā)表于 10-11 11:22 ?273次閱讀

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用是極其重要且廣泛的,它們不僅是數(shù)據(jù)中心存儲系統(tǒng)的核心組件,還直接關(guān)系到數(shù)據(jù)處理的效率、可靠性和安全性。以下將詳細(xì)闡述半導(dǎo)體
    的頭像 發(fā)表于 08-20 10:17 ?620次閱讀

    Solidigm推出兩款數(shù)據(jù)中心固態(tài)存儲硬盤(SSD)

    與D7-PS1030。這款基于PCIe 5.0接口的超高速SSD,旨在滿足從通用服務(wù)器到高級AI及機器學(xué)習(xí)應(yīng)用等多樣化工作負(fù)載的嚴(yán)苛IO需求,標(biāo)志著數(shù)據(jù)中心存儲性能的新紀(jì)元。
    的頭像 發(fā)表于 08-07 16:24 ?613次閱讀

    發(fā)布全新數(shù)據(jù)中心SSD

    近日,全球領(lǐng)先的存儲解決方案提供商科技股份有限公司宣布了一項重大創(chuàng)新成果——9550 NVMe? SSD的正式推出。這款專為
    的頭像 發(fā)表于 07-30 16:41 ?645次閱讀

    推出數(shù)據(jù)中心SSD產(chǎn)品9550 NVMe SSD新品

    科技股份有限公司(納斯達(dá)克股票代碼:MU)近日宣布,推出數(shù)據(jù)中心 SSD 產(chǎn)品 9550 NVMe SSD,性能業(yè)界領(lǐng)先,同時具備卓
    的頭像 發(fā)表于 07-29 18:12 ?1157次閱讀

    推出9550系列數(shù)據(jù)中心PCIe 5.0 SSD

    科技巨頭近日震撼宣布,成功推出其革命性的9550系列數(shù)據(jù)中心PCIe 5.0 SSD,一舉奠定了全球最快數(shù)據(jù)中心存儲解決方案的新高度。這款專為應(yīng)
    的頭像 發(fā)表于 07-26 15:49 ?384次閱讀

    憶聯(lián)全場景存儲解決方案助力金融數(shù)據(jù)中心存力飛躍

    AI時代,數(shù)據(jù)中心建設(shè)正在經(jīng)歷一場深刻的變革。依照行業(yè)最高標(biāo)準(zhǔn)建設(shè)的金融數(shù)據(jù)中心需要怎樣的存力?當(dāng)高密度、大容量、可靠、高性能存儲逐步成為
    的頭像 發(fā)表于 07-23 18:15 ?1141次閱讀
    憶聯(lián)全場景<b class='flag-5'>存儲</b>解決方案助力金融<b class='flag-5'>數(shù)據(jù)中心</b>存力飛躍

    率先量產(chǎn)232層QLC NAND產(chǎn)品

    科技再次領(lǐng)跑行業(yè)前沿,近日宣布其232層QLC NAND產(chǎn)品已成功實現(xiàn)量產(chǎn),并已開始應(yīng)用于部分Crucial英睿達(dá)固態(tài)硬盤中。這一突破性的技術(shù)不僅滿足了客戶端對數(shù)據(jù)存儲
    的頭像 發(fā)表于 05-09 14:53 ?608次閱讀

    以信任為基,圍繞AI推動存儲革命

    為基礎(chǔ)的存儲革命。 ? 在這場革命中,不僅提供高性能的存儲產(chǎn)品,更是在AI時代構(gòu)建起信任的基石,確保
    發(fā)表于 04-01 09:15 ?714次閱讀
    以信任為基,圍繞<b class='flag-5'>AI</b>,<b class='flag-5'>美</b><b class='flag-5'>光</b>推動<b class='flag-5'>存儲</b>革命

    數(shù)據(jù)中心存儲的趨勢

    隨著數(shù)據(jù)存儲需求的持續(xù)增長,數(shù)據(jù)中心存儲技術(shù)和架構(gòu)不斷發(fā)展以滿足企業(yè)和消費者的需求。在本節(jié)中,我們將分析數(shù)據(jù)中心存儲未來的一些關(guān)鍵趨勢。 一、全閃存
    的頭像 發(fā)表于 03-18 17:39 ?547次閱讀

    科技啟動帶寬存儲芯片生產(chǎn) 為英偉達(dá)最新AI芯片提供支持

    英偉達(dá)下一代H200圖形處理器將采用HBM3E芯片,預(yù)計于今年第2季交付,有望超越現(xiàn)有的H100芯片,為科技貢獻更高業(yè)績。此外,龍頭廠商SK海力士等供應(yīng)的
    的頭像 發(fā)表于 02-27 09:33 ?690次閱讀

    數(shù)據(jù)中心變“綠“要點有哪些?

    數(shù)據(jù)中心作為一個復(fù)雜的系統(tǒng),存儲著大量敏感信息和重要數(shù)據(jù),又是能耗“大戶”,需要應(yīng)對不斷提升的“綠”電、節(jié)能要求,全面及時的檢測維護對于
    的頭像 發(fā)表于 01-25 11:12 ?727次閱讀