CFMS | MemoryS 2025 于上周在深圳盛大召開,活動現(xiàn)場匯聚了包括 Arm 在內(nèi)的全球存儲產(chǎn)業(yè)鏈的諸多領(lǐng)先企業(yè)。
在大會上,Arm 物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬健通過主題演講與在場的行業(yè)參與者分享了,Arm 強調(diào)以開放生態(tài)為核心,通過計算平臺創(chuàng)新與標(biāo)準(zhǔn)化協(xié)作,賦能從云端到邊緣的智能化轉(zhuǎn)型,推動人工智能 (AI) 與存儲技術(shù)的深度融合。讓我們一起跟隨本文,深入了解本次演講的精彩內(nèi)容!
釋放 AI 潛能,Arm 計算平臺構(gòu)建計算與存儲的未來
當(dāng)下,我們正處在激動人心的人工智能 (AI) 技術(shù)變革初期階段。隨著自然語言、多模態(tài)大模型以及生成式 AI 技術(shù)的加速演進(jìn),AI 正以前所未有的速度重塑各行各業(yè)。根據(jù) IDC 的預(yù)測,全球數(shù)據(jù)量將從 2024 年的 159.2ZB 增長到 2028 年的超過 384.6ZB,年復(fù)合增長率達(dá) 24.4%。其中,到 2028 年,預(yù)計 37% 的數(shù)據(jù)將會在云端直接產(chǎn)生,而其余數(shù)據(jù)會從邊緣端和終端直接產(chǎn)生。
面對邊緣數(shù)據(jù)的激增,高效的數(shù)據(jù)處理、低延遲傳輸以及智能、安全的存儲正成為行業(yè)關(guān)注的重點。未來的計算架構(gòu)不僅要提供更強的算力,還必須更緊密地與存儲系統(tǒng)結(jié)合,以確保 AI 模型能夠高效運行,同時優(yōu)化數(shù)據(jù)管理和訪問方式。
從目前的 AI 技術(shù)發(fā)展方向來看,一方面,大模型正向通用人工智能 (AGI) 演進(jìn),探索多模態(tài)、物理 AI 等新方向,并持續(xù)挑戰(zhàn)算力的新極限。另一方面,為推進(jìn)大模型全面部署的進(jìn)程,行業(yè)開始邁向深度優(yōu)化和垂直領(lǐng)域定制化,使大模型能走入千行百業(yè),適應(yīng)移動端、邊緣計算、云端部署等不同場景。
DeepSeek 的推出對全球 AI 市場產(chǎn)生了深遠(yuǎn)影響:作為一種開放的創(chuàng)新技術(shù),它不僅展示了 AI 在訓(xùn)練與推理過程中的優(yōu)化潛力,還極大提高了大規(guī)模部署的效率,充分證明了模型能夠在更低成本、更高效能的環(huán)境中穩(wěn)定運行。這一成就對于推動 AI 在企業(yè)級應(yīng)用和邊緣計算領(lǐng)域的大規(guī)模應(yīng)用具有重要意義。
Arm 計算平臺:持續(xù)促進(jìn)從云到端的 AI 優(yōu)化部署
在 AI 發(fā)展的初期階段,數(shù)據(jù)中心作為模型訓(xùn)練和初期推理的核心場所,正面臨著前所未有的挑戰(zhàn)。傳統(tǒng)的標(biāo)準(zhǔn)通用芯片在處理計算密集型的 AI 工作負(fù)載時顯得力不從心,無法滿足 AI 時代對于高性能、低功耗以及靈活擴展性的迫切需求。在此背景下,Arm 計算平臺憑借其先進(jìn)的技術(shù)優(yōu)勢,為新一代 AI 云基礎(chǔ)設(shè)施的發(fā)展開辟了新的范式。從 Arm Neoverse 計算子系統(tǒng) (CSS)、Arm Total Design 生態(tài)項目到芯粒系統(tǒng)架構(gòu) (CSA),Arm 進(jìn)行了從技術(shù)到生態(tài)的整體化布局,不僅為 AI 數(shù)據(jù)中心的工作負(fù)載提供了高效、靈活且可擴展的解決方案,還幫助合作伙伴專注于產(chǎn)品差異化,為產(chǎn)品上市進(jìn)程提速。
AI 推理是 AI 釋放價值的關(guān)鍵,它正迅速從云端拓展至邊緣端,覆蓋世界的每一個角落。在邊緣 AI 領(lǐng)域,Arm 憑借其技術(shù)與生態(tài)的獨特優(yōu)勢,不斷創(chuàng)新,確保智能物聯(lián)網(wǎng)與消費電子生態(tài)系統(tǒng)能在恰當(dāng)?shù)臅r機、于最適合的地點執(zhí)行最優(yōu)工作負(fù)載。
為了滿足邊緣 AI 日益攀升的 AI 工作負(fù)載需求,Arm 近期發(fā)布了以全新 Armv9 超高能效 Cortex-A320 CPU 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣 AI 計算平臺。該平臺實現(xiàn)了 CPU 與 AI 加速器的深度集成。相比去年以 Cortex-M85 搭配 Ethos-U85 的平臺提升了八倍的機器學(xué)習(xí) (ML) 計算性能,帶來了顯著的 AI 計算能力突破,可賦能邊緣 AI 設(shè)備輕松運行超過 10 億參數(shù)的大模型。
其中,全新發(fā)布的超高能效 Cortex-A320 不僅可以為 Ethos-U85 提供更高的內(nèi)存容量與帶寬,讓大模型在 Ethos-U85 上的執(zhí)行如虎添翼,還支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問延遲。Cortex-A320 與 Ethos-U85 的組合,是運行大模型及應(yīng)對邊緣 AI 任務(wù)所帶來的內(nèi)存容量及帶寬挑戰(zhàn)的理想選擇。
此外,Cortex-A320 還充分利用了 Armv9 增強的 AI 計算特性以及包括 Secure EL2、指針驗證/分支目標(biāo)識別 (PACBTI) 以及內(nèi)存標(biāo)記擴展 (MTE) 等在內(nèi)的安全特性。此前,這些特性已經(jīng)在其他市場得到廣泛應(yīng)用,而 Arm 現(xiàn)在將其引入了物聯(lián)網(wǎng)與邊緣 AI 計算領(lǐng)域,在提供出色且靈活 AI 性能的同時,實現(xiàn)對軟件負(fù)載更好的隔離與軟件內(nèi)存異常的防護(hù),提高整體系統(tǒng)安全性。
AI 時代的存儲發(fā)展:存儲、計算和安全能力的全面升級
隨著 AI 計算需求的持續(xù)增長,云邊端在對計算能力提出更高要求的同時,也對存儲系統(tǒng)的性能、密度、實時性和功耗等方面提出了更嚴(yán)苛的要求。在傳統(tǒng)模式下,計算架構(gòu)往往將存儲和計算相對分離,存儲設(shè)備僅僅承擔(dān)數(shù)據(jù)存放的角色,數(shù)據(jù)需要在存儲與計算節(jié)點之間頻繁搬移,導(dǎo)致“存儲-計算”之間的瓶頸。然而在 AI 時代,為滿足數(shù)據(jù)實時分析、智能管理及高效訪問等需求,將存儲置于離計算單元更近的地方,或讓存儲本身具備計算能力,變得尤為關(guān)鍵。這樣能夠確保 AI 任務(wù)在最合適的位置得到高效執(zhí)行。
從云到端的 AI 計算,對存儲吞吐量、延遲、能耗、安全以及諸如 Open Channel 等提升主機可管理性 (host manageability) 的需求都不盡相同。存儲控制器以及運行在存儲控制器中 Arm CPU 上的固件在支持差異化 AI 存儲需求中起到了極其重要的作用。
事實上,作為數(shù)據(jù)存儲與網(wǎng)絡(luò)控制的基石,Arm 一直在為全球存儲控制器和設(shè)備提供高性能、低功耗、安全可靠的解決方案,其中包括:
Arm Cortex-R 系列實時處理器擁有最快的中斷延時和實時反應(yīng)速度,被廣泛應(yīng)用于諸多存儲設(shè)備;
Arm Cortex-M 系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對獨特 NAND 介質(zhì)的深度優(yōu)化來創(chuàng)造差異;
Arm Cortex-A 系列應(yīng)用處理器以高吞吐量流水線設(shè)計、支持最高處理性能,同時擁有 ML、數(shù)據(jù)處理軟件和豐富操作系統(tǒng)的堅實生態(tài)支持;
Arm Ethos-U AI 加速器支持每秒 2,048 MACs 的 Transformer 原生加速,可以助力存儲控制器本身變得更智能;
此外,還有為數(shù)據(jù)中心量身定制的 Neoverse。我們已開始看到 CXL (Compute Express Link) 方面的創(chuàng)新設(shè)計采用 Arm Coherent Mesh Network (CMN) 與 Neoverse 組合實現(xiàn)可“組成式”內(nèi)存擴展,并融入近存儲計算的理念,減少數(shù)據(jù)搬運。
生態(tài)攜手,構(gòu)建 AI 計算與存儲未來
在專注提供領(lǐng)先的技術(shù)和產(chǎn)品的同時,Arm 還致力于和生態(tài)系統(tǒng)合作伙伴攜手共進(jìn),共同推動存儲產(chǎn)業(yè)的發(fā)展?;?Arm 架構(gòu)的平臺正被行業(yè)領(lǐng)先的存儲企業(yè)廣泛采用,以優(yōu)化其存儲解決方案。例如,Solidigm 公司最新發(fā)布的 122TB PCIe SSD Solidigm D5-P5336 顯著提升了 AI 數(shù)據(jù)中心的能效、存儲密度和性能,其存儲控制器采用 Arm Cortex-R CPU,有效提升了讀寫的實時性和延時確定性;慧榮科技 (Silicon Motion) 面向 AI PC 的 SM2508 主控芯片采用了 Arm Cortex-R8 與 Cortex-M0,在能效和數(shù)據(jù)吞吐上實現(xiàn)了突破,其 SM2264XT-AT 是業(yè)界首款車用 PCIe Gen4 主控芯片,通過增強的虛擬化來支持混合關(guān)鍵性工作負(fù)載對數(shù)據(jù)的訪問,并可節(jié)省 30% 的能耗;江波龍基于 Arm Cortex-R CPU 打造的 XP2300、ORCA 4836 以及 UNCIA 3836 固態(tài)硬盤,憑借其大容量與高性能的優(yōu)勢,廣泛應(yīng)用于 AI PC、服務(wù)器、云計算、分布式存儲及邊緣計算等多個應(yīng)用場景,滿足 AI 技術(shù)的本地化部署需求。
此外,在本土存儲市場,大普微、聯(lián)蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領(lǐng)先的存儲企業(yè),也都廣泛采用 Arm 技術(shù)打造 SSD 主控芯片與設(shè)備方案。
迄今為止,基于 Arm 架構(gòu)和平臺所應(yīng)用的存儲設(shè)備已近 200 億臺,其中包括云和企業(yè)級 SSD、車載 SSD、消費級 SSD、硬盤驅(qū)動器和嵌入式閃存設(shè)備。目前,由 Arm 技術(shù)賦能的存儲設(shè)備持續(xù)保持在每日大約 300 萬臺的出貨量。
憑借前沿的技術(shù)實力、豐富的生態(tài)布局、深厚的存儲行業(yè)積累,Arm 正繼續(xù)引領(lǐng)技術(shù)創(chuàng)新,賦能 AI 時代的計算與存儲發(fā)展。Arm 也將繼續(xù)與合作伙伴攜手,通過安全、高效的 Arm 計算平臺,構(gòu)建 AI 時代計算與存儲的新未來。
-
ARM
+關(guān)注
關(guān)注
134文章
9336瀏覽量
376048 -
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2929文章
46082瀏覽量
390145 -
AI
+關(guān)注
關(guān)注
88文章
34747瀏覽量
276849 -
計算平臺
+關(guān)注
關(guān)注
0文章
76瀏覽量
9810
原文標(biāo)題:釋放 AI 潛能,Arm 計算平臺構(gòu)建計算與存儲的未來
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論