近日,Arm Tech Symposia 年度技術大會國內(nèi)首站落地深圳。作為Arm最重要、規(guī)模最盛大的技術活動之一,Arm Tech Symposia 年度技術大會以“Arm 正在構建計算的未來”為主題,圍繞人工智能、機器學習、物聯(lián)網(wǎng)、基礎設施、汽車、終端、移動計算等行業(yè)熱點話題展開。在此次大會上,Arm傳遞出對于服務器市場的處理器技術以及合作生態(tài)的最新洞察,并介紹了所推出的相關技術產(chǎn)品以大力支持基礎設施的加速建設。
AI時代,定制化芯片改變服務器架構
人工智能的大潮已經(jīng)涌現(xiàn),基礎設施融入AI這一趨勢對于數(shù)據(jù)中心、服務器提出更高的算力和性能需求。Arm在服務器市場呈現(xiàn)快速發(fā)展的態(tài)勢,此外,Arm還幫助合作伙伴實現(xiàn)服務器架構上的創(chuàng)新。
圖:Arm高級副總裁兼基礎設施事業(yè)部總經(jīng)理 Mohamed Awad 在大會中與媒體進行訪談
Arm高級副總裁兼基礎設施事業(yè)部總經(jīng)理 Mohamed Awad解析,在傳統(tǒng)的服務器系統(tǒng)架構中,左邊是內(nèi)存,然后內(nèi)存連接到一個通用的現(xiàn)成CPU,這個 CPU 又負責管理多個加速器。這樣的傳統(tǒng)架構是過去市場上唯一可用的架構,但這個架構的問題在于,這個通用的現(xiàn)成CPU 以及加速器之間的接口直接限制了產(chǎn)品最終的性能水平,因為所有的加速器都必須要通過一個 CPU 訪問額外的內(nèi)存,這樣就無法達到內(nèi)存的一致性,也就意味著加速器的性能無法被充分利用,也就無法很好地支持生成式 AI 時代的需求。
基礎設施領域的傳統(tǒng)系統(tǒng)架構
在Arm展現(xiàn)的一例新架構中,加入了CPU的數(shù)量并為整個系統(tǒng)架構提供更高的性能。具體來看,這種現(xiàn)代的系統(tǒng)架構中,CPU 是根據(jù)實際需求進行定制化設計,每一個定制化的CPU 都可以單獨和一個加速器相連,會有較強的內(nèi)存一致性?!霸谶@樣的架構下,設計方根據(jù)用戶的實際場景和用例進行 CPU 設計,方能將加速器的使用效率提到最高?!盡ohamed Awad說道。新的架構設計能夠更好地支持包括生成式 AI在內(nèi)的基礎設施的市場需求。
面向新的應用需求,基礎設施領域出現(xiàn)了現(xiàn)代化的系統(tǒng)架構
這個架構的重點是強調了CPU的定制化,以及對于鏈路上數(shù)據(jù)傳輸性能的提升。
Mohamed Awad解析,在過去的架構中,一個CPU 需要對應多個加速器或者多個 GPU,但是這個 CPU本身不是一個定制化的CPU。這種CPU是通過 PCIe的接口和加速器連在一起的,其數(shù)據(jù)傳輸?shù)耐掏侣屎玩溌穾捠侵苯邮芟抻谟卸嗌贁?shù)據(jù)可以進入到加速器。如果鏈路不佳,只有少量的數(shù)據(jù)進入加速器,影響加速器的性能發(fā)揮。但在新架構中,不僅是一個 CPU 對應一個加速器,更重要的是該 CPU 是一個定制的 CPU,跟加速器實現(xiàn)一對一組合后,它的整體鏈路以及數(shù)據(jù)吞吐率會達到最高,以提高加速器本身的利用水平。
這個新架構說來也不算新,因為這就是NVIDIA GH200 Grace Hopper 超級芯片所使用的架構。
NVIDIA GH200 Grace Hopper 超級芯片采用 Arm Neoverse 搭配 NVIDIA GPU,滿足 AI 性能的需求
在這樣的架構當中,72 顆 Arm Neoverse 核心加上來自 NVIDIA 的 GPU的組合,其AI 性能較基于x86架構的系統(tǒng)可提升 10 倍。
不過,未來的新架構還會有很多可能。Mohamed Awad表示,現(xiàn)在判斷一個CPU對應一個 GPU這樣的結構是不是未來的趨勢,仍為時尚早。但鑒于我們正處于計算加速的時代,在未來的架構當中任何的通用 CPU 旁邊都一定會有一個加速器。也就是說,不管是通過緊密耦合、中度耦合或者是分散耦合的方式,都一定會存在一個加速器。但具體這個加速器是什么樣,采用什么樣的架構,目前業(yè)界也還在不斷探索過程中。
從他的話語中可以判斷出CPU+加速器這種演進的方向是確定的。至于Arm將如何引領這樣的方向,相信會有更多新技術新產(chǎn)品的出現(xiàn)。
簡化定制芯片研發(fā),Arm升級Neoverse計算子系統(tǒng)CSS
目前,Arm在服務器市場以Neoverse 平臺為主,為了簡化客戶基于這一IP設計服務器芯片,近期 Arm不僅推出Neoverse 計算子系統(tǒng)(CSS),還推出一項全面設計(Arm Total Design) 生態(tài)項目,目標是集行業(yè)生態(tài)之力,加速基于Neoverse 計算子系統(tǒng)(CSS) 的定制系統(tǒng)級芯片(SoC) 的開發(fā)與交付。
Arm Neoverse CSS預集成了 Arm Neoverse 平臺并完成驗證配置,可降低開發(fā)成本并加速產(chǎn)品上市進程?;?Arm Neoverse N2 平臺所開發(fā)的Arm Neoverse CSS N2 為Arm Neoverse CSS的第一代產(chǎn)品。據(jù)介紹,在一家合作伙伴的實現(xiàn)中,Arm NeoverseCSS 不但可降低SoC設計復雜性,并且節(jié)省了長達80人/年的工程師時間。
Arm 全面設計 (Arm Total Design) 生態(tài)項目助力合作伙伴加速基于 Neoverse CSS 的芯片開發(fā)
Arm 全面設計匯集了專用集成電路(ASIC) 設計公司、IP 供應商、EDA 工具提供商、代工廠和固件開發(fā)者等行業(yè)領先企業(yè),以加快并簡化基于Neoverse CSS 的系統(tǒng)開發(fā)。
例如,楷登電子(Cadence)、Rambus 和新思科技(Synopsys) 等合作伙伴的預集成、經(jīng)過驗證的IP 和EDA 工具;ADTechnology、Alphawave Semi、博通(Broadcom)、凱捷(Capgemini)、智原科技、Socionext 和Sondrel 等合作伙伴的設計服務;來自英特爾代工服務(IFS) 和臺積公司(TSMC) 等代工廠合作伙伴的技術,專為領先工藝節(jié)點和先進封裝技術進行優(yōu)化;來自AMI 等基礎設施固件提供商,針對Neoverse CSS 提供商業(yè)軟件和固件支持。
引入這么多合作伙伴到這個生態(tài)系統(tǒng)中來,這意味著Arm已經(jīng)為IC設計公司做好了前期大量的準備工作,而IC設計公司只需要聚焦于本身的產(chǎn)品創(chuàng)新即可。
Mohamed Awad表示,Arm 全面設計也進一步提高了 Neoverse CSS生態(tài)系統(tǒng)中可供合作伙伴使用的可能性,不管是專用集成電路 (ASIC) 設計公司、IP 供應商、EDA 工具提供商、代工廠和固件開發(fā)者,Arm 都能進一步支持和幫助他們的產(chǎn)品研發(fā)。
另外,Mohamed Awad強調,Arm 全面設計生態(tài)系統(tǒng)沒有排他性,歡迎更多的相關產(chǎn)業(yè)鏈伙伴加入其中。同時Neoverse CSS 還在不斷迭代發(fā)展,以支持新興的芯粒 (chiplet) 技術。
微軟 Azure Cobalt 100
近期,微軟發(fā)布的Cobalt 100 CPU,便是基于Neoverse CSS進行研發(fā)的。此外也有中國的合作伙伴正在基于 CSS 進行開發(fā)。很多合作伙伴將會在 2024 年將第一代CSS設計投入生產(chǎn)。
加強生態(tài),與國內(nèi)廠商推進服務器芯片
現(xiàn)如今,所有主要的公有云都提供基于 Neoverse 的云實例,Arm Neoverse 平臺在整個市場中增速顯著。比較典型的合作伙伴包括超大規(guī)模云服務商亞馬遜云服務 (AWS)、阿里巴巴,以及本土初創(chuàng)企業(yè)鴻鈞微電子、遇賢微電子與云豹智能等。
從超大規(guī)模云服務商到初創(chuàng)企業(yè),在 Arm 平臺上賦能創(chuàng)新
據(jù)介紹,阿里巴巴的倚天 710 就是基于 Arm Neoverse 平臺打造的 CPU。另外鴻鈞微電子以及遇賢微電子,這兩家都是來自中國的本土初創(chuàng)企業(yè),他們都基于 Arm 平臺打造服務器 SoC 解決方案。同時,中國本土的公司云豹智能,也借助 Arm Neoverse 平臺來創(chuàng)建云計算與數(shù)據(jù)中心的 DPU 解決方案。而聯(lián)想則更多地是將Arm架構部署到 5G 領域。Mohamed Awad說,通過攜手中國本土的強有力的合作伙伴,我們將在中國進一步地推動 Neoverse 的發(fā)展。
Arm Neoverse 計算子系統(tǒng) (CSS)
Arm中國區(qū)業(yè)務全球副總裁鄒挺表示,在中國市場,Arm Neoverse 特別是在基礎設施領域擁有很多客戶。在過去的三、四年當中,整個 Neoverse 在中國的發(fā)展非常強勁。同時,Arm 也積極參與數(shù)據(jù)中心、云計算等本土的生態(tài)、開源軟件社區(qū),包括龍蜥社區(qū)等,幫助這些社區(qū)能更好地融入Arm全球生態(tài)系統(tǒng)中。
小結:
半導體的創(chuàng)新往往是從源頭開始的,Arm的IP以及生態(tài)往往引領著一個潮流的方向。在移動終端領域Arm是當之無愧的霸主,在今年早前手機SoC廠商基于Armv9架構推出全大核芯片,將高端手機推向新的高度。
對于這樣的集群配置,Arm 產(chǎn)品營銷副總裁 Ian Smythe表示,在目前的高端智能手機市場,我們往往可以看到許多不同的創(chuàng)意,各家手機廠商在選擇其 CPU 集群的配置時,是根據(jù)他們最終面向的目標受眾的用戶場景,來選擇合適的 CPU 進行配置,這也正是 Arm CPU戰(zhàn)略的一部分,通過Arm IP的靈活配置帶來多元化與差異化。
而移動終端上,Arm通過為移動平臺提供的Arm全面計算解決方案,持續(xù)賦能移動設備上 AI 的實現(xiàn)。此外,在物聯(lián)網(wǎng)領域,Arm擁有種類豐富的邊緣 AI 產(chǎn)品組合。憑借 Arm Cortex-M55、Cortex-M85 以及新推出的 Cortex-M52,持續(xù)提供合作伙伴所需的各種性能,從而滿足 AI 時代人們對物聯(lián)網(wǎng)日漸增長的需求。
在AI時代,計算基礎設施也在迎來變革。在當今 70% 的機器學習工作負載運行在 Arm 平臺之上。Mohamed Awad表示,AI的關鍵在于硬件和軟件的緊密集成,以及性能和計算能力的提升。未來AI 將存在于邊緣、網(wǎng)絡、數(shù)據(jù)端、存儲、服務器,它將融入每一個過程當中。Arm 正在不斷地加速推動和賦能 AI 所帶來的變化和革新。
-
ARM
+關注
關注
134文章
9116瀏覽量
368191 -
cpu
+關注
關注
68文章
10887瀏覽量
212339 -
IP
+關注
關注
5文章
1713瀏覽量
149703 -
服務器
+關注
關注
12文章
9246瀏覽量
85730 -
人工智能
+關注
關注
1792文章
47469瀏覽量
239137
發(fā)布評論請先 登錄
相關推薦
評論