0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

強悍的AWS Graviton4處理器及其背后的Arm Neoverse

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2024-12-19 00:04 ? 次閱讀

電子發(fā)燒友網報道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會上,該公司正式對外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強大的Graviton處理器,Graviton4相較于上一代產品帶來了巨大的性能提升。同時,為Graviton4賦能的Arm Neoverse也跟著受到了更多的關注。

強悍的Graviton4處理器

據介紹,Graviton4處理器每個核心都能提供比上代強30%的性能,vGPU數量和內存容量也是上一代的3倍,能將處理大型Java應用的速度提升45%,可以為企業(yè)提供更低成本和高效的高性能計算解決方案。

除了內核性能的提升,亞馬遜還著重提升了Graviton4處理器的存儲性能,首次創(chuàng)建了雙插槽NUMA內存集群。Graviton4處理器配備了高達1.5 TB的DDR5主內存,運行頻率為5.6 GHz,提供12個內存通道。與之相比,上一代Graviton 3處理器使用了4.8 GHz主頻的DDR5內存,只有8個內存通道。并且,單個Graviton4處理器的內存插槽就可以提供537.6 GB/秒的帶寬,能夠輕松應對HPC負載。

此前,亞馬遜針對Graviton4處理器發(fā)布過一些測試實例,通過這些實例體現了這顆處理器強大的性能。比如,基于Graviton4處理器構建UE5 Dedicated Server,據亞馬遜的說法,最新的Graviton 4實例是迄今為止亞馬遜為各種workload設計的最強大并且最高效節(jié)能的CPU。Graviton 4的實例R8g相較于Graviton 3的實例R7g有大約30%的性能提升。實例R8g壓測使用Lyra Starter Game項目,通過增加AI Bot和GameClient的方式來增加Dedicated Server(簡稱DS)的負載,通過對比不同機型以及不同參數編譯出的DS在server full的情況下的CPU使用率和幀率(FPS)來對比性能。

結果顯示,Graviton 4的實例在UE Dedicated Server應用場景下:
·相較于Graviton 3有約 25+%的性價比提升(均使用優(yōu)化參數編譯);
·相較于Intel Sapphire Rapids和AMD Genoa有30%~35%的性價比提升;
·使用Graviton針對C/C++的優(yōu)化參數來編譯Dedicated Server對性能提升約10%~25%。

根據外媒的測試,在相同的vCPU數量下,新的Graviton4處理器內核大致與Intel Sapphire Rapids性能相當,同時能夠與AMD EPYC“Genoa”相媲美,并始終表現出極佳的代際提升。這都離不開Arm Neoverse的賦能。

Graviton4 處理器背后的Arm Neoverse

Graviton4 處理器基于Arm?Neoverse?V2平臺,這顆核心發(fā)布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司內部代號“Demeter”項目下的產品,Arm?Neoverse?V2平臺涵蓋Armv9架構的新特性,包括高性能浮點和向量指令支持,以及SVE/SVE2、Bfloat16和INT8?MatMul等特性。這些特性為AI/機器學習?(ML)?以及高性能計算?(HPC)?工作負載提供了卓越性能。

根據Arm官方的介紹信息,得益于全面增強的核心性能、內存帶寬和高達兩倍的L2緩存大?。亢?MB),Neoverse V2可以在云和ML應用程序上提供兩倍于Neoverse V1的性能。根據Arm工程團隊實際運行EDA工作負載所得出的結果,Graviton4?提供的RTL仿真工作負載性能比Graviton3高出?37%。同時,Neoverse V2具有出色的平臺擴展性,當與新的CMN-700核心網狀網絡配對時,Neoverse V2 CPU可以配置多達256個內核和512MB的系統(tǒng)級緩存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定義PHY來連接計算、內存和加速器,實現高效、高速的芯片連接。

看過Graviton4處理器的性能之后,人們對下一代Arm服務器會更加期待,這些產品將搭載最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技術,Neoverse CSS V3則是V系列芯片IP的首款Neoverse CSS產品,單芯片性能可提高50%。官方的資料顯示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,擁有6個DDR5 內存控制器、4個 I/O 控制器和兩個芯片間互連,并支持PCIe Gen5和CXL3.0。通過芯片間互聯(lián),可以升級至128核。相對于此前的 Neoverse CSS N2,其單芯片性能可提高50%。

除了核心的提升,Arm將繼續(xù)投入并進一步強化軟件生態(tài)系統(tǒng),從而使開發(fā)者能夠更加輕松地在?Arm平臺上構建其應用,并充分利用?Arm計算平臺所提供的卓越性能和效率優(yōu)勢。

結語

亞馬遜Graviton4處理器是Arm處理器歷史上的一次巨大成功,性能全面對標x86處理器當前的旗艦產品。在Graviton4處理器背后,Neoverse V2內核起到了巨大的賦能作用,這讓產業(yè)界對于下一代基于Neoverse CCS V3 核心的Arm處理器更加期待。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19281

    瀏覽量

    229789
收藏 人收藏

    評論

    相關推薦

    Arm Neoverse 驅動 AWS Graviton4,加速云計算新時代

    滿足性能提升、成本降低以及符合監(jiān)管和可持續(xù)發(fā)展目標的新能效基準。 近日,Arm與亞馬遜云科技(AWS)的長期合作,正致力于通過專用芯片和計算技術,推動云計算向更高性能、更高效和更可持續(xù)的方向發(fā)展。在AWS re:Invent 2
    的頭像 發(fā)表于 12-23 17:38 ?296次閱讀

    ArmAWS合作深化,AWS Graviton4展現顯著進展

    :Invent 2024大會上,AWS進一步展示了其基于Arm架構的AWS Graviton4處理器的顯著進展。
    的頭像 發(fā)表于 12-18 14:17 ?149次閱讀

    Arm NeoverseAWS Graviton4加速云計算創(chuàng)新

    隨著人工智能 (AI) 技術的迅猛發(fā)展,云計算領域正在經歷顯著變革。愈發(fā)復雜的 AI 應用對計算解決方案的性能、效率和成本效益提出了更高要求。在云端部署工作負載的客戶正在重新評估其所需的基礎設施,以滿足現代工作負載需求,其中不僅包括提高性能和降低成本,還涵蓋了需符合監(jiān)管要求或可持續(xù)發(fā)展目標的新能效基準。
    的頭像 發(fā)表于 12-17 10:16 ?182次閱讀

    基于全志V853處理器的智能輔助駕駛算法介紹

    全志V853處理器,是專為智慧視覺領域設計的AI處理器,配備了高效的NPU算力和豐富的外設接口,能夠提供穩(wěn)定的AI邊緣計算支持;同時,基于V853處理器這一性能優(yōu)勢,全志還為客戶提供了一整套完整的智能輔助駕駛算法。
    的頭像 發(fā)表于 09-14 09:23 ?726次閱讀
    基于全志V853<b class='flag-5'>處理器</b>的智能輔助駕駛算法介紹

    亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用

    北京2024年7月15日?/美通社/ -- 亞馬遜云科技宣布基于自研芯片Amazon Graviton4處理器的Amazon Elastic Compute Cloud (Amazon EC2
    的頭像 發(fā)表于 07-15 16:09 ?381次閱讀

    亞馬遜網絡服務即將推出第四代Graviton處理器

    7月10日,雅虎財經獨家報道了亞馬遜網絡服務(AWS)即將推出的重大技術進展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由
    的頭像 發(fā)表于 07-10 15:51 ?624次閱讀

    SiPearl更新Rhea1處理器規(guī)格,聚焦HPC與AI推理應用

    據了解,Rhea1處理器將與英偉達GH200 Grace Hopper超級芯片共同為歐洲首臺E級超算JUPITER提供計算能力,原本計劃搭載72個Arm Neoverse V1 “Zeus”內核。
    的頭像 發(fā)表于 05-15 11:41 ?379次閱讀

    ArmArm Neoverse計算子系統(tǒng)(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了兩款新的Arm Neoverse計算子系統(tǒng)(CSS),它們基于“迄今為止最好的一代Neoverse技術”。是什么讓這些新產品在擁擠的計算技術領域脫穎而出?
    的頭像 發(fā)表于 04-24 17:53 ?1064次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(tǒng)(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺已成為云服務提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google
    的頭像 發(fā)表于 04-16 14:30 ?651次閱讀

    適用于ARM Cortex?—A53處理器和FPGA TPS65219 數據表

    電子發(fā)燒友網站提供《適用于ARM Cortex?—A53處理器和FPGA TPS65219 數據表.pdf》資料免費下載
    發(fā)表于 04-01 16:23 ?0次下載
    適用于<b class='flag-5'>ARM</b> Cortex?—A53<b class='flag-5'>處理器</b>和FPGA TPS65219 數據表

    適用于ARM Cortex?—A53處理器A53處理器和FPGA的集成電源管理IC TPS65220數據表

    電子發(fā)燒友網站提供《適用于ARM Cortex?—A53處理器A53處理器和FPGA的集成電源管理IC TPS65220數據表.pdf》資料免費下載
    發(fā)表于 03-27 10:04 ?0次下載
    適用于<b class='flag-5'>ARM</b> Cortex?—A53<b class='flag-5'>處理器</b>A53<b class='flag-5'>處理器</b>和FPGA的集成電源管理IC TPS65220數據表

    Arm Neoverse CSS V3 助力云計算實現 TCO 優(yōu)化的機密計算

    (HPC) 和人工智能 (AI) 領域。亞馬遜云科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。與前代 Graviton CPU
    發(fā)表于 03-26 16:37 ?370次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3 助力云計算實現 TCO 優(yōu)化的機密計算

    ScaleFlux即將推出集成Arm Cortex-R82處理器的企業(yè)SSD控制

    ScaleFlux宣布,將在其即將推出的企業(yè)級固態(tài)硬盤(SSD)控制系列中整合Arm? Cortex?-R82處理器。
    的頭像 發(fā)表于 03-22 11:25 ?990次閱讀

    適用于ARM Cortex—A53處理器和FPGA TPS65219數據表

    電子發(fā)燒友網站提供《適用于ARM Cortex—A53處理器和FPGA TPS65219數據表.pdf》資料免費下載
    發(fā)表于 03-06 14:46 ?0次下載
    適用于<b class='flag-5'>ARM</b> Cortex—A53<b class='flag-5'>處理器</b>和FPGA TPS65219數據表

    業(yè)界首款基于Arm Cortex-M85處理器的MCU

    所有RA8系列MCU均利用Arm Cortex-M85處理器Arm的Helium技術所帶來的高性能,結合矢量/SIMD指令集擴展,能夠在數字信號處理器(DSP)和機器學習(ML)的實
    發(fā)表于 03-05 14:14 ?722次閱讀
    業(yè)界首款基于<b class='flag-5'>Arm</b> Cortex-M85<b class='flag-5'>處理器</b>的MCU