0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

從Arm TCS23看Arm對移動設備未來的洞察

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2023-07-03 09:46 ? 次閱讀

5月29日Arm正式推出 Arm 2023 全面計算解決方案(TCS23), 包含基于全新第五代 GPU 架構(gòu)、可實現(xiàn)終極視覺體驗的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能領先的全新 Armv9 CPU 集群,以及可為數(shù)百萬 Arm 開發(fā)者提供更易訪問軟件的全新增強技術,為整個系統(tǒng)的關鍵工作負載帶來了顯著提升。

近日,在媒體技術日活動上,多位Arm技術專家來到現(xiàn)場分享了TCS23的技術特征以及智能移動設備發(fā)展的前瞻洞察。Arm 產(chǎn)品營銷副總裁 Ian Smythe首先介紹了TCS23的整體性能優(yōu)勢。

全新 Armv9 Cortex 計算集群已連續(xù)三年實現(xiàn)兩位數(shù)的性能提升。TCS23的計算集群包括超大核Cortex-X4,大核處理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,專門為了滿足高要求的多線程用例而設計?;诘谖宕軜?gòu)的 GPU即Immortalis-G720,專為旗艦智能手機而設計,可帶來 15% 的性能提升,減少了多達 40% 的內(nèi)存帶寬用量,有助于實現(xiàn)更出色且持久的幀率,最終帶來更高質(zhì)量的圖形。提供 64 位計算性能、支持安全創(chuàng)新,遷移到 64 位系統(tǒng)的任務已經(jīng)完成。Arm 的內(nèi)存標記擴展MTE 功能,支持開發(fā)者在應用部署前后,都能檢測和避免內(nèi)存安全漏洞。Ian還表示,在接下來的幾年里,我們將在包括 Krake GPU 和 Blackhawk CPU 等關鍵 IP 上加大投入,以滿足合作伙伴對于計算和圖形性能的要求。

TCS23全面計算解決方案包括工具、軟件以及各種硬件產(chǎn)品,例如Arm 架構(gòu)以及再底層的物理 IP、POP IP。TCS23在底層 IP上有了全新的更新,同時在工具上也提供了新的產(chǎn)品,在GPU上新品,進一步提高性能和效率。同時,Arm還推出了僅支持 64 位、且基于 Armv9.2 架構(gòu)的CPU集群,提供了全新的系統(tǒng)級IP 以及開發(fā)工具。

全面升級CPU核,以及DSU-120支持最高多達14個內(nèi)核的可擴展配置


Cortex-X4 是Arm打造過性能最快速的CPU,與 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并帶來可以顯著降低功耗多達 40% 的高能效微架構(gòu)。而面積僅增加了 10%,這是Cortex-X系列處理器中,在每平方毫米的性能方面最出類拔萃的產(chǎn)品。不論是更快速的即時應用響應,或是更流暢的網(wǎng)頁瀏覽體驗, Cortex-X4 的增強性能將為設備帶來顯著的升級。包括 3A 級游戲、全天候生產(chǎn)力和后臺任務在內(nèi)的用例,是移動設備中極其重要的部分,而能效則是高效運行此類用例必不可少的關鍵。

全新的大核處理器 Cortex-A720 和全新小核 Cortex-A520,與其上一代相比,雙雙在能效方面都提高了 20%。Cortex-A720 是業(yè)界主流的 CPU IP,可提高持續(xù)性能,是新 CPU 集群的核心主力,而Cortex-A520 是我們最出眾的高效性能核心。

由于高端移動設備的芯片設計越來越復雜,要面對用戶體驗的升級、新軟件功能的需求和更高性能和效率的持續(xù)突破,TCS23基于全新 Armv9.2 架構(gòu)搭建,可以為客戶提供突破能效和性能邊界所需的前沿技術,客戶可以基于 TCS23 進行不同配置,從而自行創(chuàng)建可擴展性高的計算解決方案。這里不僅包括智能手機,還有高端數(shù)字電視、機頂盒等等。



Arm 終端事業(yè)部產(chǎn)品管理高級總監(jiān)Kinjal Dave談到,在Armv9.2 計算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,還有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于兩年前推出的 DSU-110 開發(fā), 針對 DSU 的各方各面進行了優(yōu)化提升。 在擴展性方面,新款 DSU-120 支持最高多達 14 個的內(nèi)核和更大的L3緩存,可助力構(gòu)建比前代產(chǎn)品更強大、性能更高的 CPU 集群。無論是搭載于高性能筆記本電腦中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所組成的集群,還是用于旗艦智能手機中的由單核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所組成的集群,高度可擴展的 DSU 都為 Arm 2023 全面計算解決方案(TCS23)奠定了根基。

DSU-120 還提供了全新的先進功能,例如智能節(jié)能模式,它有助于提高整個 CPU 集群的效率。更高級別的效率表現(xiàn)能延長特定集群所針對的任何消費電子設備的工作天數(shù)。DSU-120 還新增了24MB 和 32MB的 L3 緩存配置選項,進而使得對應集群擁有更高的性能和更低的系統(tǒng)功耗。



在高端數(shù)字電視和機頂盒,以及中端智能手機應用中,TCS23配置側(cè)重于提供具有超高可擴展性的高級圖形和計算性能,實現(xiàn)出色的用戶體驗。舉例來說,數(shù)字電視可以具備多視圖功能,例如同時在屏幕上顯示視頻通話、視頻流應用和 AI 應用等多個任務。更高的性能還可實現(xiàn)先進機器學習功能,以提升相機和視頻應用場景的相關用戶體驗。

除此之外,TCS23 為注重成本的市場準備了多款配置選擇,例如由全新 Cortex-A520 提供支持的可擴展 CPU 小核集群,以及可擴展的 Mali GPU。

GPU的三大關鍵提升

第五代架構(gòu)提高了所有 GPU 的系統(tǒng)級圖形性能,聚焦三個關鍵處理趨勢,即場景復雜性、更出色的圖形性能和內(nèi)存系統(tǒng)能耗功率。




隨著開發(fā)者紛紛設法實現(xiàn)更優(yōu)質(zhì)的視覺效果,移動設備上的場景復雜性也呈爆炸式增長?,F(xiàn)在面臨的挑戰(zhàn)在于,更高的場景復雜性會讓幾何相關的內(nèi)存訪問占據(jù)過多的可用帶寬,并最終影響性能。

為了處理這些更復雜的場景,圖形管道首先引入了延遲頂點著色 (DVS) 以重新定義 Arm GPU 中的圖形數(shù)據(jù)流。DVS 利于性能隨內(nèi)核數(shù)增加而提升,使 Arm 的合作伙伴能夠在未來達到更高的性能水平。DVS 還有助于在高度復雜的游戲場景中保持穩(wěn)定幀率,同時為未來下一代的幾何內(nèi)容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度紋理的性能影響。DVS 的引入意味著超復雜幾何形狀的場景可被渲染,并可節(jié)省處理能力。

Arm認為內(nèi)存系統(tǒng)能耗功率是導致處理器散熱達到極限的主要因素。在第五代架構(gòu)中,希望為 GPU 分配更多的內(nèi)存系統(tǒng)效能以達到更好的視覺效果,同時也希望可以進一步節(jié)約能耗功率,以延長電池續(xù)航時間。

除了引入第五代架構(gòu)外,Immortalis 和 Mali GPU 的整體設計在性能和效率方面也實現(xiàn)了大幅提升。Immortalis-G720 支持十核或更多核心,并可選用優(yōu)化的物理 IP 來加速 SoC 設計。Mali-G720 和 Mali-G620 的超強可擴展性有助于為廣泛的消費電子設備帶來優(yōu)質(zhì)的圖形功能,例如智能手機、筆記本電腦、數(shù)字電視、機頂盒 (STB) 和可穿戴設備。Mali-G720 可支持六到九個核心,而 Mali-G620 可支持至多五個核心,可助力 Arm授權許可合作伙伴在更多市場中實現(xiàn)設計工作的快速復用。



3D 場景重建是一個關鍵的機器學習應用場景,可以在移動 GPU上渲染真實場景的新穎視圖。并且在該應用下,與 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的內(nèi)存帶寬減少了22%。

開發(fā)者可利用 Unity ML-Agents插件在游戲和模擬中訓練智能代理。在 GDC 2023 上,Arm展示了在移動 SoC 上處理 100 個類似代理和復雜圖形的超強表現(xiàn)。



Arm通過廣泛的 GPU 工具和資源保持對游戲開發(fā)者的生態(tài)系統(tǒng)支持??蓮腁rm Mobile Studio免費下載多種解析、性能分析和調(diào)試工具,以幫助開發(fā)者優(yōu)化其應用的性能和效率。

軟件優(yōu)化不可或缺

以TCS23 中的軟件來看包括三大支柱,即性能、安全以及開發(fā)者的可訪問性。Arm 終端事業(yè)部生態(tài)系統(tǒng)及工程高級總監(jiān) Geraint North詳細解析了TCS23 軟件部分的提升。

機器學習是軟件工作中非常重要的部分,因此在 TCS23 中我們更新了軟件技術庫。比如 Arm NN 以及 Arm Compute Library (ACL),這些都是開源的軟件技術庫,開發(fā)者可以利用它來優(yōu)化在 Armv9架構(gòu) CPU 和 GPU 上面機器學習的復雜性。

自 2023 年 1 月以來,Arm NN和 ACL 已經(jīng)通過谷歌的 Google Play Store 在安卓系統(tǒng)上提供,而且已經(jīng)有超過 1 億日活躍用戶。此外,到 2024 年,不管是Arm NN還是 ACL 都可以使用谷歌的移動平臺,意味著開發(fā)者能夠在可下載的項目,在默認狀態(tài)下更新到網(wǎng)絡最新的版本,同時意味著能在基于 Arm 架構(gòu)上實現(xiàn)開發(fā)者獲得最高可能的機器學習的潛力。

多年以來,Arm一直在大量提供不斷優(yōu)化中的Mali GPU,賦能開發(fā)者,為他們免費提供了強大的開發(fā)工具,從而能夠讓他們在基于 Mali GPU 上實現(xiàn)最佳效果的設計。同時Arm還與全球主要的游戲引擎工作室進行多年的合作,一起推動圖形技術的進步,并且以一種非常可擴展的方式實現(xiàn)產(chǎn)品的優(yōu)化。

Arm 還為開發(fā)者提供豐富的培訓以及最佳實踐信息文件的分享,讓開發(fā)者可以在開始構(gòu)建圖形時不斷去改善他們的創(chuàng)意。

除此之外,Arm 還為最新的工藝節(jié)點和庫優(yōu)化了IP,并且利用其在 RTL 方面的專長配置物理 IP,以此在先進的技術上為基于Arm架構(gòu)的產(chǎn)品設計、制造提供了優(yōu)化的EDA流程與物理實現(xiàn)。

軟件越多越復雜,相對應漏洞也會增長,Arm 的內(nèi)存標記擴展MTE 功能通過“鎖”和“密鑰”的設置避免內(nèi)存安全漏洞。值得一提的是,TCS23是一個完全支持64位的集群,以利用完整的64位移動生態(tài)系統(tǒng)的優(yōu)勢。

小結(jié):

TCS23基于最新一代的Armv9.2 架構(gòu),同時基于全新的DynamIQ共享單元之上,帶來更多的可擴展性和更細致的電源控制模式,確??蛻粼谛枰臅r候可以獲得完整的性能和帶寬,在不需要的時候可以通過非常細的顆粒度去降低功率。

從Arm對TCS23的部署也能夠看到解決方案的靈活性和彈性,適用于智能手機、筆記本電腦等不同領域。與此同時,對于安全性、AI運算以及生態(tài)都進行大量優(yōu)化和拓展。TCS23給廣大客戶提供了非常好的可擴展性,以期發(fā)揮架構(gòu)帶來的更大優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9097

    瀏覽量

    367610
  • 移動設備
    +關注

    關注

    0

    文章

    496

    瀏覽量

    54710
收藏 人收藏

    評論

    相關推薦

    Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機器學習框架

    、更高效的 AI 性能,顯著提升應用功能和用戶體驗,并加速未來 CPU 架構(gòu)的創(chuàng)新與集成。 在 Arm Tech Symposia 深圳年度技術盛會上,Arm 宣布與騰訊合作,成功將 Arm
    的頭像 發(fā)表于 11-24 15:33 ?693次閱讀

    ARM技術是什么?國內(nèi)有哪些ARM廠家呢?一起來了解一下!

    ,減少指令格式和尋址方式,這使得ARM處理器在執(zhí)行效率上更高。 編輯搜圖 請點擊輸入圖片描述(最多18字) 低功耗設計 :ARM架構(gòu)的芯片功耗較低,適合用于移動設備、物聯(lián)網(wǎng)
    發(fā)表于 11-18 16:35

    Arm加入OpenCloudOS操作系統(tǒng)開源社區(qū)

    5G 基礎設施和軟件定義汽車,到移動端和嵌入式設備,Arm 的開源工作覆蓋全球技術生態(tài)系統(tǒng)的方方面面。持續(xù)的開源合作與技術創(chuàng)新賦能全球超過 2,000 萬開發(fā)者在
    的頭像 發(fā)表于 11-15 11:34 ?355次閱讀

    Arm推出GitHub平臺AI工具

    專為 GitHub Copilot 設計的 Arm 擴展程序,可加速云到邊緣側(cè)基于 Arm 平臺的開發(fā)。
    的頭像 發(fā)表于 11-01 13:50 ?293次閱讀

    Arm全面設計助力Arm架構(gòu)生態(tài)發(fā)展

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱 Arm)近日分享了Arm 全面設計 (Arm Total Design) 生態(tài)項目
    的頭像 發(fā)表于 10-21 09:58 ?382次閱讀

    ARM處理器和CPU有什么區(qū)別

    ARM處理器和CPU(中央處理器)之間的關系及區(qū)別,可以多個維度進行深入探討。首先,需要明確的是,ARM處理器并非一種獨立的CPU類型,而是指由ARM公司設計的一系列處理器架構(gòu),這些
    的頭像 發(fā)表于 09-10 11:24 ?1445次閱讀

    STM32到基于Arm的MSPM0的遷移指南

    電子發(fā)燒友網(wǎng)站提供《STM32到基于Arm的MSPM0的遷移指南.pdf》資料免費下載
    發(fā)表于 09-07 11:31 ?0次下載
    <b class='flag-5'>從</b>STM32到基于<b class='flag-5'>Arm</b>的MSPM0的遷移指南

    遷移到基于Arm STM32的MSPMO指南

    電子發(fā)燒友網(wǎng)站提供《遷移到基于Arm STM32的MSPMO指南.pdf》資料免費下載
    發(fā)表于 09-07 11:17 ?0次下載
    <b class='flag-5'>從</b>遷移到基于<b class='flag-5'>Arm</b> STM32的MSPMO指南

    Arm精銳超級分辨率技術解析

    近日,Arm 推出了 Arm 精銳超級分辨率技術 (Arm Accuracy Super Resolution, Arm ASR),這是一款面向移動
    的頭像 發(fā)表于 09-03 11:28 ?950次閱讀
    <b class='flag-5'>Arm</b>精銳超級分辨率技術解析

    Arm宣布專為移動游戲設計的圖形優(yōu)化方案

    Arm 近期宣布了其專為移動游戲設計的圖形優(yōu)化方案——Arm Accuracy Super Resolution(ASR),旨在顯著提升游戲畫面的視覺品質(zhì),同時有效控制智能手機的功耗。這一創(chuàng)新
    的頭像 發(fā)表于 07-12 15:58 ?409次閱讀

    ARM 主板:計算的未來

    和多功能性。在這篇博文中,我們將探索ARM主板的世界,并討論為什么它們是計算的未來。首先,讓我們了解一下什么是ARMARM代表高級RISC機器,是一種旨在實現(xiàn)節(jié)能和高
    的頭像 發(fā)表于 06-21 17:16 ?540次閱讀
    <b class='flag-5'>ARM</b> 主板:計算的<b class='flag-5'>未來</b>

    Arm預計未來五年將有1000億臺設備用于AI

    在COMPUTEX 2024展前活動中,Haas詳解了其公司計劃如何在2025年前,將逾千億臺Arm架構(gòu)設備投入人工智能(AI)應用,涵蓋云端到邊緣側(cè)的各個環(huán)節(jié)。
    的頭像 發(fā)表于 06-06 16:29 ?649次閱讀

    一文讀懂RISC-V與ARM

    RISC-V和ARM是近年來備受關注的兩種處理器架構(gòu)。RISC-V是一種基于精簡指令集計算(RISC)原理的開源指令集架構(gòu)(ISA),而ARM是一種專有ISA,由于其長期存在于嵌入式系統(tǒng)和移動
    的頭像 發(fā)表于 04-08 11:14 ?1017次閱讀
    一文讀懂RISC-V與<b class='flag-5'>ARM</b>

    ARM?Cortex?-M23 32位MCU數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《ARM?Cortex?-M23 32位MCU數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 02-22 14:32 ?0次下載
    <b class='flag-5'>ARM</b>?Cortex?-M<b class='flag-5'>23</b> 32位MCU數(shù)據(jù)表

    CY8CPROTO-063-BLE是否可以ARM設備刷新PSoC6?

    是否可以ARM設備刷新PSoC6,在我的情況下 CY8CPROTO-063-BLE? 我想將 CY8CPROTO-063-BLE 連接到樹莓派,并想從這個樹莓派中燒錄
    發(fā)表于 02-01 07:03