5月29日Arm正式推出 Arm 2023 全面計算解決方案(TCS23), 包含基于全新第五代 GPU 架構(gòu)、可實現(xiàn)終極視覺體驗的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能領先的全新 Armv9 CPU 集群,以及可為數(shù)百萬 Arm 開發(fā)者提供更易訪問軟件的全新增強技術,為整個系統(tǒng)的關鍵工作負載帶來了顯著提升。
近日,在媒體技術日活動上,多位Arm技術專家來到現(xiàn)場分享了TCS23的技術特征以及智能移動設備發(fā)展的前瞻洞察。Arm 產(chǎn)品營銷副總裁 Ian Smythe首先介紹了TCS23的整體性能優(yōu)勢。
全新 Armv9 Cortex 計算集群已連續(xù)三年實現(xiàn)兩位數(shù)的性能提升。TCS23的計算集群包括超大核Cortex-X4,大核處理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,專門為了滿足高要求的多線程用例而設計?;诘谖宕軜?gòu)的 GPU即Immortalis-G720,專為旗艦智能手機而設計,可帶來 15% 的性能提升,減少了多達 40% 的內(nèi)存帶寬用量,有助于實現(xiàn)更出色且持久的幀率,最終帶來更高質(zhì)量的圖形。提供 64 位計算性能、支持安全創(chuàng)新,遷移到 64 位系統(tǒng)的任務已經(jīng)完成。Arm 的內(nèi)存標記擴展MTE 功能,支持開發(fā)者在應用部署前后,都能檢測和避免內(nèi)存安全漏洞。Ian還表示,在接下來的幾年里,我們將在包括 Krake GPU 和 Blackhawk CPU 等關鍵 IP 上加大投入,以滿足合作伙伴對于計算和圖形性能的要求。
TCS23全面計算解決方案包括工具、軟件以及各種硬件產(chǎn)品,例如Arm 架構(gòu)以及再底層的物理 IP、POP IP。TCS23在底層 IP上有了全新的更新,同時在工具上也提供了新的產(chǎn)品,在GPU上新品,進一步提高性能和效率。同時,Arm還推出了僅支持 64 位、且基于 Armv9.2 架構(gòu)的CPU集群,提供了全新的系統(tǒng)級IP 以及開發(fā)工具。
全面升級CPU核,以及DSU-120支持最高多達14個內(nèi)核的可擴展配置
Cortex-X4 是Arm打造過性能最快速的CPU,與 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并帶來可以顯著降低功耗多達 40% 的高能效微架構(gòu)。而面積僅增加了 10%,這是Cortex-X系列處理器中,在每平方毫米的性能方面最出類拔萃的產(chǎn)品。不論是更快速的即時應用響應,或是更流暢的網(wǎng)頁瀏覽體驗, Cortex-X4 的增強性能將為設備帶來顯著的升級。包括 3A 級游戲、全天候生產(chǎn)力和后臺任務在內(nèi)的用例,是移動設備中極其重要的部分,而能效則是高效運行此類用例必不可少的關鍵。
全新的大核處理器 Cortex-A720 和全新小核 Cortex-A520,與其上一代相比,雙雙在能效方面都提高了 20%。Cortex-A720 是業(yè)界主流的 CPU IP,可提高持續(xù)性能,是新 CPU 集群的核心主力,而Cortex-A520 是我們最出眾的高效性能核心。
由于高端移動設備的芯片設計越來越復雜,要面對用戶體驗的升級、新軟件功能的需求和更高性能和效率的持續(xù)突破,TCS23基于全新 Armv9.2 架構(gòu)搭建,可以為客戶提供突破能效和性能邊界所需的前沿技術,客戶可以基于 TCS23 進行不同配置,從而自行創(chuàng)建可擴展性高的計算解決方案。這里不僅包括智能手機,還有高端數(shù)字電視、機頂盒等等。
Arm 終端事業(yè)部產(chǎn)品管理高級總監(jiān)Kinjal Dave談到,在Armv9.2 計算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,還有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于兩年前推出的 DSU-110 開發(fā), 針對 DSU 的各方各面進行了優(yōu)化提升。 在擴展性方面,新款 DSU-120 支持最高多達 14 個的內(nèi)核和更大的L3緩存,可助力構(gòu)建比前代產(chǎn)品更強大、性能更高的 CPU 集群。無論是搭載于高性能筆記本電腦中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所組成的集群,還是用于旗艦智能手機中的由單核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所組成的集群,高度可擴展的 DSU 都為 Arm 2023 全面計算解決方案(TCS23)奠定了根基。
DSU-120 還提供了全新的先進功能,例如智能節(jié)能模式,它有助于提高整個 CPU 集群的效率。更高級別的效率表現(xiàn)能延長特定集群所針對的任何消費電子設備的工作天數(shù)。DSU-120 還新增了24MB 和 32MB的 L3 緩存配置選項,進而使得對應集群擁有更高的性能和更低的系統(tǒng)功耗。
在高端數(shù)字電視和機頂盒,以及中端智能手機應用中,TCS23配置側(cè)重于提供具有超高可擴展性的高級圖形和計算性能,實現(xiàn)出色的用戶體驗。舉例來說,數(shù)字電視可以具備多視圖功能,例如同時在屏幕上顯示視頻通話、視頻流應用和 AI 應用等多個任務。更高的性能還可實現(xiàn)先進機器學習功能,以提升相機和視頻應用場景的相關用戶體驗。
除此之外,TCS23 為注重成本的市場準備了多款配置選擇,例如由全新 Cortex-A520 提供支持的可擴展 CPU 小核集群,以及可擴展的 Mali GPU。
GPU的三大關鍵提升
第五代架構(gòu)提高了所有 GPU 的系統(tǒng)級圖形性能,聚焦三個關鍵處理趨勢,即場景復雜性、更出色的圖形性能和內(nèi)存系統(tǒng)能耗功率。
隨著開發(fā)者紛紛設法實現(xiàn)更優(yōu)質(zhì)的視覺效果,移動設備上的場景復雜性也呈爆炸式增長?,F(xiàn)在面臨的挑戰(zhàn)在于,更高的場景復雜性會讓幾何相關的內(nèi)存訪問占據(jù)過多的可用帶寬,并最終影響性能。
為了處理這些更復雜的場景,圖形管道首先引入了延遲頂點著色 (DVS) 以重新定義 Arm GPU 中的圖形數(shù)據(jù)流。DVS 利于性能隨內(nèi)核數(shù)增加而提升,使 Arm 的合作伙伴能夠在未來達到更高的性能水平。DVS 還有助于在高度復雜的游戲場景中保持穩(wěn)定幀率,同時為未來下一代的幾何內(nèi)容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度紋理的性能影響。DVS 的引入意味著超復雜幾何形狀的場景可被渲染,并可節(jié)省處理能力。
Arm認為內(nèi)存系統(tǒng)能耗功率是導致處理器散熱達到極限的主要因素。在第五代架構(gòu)中,希望為 GPU 分配更多的內(nèi)存系統(tǒng)效能以達到更好的視覺效果,同時也希望可以進一步節(jié)約能耗功率,以延長電池續(xù)航時間。
除了引入第五代架構(gòu)外,Immortalis 和 Mali GPU 的整體設計在性能和效率方面也實現(xiàn)了大幅提升。Immortalis-G720 支持十核或更多核心,并可選用優(yōu)化的物理 IP 來加速 SoC 設計。Mali-G720 和 Mali-G620 的超強可擴展性有助于為廣泛的消費電子設備帶來優(yōu)質(zhì)的圖形功能,例如智能手機、筆記本電腦、數(shù)字電視、機頂盒 (STB) 和可穿戴設備。Mali-G720 可支持六到九個核心,而 Mali-G620 可支持至多五個核心,可助力 Arm授權許可合作伙伴在更多市場中實現(xiàn)設計工作的快速復用。
3D 場景重建是一個關鍵的機器學習應用場景,可以在移動 GPU上渲染真實場景的新穎視圖。并且在該應用下,與 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的內(nèi)存帶寬減少了22%。
開發(fā)者可利用 Unity ML-Agents插件在游戲和模擬中訓練智能代理。在 GDC 2023 上,Arm展示了在移動 SoC 上處理 100 個類似代理和復雜圖形的超強表現(xiàn)。
Arm通過廣泛的 GPU 工具和資源保持對游戲開發(fā)者的生態(tài)系統(tǒng)支持??蓮腁rm Mobile Studio免費下載多種解析、性能分析和調(diào)試工具,以幫助開發(fā)者優(yōu)化其應用的性能和效率。
軟件優(yōu)化不可或缺
以TCS23 中的軟件來看包括三大支柱,即性能、安全以及開發(fā)者的可訪問性。Arm 終端事業(yè)部生態(tài)系統(tǒng)及工程高級總監(jiān) Geraint North詳細解析了TCS23 軟件部分的提升。
機器學習是軟件工作中非常重要的部分,因此在 TCS23 中我們更新了軟件技術庫。比如 Arm NN 以及 Arm Compute Library (ACL),這些都是開源的軟件技術庫,開發(fā)者可以利用它來優(yōu)化在 Armv9架構(gòu) CPU 和 GPU 上面機器學習的復雜性。
自 2023 年 1 月以來,Arm NN和 ACL 已經(jīng)通過谷歌的 Google Play Store 在安卓系統(tǒng)上提供,而且已經(jīng)有超過 1 億日活躍用戶。此外,到 2024 年,不管是Arm NN還是 ACL 都可以使用谷歌的移動平臺,意味著開發(fā)者能夠在可下載的項目,在默認狀態(tài)下更新到網(wǎng)絡最新的版本,同時意味著能在基于 Arm 架構(gòu)上實現(xiàn)開發(fā)者獲得最高可能的機器學習的潛力。
多年以來,Arm一直在大量提供不斷優(yōu)化中的Mali GPU,賦能開發(fā)者,為他們免費提供了強大的開發(fā)工具,從而能夠讓他們在基于 Mali GPU 上實現(xiàn)最佳效果的設計。同時Arm還與全球主要的游戲引擎工作室進行多年的合作,一起推動圖形技術的進步,并且以一種非常可擴展的方式實現(xiàn)產(chǎn)品的優(yōu)化。
Arm 還為開發(fā)者提供豐富的培訓以及最佳實踐信息文件的分享,讓開發(fā)者可以在開始構(gòu)建圖形時不斷去改善他們的創(chuàng)意。
除此之外,Arm 還為最新的工藝節(jié)點和庫優(yōu)化了IP,并且利用其在 RTL 方面的專長配置物理 IP,以此在先進的技術上為基于Arm架構(gòu)的產(chǎn)品設計、制造提供了優(yōu)化的EDA流程與物理實現(xiàn)。
軟件越多越復雜,相對應漏洞也會增長,Arm 的內(nèi)存標記擴展MTE 功能通過“鎖”和“密鑰”的設置避免內(nèi)存安全漏洞。值得一提的是,TCS23是一個完全支持64位的集群,以利用完整的64位移動生態(tài)系統(tǒng)的優(yōu)勢。
小結(jié):
TCS23基于最新一代的Armv9.2 架構(gòu),同時基于全新的DynamIQ共享單元之上,帶來更多的可擴展性和更細致的電源控制模式,確??蛻粼谛枰臅r候可以獲得完整的性能和帶寬,在不需要的時候可以通過非常細的顆粒度去降低功率。
從Arm對TCS23的部署也能夠看到解決方案的靈活性和彈性,適用于智能手機、筆記本電腦等不同領域。與此同時,對于安全性、AI運算以及生態(tài)都進行大量優(yōu)化和拓展。TCS23給廣大客戶提供了非常好的可擴展性,以期發(fā)揮架構(gòu)帶來的更大優(yōu)勢。
-
ARM
+關注
關注
134文章
9097瀏覽量
367610 -
移動設備
+關注
關注
0文章
496瀏覽量
54710
發(fā)布評論請先 登錄
相關推薦
評論