0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm解讀Armv9 CPU為何是打造高性能、高能效移動計算的關(guān)鍵

Arm社區(qū) ? 來源:Arm ? 2025-03-14 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 終端事業(yè)部產(chǎn)品管理高級總監(jiān) Stefan Rosinger

在之前有關(guān) Arm Cortex-X925 CPU 的文章中,Arm 技術(shù)專家曾探討了每時鐘周期指令數(shù) (IPC) 作為評估 CPU 性能的關(guān)鍵指標的重要性。與主要將頻率作為性能指標的做法不同,IPC 衡量的是 CPU 每個時鐘周期內(nèi)能處理的指令數(shù)。對于移動設(shè)備而言,電池續(xù)航和散熱管理是影響實際應(yīng)用、用戶體驗和設(shè)備處理復(fù)雜工作負載的關(guān)鍵所在。因而,IPC 對于評估移動設(shè)備性能而言,至關(guān)重要。

更高的頻率 ≠ 最優(yōu)表現(xiàn)

IPC 越高,表示在一個時鐘周期內(nèi)執(zhí)行的指令越多;即便時鐘速度較慢,也能帶來更好的性能。這對于內(nèi)存受限的工作負載尤為重要,因為其性能會受到 CPU 外部因素的制約。更高的 IPC 使得 CPU 能以更低的頻率運行,從而減少電量消耗和功耗,設(shè)備發(fā)熱也會緩解。這對于需要保持穩(wěn)定性能的移動設(shè)備來說,尤為有利。

雖然高頻 CPU 乍聽起來很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時鐘周期數(shù)量,而 IPC 則表示每個周期所完成的工作量。事實上,最高頻率很少會用到。例如,對于游戲和其他算力要求較高的工作負載來說,并不會以最大頻率使用 CPU,大多數(shù)時間反而是以中檔頻率運行。此時的能效更高,可以延長電池續(xù)航時間并降低設(shè)備溫度,而這兩者是提升整體用戶體驗的重要指標。

在相同的時間周期內(nèi),具有更高 IPC 的 CPU 在處理實際應(yīng)用和復(fù)雜工作負載時會表現(xiàn)出更優(yōu)的性能。即便是當今具有復(fù)雜計算需求的 AI 應(yīng)用(例如聊天機器人、實時語言翻譯和虛擬助手),在 IPC 更高的 CPU 上運行時也會表現(xiàn)得更加出色。此外,就能效而言,在一個周期內(nèi)執(zhí)行更多的指令意味著可以更快地完成任務(wù),使得 CPU 處于高能耗狀態(tài)的時間減少,從而節(jié)省電池電量。

卓越的架構(gòu)設(shè)計

在基于 Armv9 架構(gòu)的 CPU 設(shè)計中,可伸縮向量擴展 (SVE2) 是提高 IPC 的關(guān)鍵所在。這一架構(gòu)特性采用新的專用向量指令,是加速智能手機關(guān)鍵工作負載和應(yīng)用的理想之選。

SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶在主流應(yīng)用上觀看點播視頻時,能獲得更長的電池續(xù)航時間。此外,通過加速常用的圖像處理庫,SVE2 還增強了視頻通話期間用戶體驗的流暢度,同時提高了畫面質(zhì)量。其中包括更好的攝像頭旋轉(zhuǎn)體驗,以及圖像濾鏡的切換和使用體驗。

不僅如此,SVE2 還不受向量長度的影響,這意味著代碼開發(fā)將支持更大的向量長度,例如 256 位。由此可確保與移動計算未來發(fā)展的兼容性,包括未來更注重邏輯擴展,而非 RAM 的先進工藝節(jié)點。移動端市場將因此能夠適應(yīng)更大的向量長度,有利于游戲和 AI 模型中 SVE 代碼的呈現(xiàn)。

通過深入研究設(shè)計,IPC 性能可借助一系列特定的微架構(gòu)改進得以提高。其中包括但不限于:

超標量亂序執(zhí)行

分支預(yù)測和預(yù)取器

數(shù)據(jù)推測

適當?shù)木彺孢x擇

Arm Cortex CPU 一直在逐年推進各種類似的微架構(gòu)改進,以實現(xiàn)更高的性能水平。

面向移動端的最新 Armv9 CPU

上述的架構(gòu)特性和微架構(gòu)提升是 Arm 面向移動端市場的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機)的核心,Cortex-X925 對私有 L2 緩存進行了升級,從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預(yù)取數(shù)據(jù)和復(fù)雜指令,從而顯著增強了 CPU 的整體性能和能效。得益于此,Arm 計算平臺在 2024 年實現(xiàn)了驚人的兩位數(shù) IPC 性能提升。

如此一來,終端用戶能夠享受到一系列實際性能的提升,包括更快的應(yīng)用響應(yīng)速度、更好的游戲體驗、更流暢的視頻流媒體傳輸、更快的網(wǎng)頁瀏覽和順暢的多任務(wù)處理。同時,更高的 IPC 也帶來了能效的提升,延長了用戶的沉浸式體驗。

與此同時,Cortex-A725 作為 CPU 工作負載的主力,也進行了一系列針對性更新,著力于需要持續(xù)出色性能的關(guān)鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

在 Armv9.2 集群中,每個 CPU 組件都能應(yīng)對廣泛的實際用例和復(fù)雜的工作負載。例如,Cortex-X925 可處理應(yīng)用啟動和網(wǎng)頁瀏覽的“突發(fā)”工作負載,而 Cortex-A725 則可以在常見的移動端用例(包括游戲、網(wǎng)頁瀏覽、基于攝像頭的應(yīng)用和視頻流媒體)中持續(xù)提供穩(wěn)定性能,以延長設(shè)備的使用時間(即電量耗盡之前,用戶可在設(shè)備上使用某些用例的平均時間)。

打造無可比擬的移動端體驗

從根本上說,移動設(shè)備需要兼具性能與能效,而 IPC 的提升恰好能同時滿足這個需求。用戶因而能更長時間體驗各種需要高算力的應(yīng)用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時鐘頻率相結(jié)合,將性能和能效提升到一個更高的水平,從而為最終用戶帶來更加出色的用戶體驗。這也正是為什么全球 99% 的智能手機都基于 Arm 計算平臺打造的原因之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9347

    瀏覽量

    377126
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11074

    瀏覽量

    216894
  • IPC
    IPC
    +關(guān)注

    關(guān)注

    3

    文章

    365

    瀏覽量

    53125
  • 移動計算
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    10384

原文標題:內(nèi)有劇透!打造高性能、高能效移動計算的關(guān)鍵是?

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP
    的頭像 發(fā)表于 05-29 10:12 ?1004次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    面向 PC 市場的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場推出的核心計算平臺,屬于其“
    的頭像 發(fā)表于 05-29 09:56 ?658次閱讀

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設(shè)備在 AI 性能、能比與開發(fā)效率上的挑戰(zhàn)。以下從技術(shù)架構(gòu)、
    的頭像 發(fā)表于 05-29 09:54 ?919次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計算平臺,屬于其“平臺優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?1342次閱讀

    MWC2025亮點放送 探索Arm如何塑造移動端技術(shù)未來

    ,彰顯了人工智能 (AI) 和移動端技術(shù)之間的共生關(guān)系。 ?Arm 計算平臺賦能從云到邊的 AI 體驗。Arm 通過提供端到端的高能
    的頭像 發(fā)表于 03-14 15:40 ?921次閱讀
    MWC2025亮點放送 探索<b class='flag-5'>Arm</b>如何塑造<b class='flag-5'>移動</b>端技術(shù)未來

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能與先進 AI 能力賦能物聯(lián)網(wǎng)革新

    架構(gòu)的超高能 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣AI
    的頭像 發(fā)表于 03-06 11:43 ?1300次閱讀
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 邊緣 AI <b class='flag-5'>計算</b>平臺,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>與先進 AI 能力賦能物聯(lián)網(wǎng)革新

    搶先試用此芯Armv9 AI PC開發(fā)套件瑞莎“星睿O6”

    、邊緣、機器人等不同場景的“星睿O6”開發(fā)套件 。 該套件于2024年12月發(fā)布,異構(gòu)集成Armv9 CPU核心、Arm Immortalis GPU及安謀科技“周易”NPU等自研業(yè)務(wù)產(chǎn)品,具備強大的多媒體處理能力,并支持靈活的
    的頭像 發(fā)表于 03-06 08:09 ?659次閱讀
    搶先試用此芯<b class='flag-5'>Armv9</b> AI PC開發(fā)套件瑞莎“星睿O6”

    Arm Cortex-A320 CPU助力嵌入式設(shè)備實現(xiàn)高能AI計算

    Arm Cortex-A320 是目前最小型的 Armv9-A 架構(gòu) CPU。得益于該處理器的推出,開發(fā)者現(xiàn)在能有更多選擇決定如何處理物聯(lián)網(wǎng)邊緣人工智能 (AI) 工作負載。然而,面對多樣化的選擇
    的頭像 發(fā)表于 02-27 17:17 ?747次閱讀
    <b class='flag-5'>Arm</b> Cortex-A320 <b class='flag-5'>CPU</b>助力嵌入式設(shè)備實現(xiàn)<b class='flag-5'>高能</b><b class='flag-5'>效</b>AI<b class='flag-5'>計算</b>

    詳解Arm Cortex-A320 CPU的特性

    Arm Cortex-A320 CPU 的推出具有重要的里程碑意義。作為首個基于 Armv9 架構(gòu)的超高能
    的頭像 發(fā)表于 02-27 17:13 ?1033次閱讀

    Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器

    邊緣 AI 需要更卓越的計算性能、更強大的安全性,以及更出色的軟件靈活性。隨著軟件愈發(fā)復(fù)雜化,Armv9 架構(gòu)應(yīng)運而生,以提供先進的機器學(xué)習(xí) (ML) 和 AI 功能,并具備增強的安全特性。該架構(gòu)現(xiàn)已在 Cortex-A3xx
    的頭像 發(fā)表于 02-27 17:10 ?778次閱讀

    Arm推出全球首個Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專為物聯(lián)網(wǎng)應(yīng)用優(yōu)化,支持運行超 10 億參數(shù)的端側(cè) AI 模型,已獲得包括亞馬遜云科技 (AWS)、西門子和瑞
    的頭像 發(fā)表于 02-27 17:08 ?881次閱讀

    MediaTek天璣8350移動芯片賦能榮耀平板V9

    想要擁有一款學(xué)習(xí)、辦公、游戲性能全方位拉滿的平板?那千萬不能錯過榮耀平板 V9 ,其搭載天璣 8350 移動芯片,該芯片采用先進的 Armv9 架構(gòu),搭載包括 4 個 Cortex-A
    的頭像 發(fā)表于 02-24 15:20 ?1095次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    NEXT的原生頁面高性能解決方案,從頁面滑動、跳轉(zhuǎn)及應(yīng)用冷啟動等關(guān)鍵環(huán)節(jié),為開發(fā)者提供全面的支持。目前,這些解決方案均已上線OpenHarmony開源社區(qū),可在OpenHarmony三方庫中心倉進行搜索,歡迎開發(fā)者多多使用和共建,打造
    發(fā)表于 01-02 18:00

    基于Armv9架構(gòu)的MediaTek天璣8400移動芯片問世

    如今,基于 Armv9 CPU 技術(shù)構(gòu)建的人工智能 (AI) 旗艦智能手機立于技術(shù)前沿,為 AI 創(chuàng)新提供了前所未有的機遇。為了應(yīng)對持續(xù)增長的 AI 工作負載的計算強度及復(fù)雜度,Armv
    的頭像 發(fā)表于 12-24 14:18 ?766次閱讀

    Armv9 CPU中SVE2的實際用例

    隨著每一代新產(chǎn)品的推出,Arm CPU 都會實現(xiàn)代際性能提升,并引入架構(gòu)改進,以滿足不斷演進的計算工作負載的需求。本文將重點介紹三個用例,以展示 A
    的頭像 發(fā)表于 10-21 09:54 ?1067次閱讀
    <b class='flag-5'>Armv9</b> <b class='flag-5'>CPU</b>中SVE2的實際用例

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品