0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹Armv9.5-A中Arm架構(gòu)的最新特性

冬至子 ? 來源:Martin Weidmann ? 作者:Martin Weidmann ? 2023-10-11 09:44 ? 次閱讀

隨著人工智能AI)的崛起和安全威脅加劇,計(jì)算的需求持續(xù)加強(qiáng)。因此,世界上各種設(shè)備核心的基礎(chǔ)計(jì)算架構(gòu)的持續(xù)演進(jìn)顯得尤為重要。這就是為什么我們的工程團(tuán)隊(duì)向Arm架構(gòu)中添加新的功能和技術(shù),然后軟件團(tuán)隊(duì)確保軟件盡可能無縫地利用這些未來的功能和技術(shù)。

Arm架構(gòu)是怎樣開發(fā)的

Arm每年發(fā)布對Arm指令集架構(gòu)(ISA)的更新,這些更新是與Arm生態(tài)系統(tǒng)的多樣化合作伙伴共同創(chuàng)建的。該過程涉及芯片合作伙伴、操作系統(tǒng)供應(yīng)商和OEMs、Arm的內(nèi)部工程團(tuán)隊(duì)和標(biāo)準(zhǔn)制定機(jī)構(gòu)。

經(jīng)過嚴(yán)格規(guī)劃的ISA可以確保軟件在新舊硬件上繼續(xù)工作很多年。Arm與Linaro以及其他眾多合作伙伴緊密合作,以便最廣泛使用的軟件上游社區(qū)(例如Linux內(nèi)核和發(fā)行版)可以利用Arm ISA,以幫助提供全球最廣泛的開發(fā)者生態(tài)系統(tǒng)。

每年九月,我們發(fā)布一篇博客,討論當(dāng)年A-Profile架構(gòu)的關(guān)鍵更新。然后我們通過開發(fā)者網(wǎng)頁發(fā)布完整的指令集和系統(tǒng)寄存器文檔。

完整的Arm架構(gòu)參考手冊(Arm ARM)也每年更新一次。預(yù)計(jì)將在2024年初發(fā)布包含2023擴(kuò)展的更新。在2023年和2024年,“Learn the Architecture”頁面也將更新。

Architecture 2023 image 1.png

發(fā)布博客和文檔只是部署新架構(gòu)的第一步。下一步我們將和生態(tài)系統(tǒng)伙伴合作,確保一旦硬件可用,開源軟件就能立即利用這一功能。

2023年,Arm引入新功能,以支持我們持續(xù)關(guān)注的人工智能(AI)、機(jī)器學(xué)習(xí)(ML)和安全性。讓安全的AI無處不在是Arm架構(gòu)的關(guān)鍵優(yōu)先任務(wù),神經(jīng)網(wǎng)絡(luò)(NNs)的訓(xùn)練對AI的持續(xù)發(fā)展和進(jìn)步至關(guān)重要。這就是為什么2023年的架構(gòu)擴(kuò)展包括FP8的新8位浮點(diǎn)格式的支持,此格式已在NNs中迅速被采納。在安全性方面,我們正在添加Checked Pointer Arithmetic,該功能基于Arm Memory Tagging Extension (MTE),允許開發(fā)人員快速檢測內(nèi)存安全性違規(guī),從而在應(yīng)用開發(fā)過程中節(jié)省成本和時(shí)間。

之前對A-Profile架構(gòu)的更新的詳細(xì)信息可以在這里找到:2014、2015、2016、2017、2018、2019、2020、2021和2022。

讓我們看看今年增加了哪些新功能。

Floating Point 8 (FP8)

2022年,Arm、Intel 和 Nvidia 宣布了他們在FP8上的合作,這是一個(gè)交換格式,允許軟件生態(tài)系統(tǒng)輕松地共享NN模型,并支持AI計(jì)算能力的持續(xù)進(jìn)步。作為2023年擴(kuò)展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對FP8的支持。

FP8支持兩種數(shù)據(jù)格式:E5M2 和 E4M3。這兩種格式在精度和范圍之間提供了不同的權(quán)衡。
image.png

由FPMR寄存器控制選擇使用那種格式。可以為一條指令的不同輸入選擇不同的格式,從而有效地處理不同格式的數(shù)據(jù)集。我們堅(jiān)信,行業(yè)共創(chuàng)的FP8帶來的好處,使開發(fā)者能夠集中精力在真正重要的創(chuàng)新和差異化上。我們很興奮地看到FP8如何推動(dòng)未來的AI發(fā)展.

實(shí)時(shí)遷移

實(shí)時(shí)遷移是將虛擬機(jī)(VM)從一個(gè)主機(jī)移動(dòng)到另一個(gè)主機(jī)的過程,同時(shí)保留其可用性和狀態(tài)。高效的實(shí)時(shí)遷移支持是大規(guī)模數(shù)據(jù)中心管理的重要工具。

image.png

為了實(shí)現(xiàn)實(shí)時(shí)遷移,hypervisor需要在VM仍在舊主機(jī)上運(yùn)行時(shí)將頁面復(fù)制到新主機(jī)。這通常需要一個(gè)迭代過程,因?yàn)閂M可能會(huì)“弄臟”已經(jīng)被復(fù)制的頁面。解決這個(gè)問題有不同的方法,但它們都必須面對三個(gè)挑戰(zhàn):

記錄(Recording):創(chuàng)建VM寫入(弄臟)的頁面的記錄。
調(diào)查(Surveying):處理記錄,以確定哪些頁面需要重新復(fù)制。
清理(Cleaning):在每次迭代上重置記錄機(jī)制。

2023年的擴(kuò)展引入了新特性,幫助優(yōu)化這三個(gè)過程。

FEAT_HDBSS增加了記錄被弄臟的stage 2頁面或塊日志的能力。這種機(jī)制減少了記錄成本,因?yàn)閮?nèi)存管理單元(MMU)可以有效地創(chuàng)建日志,而不中斷VM的執(zhí)行。該日志還減少了調(diào)查成本,因?yàn)樯傻臄?shù)據(jù)是hypervisor可以高效使用的格式。

image.png

為了解決清理成本,F(xiàn)EAT_HACDBS為清理 stage 2頁表中的臟狀態(tài)增加了一個(gè)加速器。該引擎使用臟頁面的日志來定位需要更新的stage 2頁表描述符。

這些特性一起為實(shí)時(shí)遷移帶來顯著的性能和效率提升。

Checked Pointer Arithmetic 檢驗(yàn)過的指針運(yùn)算

AArch64支持的特性可以重新利用保存地址的寄存器的高位。例如,Armv8.0-A中引入的Tagged Pointers和Armv8.5-A中引入的MTE。

軟件經(jīng)常需要操作指針,例如給基址加上一個(gè)偏移量。這通常使用常規(guī)的算術(shù)操作來完成,如加或減。地址計(jì)算上的溢出可能導(dǎo)致非地址位被損壞。例如,如果正在使用MTE,地址操作可能導(dǎo)致存儲(chǔ)在指針中的MTE Tag被更改。損壞的MTE Tag可能導(dǎo)致處理器無法檢測到內(nèi)存安全違規(guī),如下所示:

image.png

2023年的擴(kuò)展引入了專門用于操作指針的新指令。這些指令包含多個(gè)指針特定的檢查,包括檢查bits[63:56]是否被修改,并防止溢出。尋址模式的加載和存儲(chǔ)指令也可以被配置為保留bits[63:56]。

取之前的MTE例子,新的特性允許處理器檢測指針的前8位是否已經(jīng)被修改。這意味著,如果MTE標(biāo)簽被損壞,它將被報(bào)告回到軟件中。

其他功能

2023年擴(kuò)展部分引入的其他增強(qiáng)功能包括:

  • 支持使用PC(程序計(jì)數(shù)器)和SP(當(dāng)前選擇的堆棧指針)的組合作為生成或檢查指針認(rèn)證代碼時(shí)的modifier 。
  • 支持具備Realm Management Extension (RME) 的設(shè)計(jì),在Granule Protection Tables中支持non secure only,并具有禁用某些Physical Address Spaces (PAS)的能力。
  • EL3配置寫入陷阱。
  • 斷點(diǎn)支持地址范圍和mismatch觸發(fā),而無需鏈接。
  • 支持從EL3有效地將SErrors委托給EL2或EL1。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5343

    瀏覽量

    120365
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100766
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47279

    瀏覽量

    238493
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8418

    瀏覽量

    132634
  • ARM架構(gòu)
    +關(guān)注

    關(guān)注

    14

    文章

    177

    瀏覽量

    36312
收藏 人收藏

    評論

    相關(guān)推薦

    一文詳解Arm架構(gòu)Armv9.6-A的最新功能

    Arm CPU 是當(dāng)今人工智能 (AI) 賦能軟件的關(guān)鍵,它可解釋、處理和執(zhí)行指令。Arm 指令集架構(gòu) (ISA) 作為硬件和軟件的接口,指示處理器做什么和怎么做。Arm ISA 持續(xù)
    的頭像 發(fā)表于 12-17 10:22 ?1066次閱讀
    一文詳解<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b><b class='flag-5'>Armv9.6-A</b><b class='flag-5'>中</b>的最新功能

    ARM技術(shù)是什么?國內(nèi)有哪些ARM廠家呢?一起來了解一下!

    (AArch64)。這使得ARM處理器能夠兼容更多的軟件和應(yīng)用,提高系統(tǒng)的靈活性和兼容性。 二、ARM技術(shù)發(fā)展歷程 ARM架構(gòu)經(jīng)歷了多個(gè)版本的迭代,不斷提升性能和功能。以下是幾個(gè)主要版
    發(fā)表于 11-18 16:35

    Arm Cortex-X925為用戶實(shí)際需求提供強(qiáng)勁性能

    作為 Arm 目前性能最強(qiáng)大的 CPU 設(shè)計(jì)之一,基于 Armv9.2 架構(gòu)Arm Cortex-X925 在 Geekbench 6.2 基準(zhǔn)測試
    的頭像 發(fā)表于 10-27 11:09 ?459次閱讀

    Armv9 CPUSVE2的實(shí)際用例

    隨著每一代新產(chǎn)品的推出,Arm CPU 都會(huì)實(shí)現(xiàn)代際性能提升,并引入架構(gòu)改進(jìn),以滿足不斷演進(jìn)的計(jì)算工作負(fù)載的需求。本文將重點(diǎn)介紹三個(gè)用例,以展示 Armv9 CPU 的
    的頭像 發(fā)表于 10-21 09:54 ?385次閱讀
    <b class='flag-5'>Armv</b>9 CPU<b class='flag-5'>中</b>SVE2的實(shí)際用例

    如何學(xué)習(xí)ARM?

    ARM 處理器架構(gòu): 學(xué)習(xí) ARM 處理器的架構(gòu)是學(xué)習(xí)的核心。ARM 架構(gòu)有不同的版本,如
    發(fā)表于 10-11 10:42

    什么是ARM架構(gòu)?什么是X86架構(gòu)?兩者的區(qū)別是什么?

    一、什么是ARM架構(gòu)? (一)起源與發(fā)展 ARM 架構(gòu)由英國劍橋的 Acorn 計(jì)算機(jī)公司開發(fā)。因市場無合適產(chǎn)品,Acorn 自行設(shè)計(jì)出第一款微處理器,命名為
    的頭像 發(fā)表于 09-06 10:40 ?885次閱讀

    Arm推出AI優(yōu)化的Arm終端CSS以及新的Arm Kleidi軟件

    Arm 終端計(jì)算子系統(tǒng) (CSS) 作為新的計(jì)算解決方案,結(jié)合了 Armv9 架構(gòu)的優(yōu)勢,以及基于三納米工藝節(jié)點(diǎn),經(jīng)過驗(yàn)證和證實(shí)為生產(chǎn)就緒的新 Arm CPU 和 GPU 實(shí)現(xiàn),可賦能
    的頭像 發(fā)表于 05-30 11:33 ?660次閱讀
    <b class='flag-5'>Arm</b>推出AI優(yōu)化的<b class='flag-5'>Arm</b>終端CSS以及新的<b class='flag-5'>Arm</b> Kleidi軟件

    移動(dòng)端芯片性能提升,Armv9架構(gòu)新升級引發(fā)關(guān)注

    “數(shù)碼博主”5月17日的最新爆料指出,聯(lián)發(fā)科積極推進(jìn)Armv9新一代IP BLACKHAWK“黑鷹”的架構(gòu)設(shè)計(jì),預(yù)計(jì)天璣9400芯片將采用這一架構(gòu),有望以“全大核”設(shè)計(jì)再度領(lǐng)跑移動(dòng)SoC CPU性能榜單。
    的頭像 發(fā)表于 05-17 16:51 ?1020次閱讀

    fpga封裝技術(shù)和arm架構(gòu)的優(yōu)缺點(diǎn)

    FPGA封裝技術(shù)和ARM架構(gòu)是兩個(gè)不同的概念,分別屬于硬件設(shè)計(jì)的不同領(lǐng)域。
    的頭像 發(fā)表于 03-26 15:51 ?866次閱讀

    英特爾與Arm聯(lián)手助力初創(chuàng)企業(yè)開發(fā)Arm架構(gòu)SoC

    據(jù)介紹,此次合作旨在聯(lián)合推動(dòng)使用Intel 18A制程工藝研發(fā)Arm架構(gòu)SoC的初創(chuàng)企業(yè)發(fā)展。英特爾和Arm將攜手提供IP和制造及相關(guān)金融支
    的頭像 發(fā)表于 03-25 15:34 ?409次閱讀

    蘋果M3芯片是ARM架構(gòu)

    蘋果M3芯片采用的是ARM架構(gòu)。這種架構(gòu)具有高效能和低功耗的特點(diǎn),使得M3芯片在提供出色性能的同時(shí),也能保持較低的能耗。
    的頭像 發(fā)表于 03-08 16:03 ?2031次閱讀

    Arm Helium技術(shù)誕生的由來 為何不直接采用Neon?

    經(jīng)過 Arm 研究團(tuán)隊(duì)多年的不懈努力,Arm 于 2019 年推出了適用于 Armv8?M 架構(gòu)Arm Cortex-M 矢量擴(kuò)展技術(shù)
    的頭像 發(fā)表于 02-29 17:01 ?2250次閱讀
    <b class='flag-5'>Arm</b> Helium技術(shù)誕生的由來 為何不直接采用Neon?

    Arm v9芯片新架構(gòu)揭秘

    從中長期來看,隨著單芯片 ARM 核數(shù)增加、基于 ARM 架構(gòu)芯片數(shù)量的上升以及ARM 應(yīng)用場景的增加,公司仍將保持增長。據(jù)公司公告數(shù)據(jù)顯示,2023 財(cái)年,高端芯片采用
    發(fā)表于 02-27 14:14 ?5416次閱讀
    <b class='flag-5'>Arm</b> v9芯片新<b class='flag-5'>架構(gòu)</b>揭秘

    arm架構(gòu)和x86架構(gòu)區(qū)別 linux是x86還是arm

    ARM架構(gòu)和x86架構(gòu)是兩種不同的計(jì)算機(jī)處理器架構(gòu),它們在體系結(jié)構(gòu)、指令集、應(yīng)用領(lǐng)域等方面有著明顯的區(qū)別。Linux操作系統(tǒng)則具有廣泛的適配性,可以運(yùn)行在各種
    的頭像 發(fā)表于 01-30 13:46 ?1.8w次閱讀

    如何克服Amdahl定律的影響呢?

    在前幾篇文章,我們介紹了采用 Arm Helium 技術(shù)(也稱為 MVE)的 Armv8.1-M 架構(gòu)如何處理矢量指令。
    的頭像 發(fā)表于 01-12 14:30 ?805次閱讀
    如何克服Amdahl定律的影響呢?