01 ARM:3A大作 ? ?
將 CPU 的設(shè)計(jì)與制造相分離的代工模式,給 AMD 提供了高度的靈活性。第二、三代 EPYC 處理器可以相對(duì)自由的選擇不同的制程來匹配芯片設(shè)計(jì)的具體需求,客觀上起到了幫助 AMD“以小博大”,從英特爾手中持續(xù)搶下市場(chǎng)份額的作用。 ? 相關(guān)閱讀: Arm架構(gòu)升級(jí),v9與v8版本有何差異? 從X86到ARM,跨越CPU架構(gòu)鴻溝 ? 不過,這個(gè)靈活性的獲益者更多在于 AMD 自身。超大規(guī)模用戶如 AWS 和阿里云不滿足于主要調(diào)整核心數(shù)、運(yùn)行頻率和 TDP 等指標(biāo)的傳統(tǒng)定制,希望對(duì) CPU 設(shè)計(jì)有更多的自主權(quán);又或者,新興 CPU 供應(yīng)商如 Ampere(安晟培)要選擇適用的技術(shù)路線……Arm 幾乎是服務(wù)器 CPU 市場(chǎng)上唯一的答案。 ? 如果說臺(tái)積電幫助解決 CPU 的制造問題,那么 Arm 幫助解決 CPU 的設(shè)計(jì)問題。
Cortex 孵化 Neoverse
對(duì)亞馬遜(Annapurna Labs)、阿里巴巴(平頭哥)和 Ampere 這有足夠芯片設(shè)計(jì)能力的“3A”客戶來說,Arm 的 Neoverse 平臺(tái)提供了設(shè)計(jì)一款服務(wù)器 CPU 的基礎(chǔ),包括 CPU 核心的微架構(gòu)和配套的制程。 ? Arm 對(duì)服務(wù)器 CPU 市場(chǎng)的正面進(jìn)攻可以回溯到 2011 年 10 月,Arm 發(fā)布加入可選 64 位架構(gòu)(AArch64)的 ARMv8-A。一年后,Arm 發(fā)布實(shí)現(xiàn) ARMv8-A 64 位指令集的微架構(gòu) Cortex-A53 和 Cortex-A57,AMD 表態(tài)將推出相應(yīng)的服務(wù)器產(chǎn)品——后者多年的服務(wù)器市場(chǎng)經(jīng)驗(yàn)正是當(dāng)時(shí)的 Arm 陣營(yíng)所稀缺的。 ? 此后的幾年中,芯片供應(yīng)商如 Cavium、高通(Qualcomm)和國(guó)內(nèi)的華芯通,超大規(guī)模用戶如微軟,都曾積極的推動(dòng) 64 位 Arm 進(jìn)入數(shù)據(jù)中心市場(chǎng)。但是,真正比較成規(guī)?;牟渴?,應(yīng)當(dāng)始自 2018 年 11 月 AWS 預(yù)覽其首個(gè) Arm 服務(wù)器 CPU —— Graviton。
? Graviton 基于 2015 年推出的 Cortex-A72(A57 的繼任者),16nm 制程,16 核、16 線程, 與同時(shí)期的 x86 服務(wù)器 CPU 比起來,頗有些‘“平平無奇”,最大的仰仗是亞馬遜“自家的孩子”,可以充分優(yōu)化。 ? Cortex-A 家族已經(jīng)是 Cortex 三兄弟里最追求性能的了,但畢竟不是面向服務(wù)器平臺(tái)的產(chǎn)品,不能放寬功耗限制去飆性能。于是,在Graviton 公開之前一個(gè)月,Arm 發(fā)布了面向云計(jì)算和邊緣基礎(chǔ)設(shè)施的 Neoverse 平臺(tái),起點(diǎn)便是 16nm 的 A72 和 A75,代號(hào) Cosmos。
△ Neoverse可伸縮計(jì)算平臺(tái) ? 僅僅 4 個(gè)月之后,2019 年 2 月,Arm 更新了 Neoverse 平臺(tái)的路線圖,推出 7nm 的 Neoverse N1,性能比之前的目標(biāo)又有 30% 以上的提升。 ? 代號(hào) Ares 的 Neoverse N1,基礎(chǔ)是 2018 年推出的 Cortex-A76,兩者的流水線結(jié)構(gòu)相同,? 均為 11 級(jí)短流水線設(shè)計(jì),前端都是 4 寬的讀 取 / 解碼器。Arm 將其稱為“手風(fēng)琴”管道,因?yàn)楦鶕?jù)指令長(zhǎng)度不 同,它可以在延遲敏感的情況下將第二預(yù)測(cè)階段與第一獲取階段重 疊,將調(diào)度階段與第一發(fā)布階段重疊,將流水線長(zhǎng)度減少到 9 級(jí)。L2 Cache 也新增可選的 1MiB 容量,是 A76 的 2 倍。 ?
△ 4 vCPU 配置,Neoverse N1 相對(duì) Cortex-A72的整數(shù)性能提升 ? 相較于上一代的 A72 平臺(tái),Neoverse N1 平臺(tái)帶來了顯著的性能提升, 許多項(xiàng)目的成績(jī)翻倍,尤其是在標(biāo)志性的機(jī)器學(xué)習(xí)項(xiàng)目中,成績(jī)接 近上一代產(chǎn)品的 5 倍。雖然 A72 的年頭早了點(diǎn)兒,但這樣的性能差 距也說明 Neoverse N1 確實(shí)有了質(zhì)的飛躍。
Graviton2 與 Altra 系列
? Neoverse N1 平臺(tái)帶給數(shù)據(jù)中心市場(chǎng)的沖擊很大,因?yàn)樗腥硕伎?到了它的巨大潛力和價(jià)值,以及這背后的機(jī)會(huì)。如果說之前的 A72 還只是在數(shù)據(jù)中心市場(chǎng)嶄露頭角的話,那么 Neoverse N1 則讓更多 人相信 Arm 有能力在這個(gè)領(lǐng)域分一杯羹。 兩款分別來自云服務(wù)商和獨(dú)立 CPU 供應(yīng)商的 7nm CPU,都基于 Neoverse N1。
? 2019 年 11 月,AWS 官宣 Graviton2 處理器:
核數(shù)暴漲至 64,是一代的 4 倍;
晶體管數(shù)更有 6 倍,達(dá)到 300 億之多;
64MiB L2 Cache,是一代的 8 倍;
DDR4-3200 內(nèi)存接口,(頻率)是一代的 2 倍;
運(yùn)行頻率 2.5GHz,略高于一代的 2.3GHz。
△ 2020 年 AWS 新增的 EC2 實(shí)例中,? Gravtion2 占據(jù)半壁江山,? Intel 和 AMD 的比例也耐人尋味 ? 基于 Graviton2 的 EC2(Elastic Compute Cloud,彈 性 計(jì) 算 云)實(shí) 例類型迅速增多,包括但不限于通用型(M6g、T4g)、計(jì)算優(yōu)化 型(C6g)、內(nèi)存優(yōu)化型(R6g、X2gd),部署的區(qū)域(Region)和數(shù)量也從 2020 年中起穩(wěn)定增長(zhǎng)——據(jù)統(tǒng)計(jì),2020 年全年,AWS EC2 實(shí)例增量中的 49% 基于 AWS Graviton2。 ?
Armv9:繼往開來
2011 年 11 月公布的 Armv8,將 Arm 帶入了 64 位時(shí)代。在 Arm 與生態(tài)合作伙伴的共同努力下,經(jīng)過數(shù)次產(chǎn)品迭代,Arm 陣營(yíng)用了十年的時(shí)間,在服務(wù)器市場(chǎng)站穩(wěn)了腳跟。
2021 年 3 月底,Armv9 發(fā)布,在 Armv8 的基礎(chǔ)上,著重升級(jí)了安全性、 機(jī)器學(xué)習(xí)(Machine Learing,ML)和數(shù)字信號(hào)處理(Digital Signal Processing,DSP)方面的能力。 ? 在新架構(gòu)所帶來的三大特性中,機(jī)器學(xué)習(xí)或許是大眾最熟悉也是最關(guān)心的內(nèi)容。伴隨著異構(gòu)應(yīng)用的崛起,以機(jī)器學(xué)習(xí)為代表的人工智能(Artificial Intelligence,AI)技術(shù)已經(jīng)深入我們生活的方方面面,無論是在后端的數(shù)據(jù)中心還是在終端、邊緣側(cè),機(jī)器學(xué)習(xí)都大有用武之地。 ? 為了更好地提升 AI 和 DSP 所需的算力,ARMv9 將原本支持的可伸縮矢量擴(kuò)展(Scalable Vector Extension,SVE)升級(jí)到了 2.0 版本。
這項(xiàng)技術(shù)可以改善機(jī)器學(xué)習(xí)和數(shù)字信號(hào)處理應(yīng)用的性能表現(xiàn),有助于對(duì) 5G 系統(tǒng)、VR/AR、機(jī)器學(xué)習(xí)等一系列工作負(fù)載的處理。 ? SVE2 提供了可調(diào)節(jié)的向量(Vector,矢量)大小,范圍從 128b(bit, 位)到 2048b,從而允許向量的可變粒度為 128b,這種變化并不會(huì)受到硬件平臺(tái)的影響。這就意味著,軟件開發(fā)人員將只需要編譯一次其代碼,就可以適用于 Armv9 乃至于后續(xù)產(chǎn)品中,實(shí)現(xiàn)“編寫一次,到處運(yùn)行”。同樣,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的更保守的設(shè)計(jì)上運(yùn)行,這對(duì)于 Arm 設(shè)計(jì)從物聯(lián)網(wǎng)、移動(dòng)到數(shù)據(jù) 中心的 CPU 而言至關(guān)重要。
? SVE2 擴(kuò)展還增加了壓縮和解壓縮 CPU 核心內(nèi)的代碼和數(shù)據(jù)的能力,因?yàn)閷?shù)據(jù)移入和移出芯片的過程耗電很大,盡可能多使用芯片內(nèi)的數(shù)據(jù)可以減少這種數(shù)據(jù)移動(dòng),從而降低能耗。 ? 更值得一提的是 Confidential Compute Architecture(CCA),中文名稱為機(jī)密計(jì)算架構(gòu),這也是 Arm 本次版本更新最重要的內(nèi)容。其實(shí)安全問題近些年變得愈演愈烈,勒索病毒與黑客攻擊無時(shí)無刻不在活動(dòng)。
面對(duì)層出不窮的網(wǎng)絡(luò)攻擊問題,既需要網(wǎng)絡(luò)服務(wù)商、軟件公司的努力,也需要包括 Arm 在內(nèi)的硬件基礎(chǔ)設(shè)施提供商從源頭上封堵可能存在的漏洞,就促成了 CCA 的出現(xiàn)。這是一種基于架構(gòu)層面的安全防護(hù)能力,通過打造基于硬件的安全運(yùn)行環(huán)境來執(zhí)行計(jì)算,保護(hù)部分代碼和數(shù)據(jù),免于被存取或修改,乃至不受特權(quán)軟件的影響。 ?
△ Arm 機(jī)密計(jì)算架構(gòu)(左),Android 11 和 OpenSUSE 引入的內(nèi)存標(biāo)簽擴(kuò)展技術(shù)(右) ? 為此 CCA 引入了動(dòng)態(tài)創(chuàng)建機(jī)密領(lǐng)域(Realms)的概念——這是一個(gè)安全的容器化執(zhí)行環(huán)境,支持安全的數(shù)據(jù)操作,可將數(shù)據(jù)與 hypervisor 或操作系統(tǒng)隔離。Hypervisor 的管理功能由“領(lǐng)域管理器” (realms manager)承擔(dān),而 hypervisor 本身只負(fù)責(zé)調(diào)度和資源分配。使用“領(lǐng)域”的優(yōu)勢(shì)在于極大地減少了在設(shè)備上運(yùn)行給定應(yīng)用程序的信任鏈,操作系統(tǒng)在很大程度上對(duì)安全問題變得透明,也允許需要監(jiān)督控制的關(guān)鍵任務(wù)應(yīng)用程序能夠在任何設(shè)備上運(yùn)行。
? 在實(shí)際應(yīng)用中,內(nèi)存是非常容易被攻擊的一環(huán),內(nèi)存安全也一直成為行業(yè)的關(guān)注點(diǎn),如何在內(nèi)存安全漏洞被利用之前就能發(fā)現(xiàn)問題,是提高全球軟件安全的重要一步。為此,Arm 與 Google 持續(xù)合作開發(fā)的“內(nèi)存標(biāo)簽擴(kuò)展”(MTE)技術(shù)也成為 Armv9 的一個(gè)組成部分,可在軟件中查找內(nèi)存的空間和時(shí)間安全問題,將指向內(nèi)存的指針和標(biāo)簽建立聯(lián)系,并在使用指針時(shí)檢查這個(gè)標(biāo)簽是否正確。如果存取超過范圍,標(biāo)簽檢查就會(huì)失敗,從而可以在第一時(shí)間發(fā)現(xiàn)內(nèi)存安全漏洞并進(jìn)行封堵。 ?
Arm架構(gòu)升級(jí),v9與v8版本有何差異?
在過去多年里,Arm對(duì)ISA進(jìn)行了改進(jìn),也對(duì)體系結(jié)構(gòu)進(jìn)行了各種更新和擴(kuò)展。當(dāng)中一些可能很重要,有些可能也是一瞥而過。 ?
? 近日,作為Arm的Vision Day活動(dòng)的一部分,該公司正式發(fā)布了該公司的新一代Armv9架構(gòu)的首個(gè)細(xì)節(jié),為Arm未來十年內(nèi)成為下一個(gè)3000億芯片的計(jì)算平臺(tái)奠定了基礎(chǔ)。 ?
? 讀者可能會(huì)問的一個(gè)大問題是,Armv9與Armv8究竟有何不同,能讓架構(gòu)獲得如此大的提升。確實(shí),從純粹的ISA角度來看,v9可能不像v8相比v7那樣實(shí)現(xiàn)根本性的跳躍,后者引入了AArch64,一個(gè)完全不同的執(zhí)行模式和指令集,該指令集與AArch32相比具有更大的微體系結(jié)構(gòu)分支,例如擴(kuò)展寄存器,64位虛擬地址空間和更多改進(jìn)。
? Armv9繼續(xù)使用AArch64作為基準(zhǔn)指令集,但是在其功能上增加了一些非常重要的擴(kuò)展,以保證architecture numbering的增加,并且允許Arm不僅可以獲得對(duì)AArch64進(jìn)行某種軟件重新基準(zhǔn)化v9的新功能,還能保持我們多年來在v8上獲得的擴(kuò)展。 ? Arm認(rèn)為新架構(gòu)Armv9有三個(gè)主要支柱,即安全性、AI以及改進(jìn)的矢量和DSP功能。對(duì)于v9,安全性是一個(gè)非常重要的主題,我們將深入探討新擴(kuò)展和功能的新細(xì)節(jié),但是首先談到的DSP和AI功能應(yīng)該很簡(jiǎn)單。 ?
? ? 新的Armv9兼容CPU所承諾的最大的新功能可能是開發(fā)人員和用戶可以立即看到的——SVE2作為NEON的后繼產(chǎn)品。 ? 可伸縮矢量擴(kuò)展(SVE)的于2016年首次亮相,并首次在富士通的A64FX CPU內(nèi)核中實(shí)現(xiàn),該芯片已為日本排名第一的超級(jí)計(jì)算機(jī)Fukagu提供支持。SVE的問題在于,新的可變矢量長(zhǎng)度SIMD指令集的第一次迭代的范圍相當(dāng)有限,并且更多地針對(duì)HPC工作負(fù)載,缺少了許多仍由NEON涵蓋的更通用的指令。 ?
SVE2于2019年4月發(fā)布,旨在通過用所需指令補(bǔ)充新的可擴(kuò)展SIMD指令集來解決此問題,以服務(wù)于類似DSP等目前仍在使用NEON的工作負(fù)載。 ? 除了增加的各種現(xiàn)代SIMD功能外,SVE和SVE2的優(yōu)勢(shì)還在于其可變的向量大小,范圍覆蓋了128b到2048b,讓其無論在什么硬件運(yùn)行,都允許向量的可變粒度為128b。如果純粹從向量處理和編程的角度來看,這意味著軟件開發(fā)人員將只需要編譯一次其代碼,并且如果將來某個(gè)CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個(gè)寬度。同樣,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的保守設(shè)計(jì)上運(yùn)行,這對(duì)于Arm設(shè)計(jì)從物聯(lián)網(wǎng)、移動(dòng)到數(shù)據(jù)中心的CPU而言至關(guān)重要。在保留Arm體系結(jié)構(gòu)的32b編碼空間的同時(shí),它還可以完成所有這些工作。然而類似X86這樣的架構(gòu)則需要根據(jù)矢量尺寸增加新的指令和擴(kuò)展。 ?
? 機(jī)器學(xué)習(xí)也被視為Armv9的重要組成部分,因?yàn)锳rm認(rèn)為在未來幾年中,越來越多的ML工作負(fù)載將變得司空見慣,當(dāng)中包括了對(duì)性能或電源效率有至關(guān)重要要求的場(chǎng)景中。那就讓在專用加速器上運(yùn)行ML工作負(fù)載變成長(zhǎng)久的需要,與此同時(shí),我們還會(huì)繼續(xù)在CPU上運(yùn)行較小范圍的ML工作負(fù)載。 ? 矩陣乘法指令(Matrix multiplication instructions )是此處的關(guān)鍵,它將代表生態(tài)系統(tǒng)中將更大范圍采用v9 CPU作為基本功能所邁出的重要一步。 ?
通常,我認(rèn)為SVE2可能是保證升級(jí)到v9的最重要因素,因?yàn)樗歉_定的ISA功能,可以在日常使用中與v8 CPU區(qū)別開來,并且可以保證軟件生態(tài)系統(tǒng)能夠正常運(yùn)行,這與現(xiàn)有的v8堆棧有所不同。對(duì)于服務(wù)器領(lǐng)域的Arm來說,這實(shí)際上已經(jīng)成為一個(gè)相當(dāng)大的問題,因?yàn)檐浖鷳B(tài)系統(tǒng)仍在基于v8.0的軟件包基礎(chǔ)上,不幸的是,該軟件包缺少了最重要的v8.1大型系統(tǒng)擴(kuò)展。 ? 使整個(gè)軟件生態(tài)系統(tǒng)向前發(fā)展,并假設(shè)新的v9硬件具有新的體系結(jié)構(gòu)擴(kuò)展功能,這將有助于推動(dòng)事情發(fā)展,并可能解決某些當(dāng)前情況。
? 但是,v9不僅涉及SVE2和新指令,它還非常注重安全性,在安全性方面我們將看到一些更根本的變化。 ?
介紹機(jī)密的計(jì)算架構(gòu)
? 在過去的幾年中,安全性和硬件安全性漏洞已成為芯片行業(yè)的頭等大事,Spectre,Meltdown等漏洞的出現(xiàn)及其所有同級(jí)邊信道攻擊都表明,重新思考如何保證安全成為了一個(gè)基本需求。Arm希望用來解決這一總體問題的方法是通過引入Arm機(jī)密計(jì)算體系結(jié)構(gòu)(Arm Confidential Compute Architecture:CAA)來重新設(shè)計(jì)安全應(yīng)用程序的工作方式。 ?
? 在繼續(xù)之前,我想提箱一下,今天的披露僅僅是對(duì)新CCA運(yùn)作方式的高層次解釋,Arm說,有關(guān)新安全機(jī)制的確切工作原理的更多細(xì)節(jié)將在今年夏天的晚些時(shí)候公布。 ?
? CCA的目標(biāo)是從當(dāng)前的軟件堆棧情況中獲得更大的收益,在當(dāng)前的軟件堆棧情況下,在設(shè)備上運(yùn)行的應(yīng)用程序必須固有地信任它們所運(yùn)行的操作系統(tǒng)和虛擬機(jī)管理程序。傳統(tǒng)的安全模型是基于以下事實(shí)建立的:更高特權(quán)的軟件層被允許查看較低層的執(zhí)行,然而當(dāng)操作系統(tǒng)或系統(tǒng)管理程序被以任何方式損害時(shí),這就可能成為了一個(gè)問題。
? CCA引入了動(dòng)態(tài)創(chuàng)建““realms”的新概念,可以將其視為對(duì)OS或虛擬機(jī)管理程序完全不透明的安全容器化執(zhí)行環(huán)境。系統(tǒng)管理程序?qū)⑷匀淮嬖冢珒H負(fù)責(zé)調(diào)度和資源分配。而“realm”將由稱為“ealm manager”的新實(shí)體管理,其被認(rèn)為是一段新的代碼,大致大小約為hypervisor的1/10。 ? realm內(nèi)的應(yīng)用程序?qū)⒛軌颉白C明”領(lǐng)域管理器以確定其是否可信任,這對(duì)于傳統(tǒng)的虛擬機(jī)管理程序而言是不可能的。 ?
? Arm并沒有深入探討究竟是什么造成了realm與操作系統(tǒng)和虛擬機(jī)管理程序的非安全世界之間的這種隔離,但聽起來確實(shí)像硬件支持的地址空間,但它們無法相互交互。 ? ?
? 使用realms的優(yōu)勢(shì)在于,它極大地減少了設(shè)備上運(yùn)行的給定應(yīng)用程序的信任鏈,并且OS對(duì)安全性問題變得越來越透明。與當(dāng)今需要企業(yè)或企業(yè)使用帶有授權(quán)軟件堆棧的專用設(shè)備的情況相反,需要監(jiān)督控制的關(guān)鍵任務(wù)應(yīng)用程序?qū)⒛軌蛟谌魏卧O(shè)備上運(yùn)行。 ?
?
? MTE(memory tagging extensions)并不是v9的新功能,而是隨v8.5一起引入的,MTE或內(nèi)存標(biāo)記擴(kuò)展旨在幫助解決世界軟件中兩個(gè)最持久的安全問題。緩沖區(qū)溢出(Buffers overflows)和無用后使用(use-after-free)是持續(xù)的軟件設(shè)計(jì)問題,在過去的50年中,這些問題一直是軟件設(shè)計(jì)的一部分,并且可能需要花費(fèi)數(shù)年的時(shí)間才能對(duì)其進(jìn)行識(shí)別或解決。MTE旨在通過在分配時(shí)標(biāo)記指針并在使用時(shí)進(jìn)行檢查來幫助識(shí)別此類問題。 ?
未來的Arm CPU路線圖
這與v9沒有直接關(guān)系,但是與即將到來的v9設(shè)計(jì)的技術(shù)路線圖緊密相關(guān),Arm還談到了有關(guān)他們?cè)谖磥?年中對(duì)v9設(shè)計(jì)的預(yù)期性能的一些觀點(diǎn)。 ?
? Arm談到了移動(dòng)市場(chǎng)在今年如何將帶有X1的設(shè)備性能提升了2.4倍(此處我們僅指ISO流程設(shè)計(jì)的IPC),該性能是幾年前推出的Cortex-A73的兩倍。
? 有趣的是,Arm還談到了Neoverse V1設(shè)計(jì)及其如何達(dá)到A72類似設(shè)計(jì)性能的2.4倍,并透露他們期待著他今年晚些時(shí)候發(fā)布的首批V1設(shè)備。 ? 對(duì)于代號(hào)為“ Matterhorn”和“ Makalu”的下一代移動(dòng)IP內(nèi)核,該公司公開了這兩代產(chǎn)品的合計(jì)預(yù)期IPC增益為30%,其中不包括SoC設(shè)計(jì)人員可以獲得的頻率或任何其他其他性能增益。這實(shí)際上代表著這兩種新設(shè)計(jì)的世代增加了14%,并且如幻燈片中的性能曲線所示,這表明相對(duì)于自A76以來Arm在過去幾年所管理的工作而言,改進(jìn)的步伐正在放緩。不過,該公司指出,進(jìn)步速度仍然遠(yuǎn)遠(yuǎn)超過行業(yè)平均水平。但潭門也坦言,這被一些行業(yè)參與者拖累了。 ?
? Arm還提供了一張很有意思的幻燈片,該幻燈片旨在關(guān)注系統(tǒng)側(cè)對(duì)性能的影響,而不僅僅是CPU IP性能。從這里提供的一些數(shù)據(jù)可以看到,例如每5ns的內(nèi)存延遲中有1%的性能,這是我們現(xiàn)在已經(jīng)廣泛討論了幾代的數(shù)字,但是Arm在這里還指出,排除了是否通過改善內(nèi)存路徑,增加緩存或優(yōu)化頻率功能來改善實(shí)現(xiàn)的其他各個(gè)方面,他們可以使用整整一代的CPU性能提升,我認(rèn)為這是對(duì)SoC供應(yīng)商當(dāng)前保守方法的一種評(píng)價(jià),這些方法沒有充分利用X1內(nèi)核的預(yù)期性能余量,并且隨后也未達(dá)到新內(nèi)核的預(yù)期性能預(yù)測(cè)。 ?
? Arm繼續(xù)將CPU視為未來最通用的計(jì)算模塊。盡管專用的加速器或GPU將會(huì)占有一席之地,但它們很難解決一些重要問題,例如可編程性,保護(hù)性,普遍性(本質(zhì)上是在任何設(shè)備上運(yùn)行它們的能力)以及經(jīng)過驗(yàn)證的正常工作的能力。當(dāng)前,計(jì)算生態(tài)系統(tǒng)在運(yùn)行方式上極為分散,不僅設(shè)備類型不同,而且設(shè)備供應(yīng)商和操作系統(tǒng)也不同。 ?
SVE2和Matrix乘法可以極大地簡(jiǎn)化軟件生態(tài)系統(tǒng),并允許計(jì)算工作負(fù)載以更統(tǒng)一的方法向前邁進(jìn),該方法將來將可以在任何設(shè)備上運(yùn)行。 ?
? 最后,Arm還分享了有關(guān)Mali GPU未來的新信息,并透露該公司正在開發(fā)VRS等新技術(shù),尤其是Ray Tracing。這一點(diǎn)令人非常令人驚訝,也表明AMD和Nvidia引入RT推動(dòng)的臺(tái)式機(jī)和控制臺(tái)生態(tài)系統(tǒng)也有望將移動(dòng)GPU生態(tài)系統(tǒng)推向RT。 ?
Armv9設(shè)計(jì)即將在2022年初面世
今天的公告以一種非常高級(jí)的形式出現(xiàn),我們希望Arm在接下來的幾個(gè)月中,在公司通常的年度技術(shù)披露中,更多地談?wù)揂rmv9的各種細(xì)節(jié)和新功能,例如CCA。 ? 總的來說,Armv9似乎是更基本的ISA轉(zhuǎn)變(可以看作SVE2)與軟件生態(tài)系統(tǒng)的總體重新基準(zhǔn)的結(jié)合,以匯總v8擴(kuò)展的最后十年,并為下一個(gè)十年奠定基礎(chǔ)Arm體系結(jié)構(gòu)。 ? Arm于去年下半年已經(jīng)談?wù)撨^Neoverse V1和N2,我確實(shí)希望N2至少最終是基于v9而設(shè)計(jì)發(fā)布的。Arm進(jìn)一步透露,更多基于Armv9的 CPU設(shè)計(jì)(可能是移動(dòng)端Cortex-A78和X1的后續(xù)產(chǎn)品)將于今年推出,而新的CPU可能已經(jīng)被通常的SoC供應(yīng)商所采用,并且有望成為在2022年初在商用設(shè)備中出現(xiàn)。 ?
審核編輯:黃飛
?
評(píng)論
查看更多