0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM發(fā)布全新架構(gòu)CPU、GPU及AI內(nèi)核 性能全面提升

DPVg_AI_era ? 來源:yxw ? 2019-05-29 17:11 ? 次閱讀

近日,ARM發(fā)布了下一代架構(gòu)設(shè)計(jì)方案,三款重磅利器騰空出世:Cortex-A77 CPU、Mali-G77 GPU和ARM ML處理器,性能全面提升。ARM表示,新的旗艦級IP將定義2020年高端智能手機(jī)性能,提供新一代的人工智能體驗(yàn)。

ARM祭出了三把利器。

昨日,全球領(lǐng)先半導(dǎo)體知識產(chǎn)權(quán)(IP)提供商ARM重磅發(fā)布了下一代架構(gòu)設(shè)計(jì)方案,其中包括:

Cortex-A77 CPU;

Mali-G77 GPU;

ARM ML處理器。

ARM表示,新的旗艦級IP將定義2020年高端智能手機(jī)性能,提供新一代的人工智能體驗(yàn)。

而在此前,新智元也報(bào)道了ARM宣布暫停與華為的合作的相關(guān)消息,或許此次ARM發(fā)布的旗艦級IP將與華為無緣。

不過,華為目前已經(jīng)獲得了ARM8架構(gòu)的永久授權(quán)(ARM8是ARM公司的32/64位指令集,目前的處理器都是這一指令集的產(chǎn)物)。也有可能完全自主設(shè)計(jì)ARM處理器,并掌握核心技術(shù)和完整知識產(chǎn)權(quán),具備長期自主研發(fā)ARM處理器的能力。

(對Cortex和Mali不了解?沒關(guān)系,新智元在文末附了它倆的全家福!)

代號Deimos,新一代CPU性能大幅提升

去年的ARM發(fā)布的Cortex-A76其實(shí)是一個(gè)非常成功的核心架構(gòu),全新的架構(gòu)體系與7nm TSMC工藝的結(jié)合,帶來了巨大的性能和效率飛躍,麒麟980和驍龍855就是很好的例子。

但ARM真正的競爭對手主要來自蘋果的CPU設(shè)計(jì)團(tuán)隊(duì)。僅從CPU來說,目前,蘋果的A11、A12仍然有著較為明顯的性能、效率優(yōu)勢。

ARM發(fā)布的Cortex-A77代號為Deimos(戴莫斯,畏懼之神),與上一代A76可謂是一脈相承,很大程度上保持了上一代的特性。

從官方給出的參數(shù)來看,有如下幾個(gè)關(guān)鍵特性:

依舊采用Armv8.2架構(gòu),支持 AArch32 和 AArch64;

64KB L1指令和數(shù)據(jù)緩存;

256或512KB L2緩存;

以及高達(dá)4Mb L3緩存

ARM表示,Cortex-A77和Cortex-A76保持相同的3.GHz峰值頻率目標(biāo)。但預(yù)計(jì)廠商不會(huì)在新一代Soc達(dá)到這么高的頻率。

Cortex-A77將更多的計(jì)算能力用于設(shè)備安全的邊緣計(jì)算上。這些計(jì)算能力使用范圍包括AI攝像機(jī)、視覺場景檢測、3D掃描、生物特征用戶ID(人臉識別)、語音識別、游戲中的ML和AR中的ML等。

從性能角度來看,Cortex-A77相比于A76有了許多性能上改進(jìn):

單線程性能提升20%;

FP性能提升35%;

內(nèi)存寬帶提升15%。

更高的性能也意味著能更好地響應(yīng)支持AR的新應(yīng)用程序以及帶來的體驗(yàn)。通過Cortex-A77,手機(jī)游戲領(lǐng)域的增強(qiáng)現(xiàn)實(shí)技術(shù)在未來幾年有望實(shí)現(xiàn)大幅增長。并且Cortex-A77還將支持5G,愛立信在2018年11月的移動(dòng)報(bào)告中預(yù)測,到2024年,將有大約15億臺(tái)智能手機(jī)設(shè)備具備5G功能。

而眾所周知,對于計(jì)算密集型ML、AR和其他新出現(xiàn)的設(shè)備來說,5G是一個(gè)基本需求。它將帶來更快的速度、大帶寬(5到20 Gbps)、8K分辨率的流媒體和360度視頻。

ARM GPU采用全新架構(gòu)Valhall,性能大躍進(jìn)

除了Cortex-A77之外,ARM還重磅發(fā)布了新一代Mali-G77。

劃重點(diǎn):Mali-G77采用了全新架構(gòu),Valhall。而在G71-G76采用的架構(gòu)都是Bifrost。

Mali-G77在性能、密度和效率方面取得了一些重大改進(jìn)。雖然去年的Mali-G76引入了對執(zhí)行引擎計(jì)算架構(gòu)的一些重大更改,但G77的改進(jìn)更大,并且脫離了ARM相對不同尋常的計(jì)算核心設(shè)計(jì)。

據(jù)ARM官方宣稱,Mali-G77較前代產(chǎn)品相比:

效能提升30%、性能提升30%、機(jī)器學(xué)習(xí)性能提升60%;

每mm2性能較A76預(yù)計(jì)提升1.4倍;

在相同的工藝和相同的性能下,實(shí)現(xiàn)30%的同比能效改進(jìn);

并且比Mali-G72節(jié)省50%的功耗。

從官方給出的性能來看,ARM Mali-G77的性能已然接近目前蘋果A12的性能,同時(shí)也超過了高通Adreno 640的性能。

ARM ML NPU

隨著智能手機(jī)和計(jì)算機(jī)繼續(xù)利用AI來實(shí)現(xiàn)攝影中的場景識別或增強(qiáng)現(xiàn)實(shí)中的物體識別等功能。同時(shí),許多公司也構(gòu)建了專門的神經(jīng)處理單元來處理這些任務(wù),從而減輕了CPU和GPU的壓力。

而此次,ARM還發(fā)布了其最新的NPU,提供了高達(dá)兩倍的能效,并且是上一代內(nèi)存壓縮的三倍。與開源的ARM NN軟件框架相結(jié)合,ARM表示該芯片的八核版本可提供高達(dá)32 TOP/s的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9137

    瀏覽量

    368289
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1378

    瀏覽量

    40345
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10891

    瀏覽量

    212430
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4762

    瀏覽量

    129145

原文標(biāo)題:ARM發(fā)布全新架構(gòu)CPU、GPU及AI內(nèi)核,華為或?qū)o緣

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計(jì)算
    的頭像 發(fā)表于 12-24 10:55 ?226次閱讀

    芯原發(fā)布全新Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、
    的頭像 發(fā)表于 12-19 15:26 ?347次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關(guān)鍵技術(shù)有了全新認(rèn)識。 GPU
    發(fā)表于 11-24 17:12

    NPU技術(shù)如何提升AI性能

    設(shè)計(jì)的處理器,與傳統(tǒng)的CPUGPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時(shí)具有更高的效率和更低的能耗。NPU通過專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)中的大量并行計(jì)算任務(wù)。 1. 優(yōu)化硬件架構(gòu) NPU技術(shù)通過優(yōu)化硬件
    的頭像 發(fā)表于 11-15 09:11 ?577次閱讀

    《算力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔:從基準(zhǔn)測試到CPU架構(gòu)的深度探索

    。這一方法突顯了現(xiàn)代超算的核心優(yōu)勢——并行計(jì)算能力。舉一個(gè)具體實(shí)例來說,天河二號采用了異構(gòu)架構(gòu),集成了英特爾至強(qiáng)處理器和中國自主研發(fā)的申威眾核加速器。這種CPU與協(xié)處理器的結(jié)合不僅提升了整體計(jì)算
    發(fā)表于 10-19 01:21

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對全書內(nèi)容有一個(gè)整體了解
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計(jì)算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為A
    發(fā)表于 09-02 10:09

    ai服務(wù)器是什么架構(gòu)類型

    架構(gòu)AI服務(wù)器通常具有較高的通用性,可以運(yùn)行各種人工智能算法。但是,CPU架構(gòu)AI服務(wù)器在處理大規(guī)模并行計(jì)算時(shí),
    的頭像 發(fā)表于 07-02 09:51 ?1158次閱讀

    英偉達(dá)或?qū)⑼瞥鋈诤?b class='flag-5'>Arm與Blackwell內(nèi)核AI PC芯片

    近日,業(yè)內(nèi)傳出英偉達(dá)正在研發(fā)一款全新芯片的傳聞。據(jù)悉,這款芯片將結(jié)合下一代Arm Cortex CPU內(nèi)核與英偉達(dá)自家的Blackwell GPU
    的頭像 發(fā)表于 05-31 10:31 ?621次閱讀

    Arm發(fā)布針對旗艦智能手機(jī)的新一代CPUGPU IP

    全球領(lǐng)先的芯片設(shè)計(jì)公司Arm宣布了針對旗艦智能手機(jī)市場的全新CPUGPU IP設(shè)計(jì)方案——Cortex-X925 CPU和Immortal
    的頭像 發(fā)表于 05-31 09:44 ?623次閱讀

    ARM發(fā)布旗艦手機(jī)芯片:性能提升、AI性能增強(qiáng)、節(jié)能減耗

    ARM為Cortex-X系列CPU重新命名,以強(qiáng)調(diào)其性能的顯著提升。據(jù)稱,X925的單核性能較X4提升
    的頭像 發(fā)表于 05-30 11:26 ?737次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    ,推理能力提升 15 倍 GB200由兩個(gè)B200Blackwell GPU和一個(gè)基于Arm的Grace CPU組成,采用[臺(tái)積電]4納米工藝制程,共有2080億個(gè)[晶體管],其
    發(fā)表于 05-13 17:16

    天璣9300旗艦芯:全大核CPU架構(gòu),性能與能效的提升

    “全大核”CPU 架構(gòu)設(shè)計(jì)打破常規(guī),摒棄小核,采用超大核(Arm Cortex-X)與大核(Arm Cortex-A)的組合,以更高時(shí)鐘頻率提升
    的頭像 發(fā)表于 05-06 10:22 ?665次閱讀

    X-Silicon發(fā)布RISC-V新架構(gòu) 實(shí)現(xiàn)CPU/GPU一體化

    X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計(jì)將 CPUGPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計(jì)不同,前者有獨(dú)立的
    發(fā)表于 04-08 11:34 ?623次閱讀
    X-Silicon<b class='flag-5'>發(fā)布</b>RISC-V新<b class='flag-5'>架構(gòu)</b> 實(shí)現(xiàn)<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一體化

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級 GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計(jì)算,大幅提升AI、數(shù)據(jù)處理、高性能計(jì)算和云工作負(fù)載的
    發(fā)表于 03-19 10:05 ?381次閱讀
    NVIDIA <b class='flag-5'>發(fā)布</b><b class='flag-5'>全新</b>交換機(jī),<b class='flag-5'>全面</b>優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> 計(jì)算和 <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施