0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎么計(jì)算ARM核CPU的算力?

汽車電子技術(shù) ? 來源:宅學(xué)部落 ? 作者: wit ? 2023-02-17 09:51 ? 次閱讀

在同構(gòu)處理器時(shí)代,我們一般使用主頻來衡量一個(gè)處理器的性能。而到了異構(gòu)處理器時(shí)代,隨著人工智能、大數(shù)據(jù)、多媒體編解碼對(duì)海量數(shù)據(jù)的計(jì)算需求,我們一般使用浮點(diǎn)運(yùn)算能力來衡量一個(gè)處理器的性能。

每秒浮點(diǎn)運(yùn)算次數(shù)(Floating Point Operations Per Second,F(xiàn)LOPS),又稱為每秒峰值速度。浮點(diǎn)運(yùn)算在科研領(lǐng)域大量使用,現(xiàn)在的CPU除了支持整數(shù)運(yùn)算,一般還支持浮點(diǎn)運(yùn)算,有專門的浮點(diǎn)運(yùn)算單元,F(xiàn)LOPS測(cè)量的就是處理器的浮點(diǎn)運(yùn)算能力。FLOPS的計(jì)算公式如下:

浮點(diǎn)運(yùn)算能力 = 處理器核數(shù) * 每周期浮點(diǎn)運(yùn)算次數(shù) * 處理器主頻

除了FLOPS,還有MFLOPS、GFLOPS、TFLOPS、PFLOPS、EFLOPS等單位,它們之間的換算關(guān)系如下。

MFLOPS:megaFLOPS,每秒10^6次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一百萬次浮點(diǎn)運(yùn)算
GFLOPS:gigaFLOPS,每秒10^9次浮點(diǎn)運(yùn)算,相當(dāng)于每秒十億次浮點(diǎn)運(yùn)算
TFLOPSteraFLOPS,每秒10^12次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一萬億次浮點(diǎn)運(yùn)算
PFLOPS:petaFLOPS,每秒10^15次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一千萬億次浮點(diǎn)運(yùn)算
EFLOPS:exaFLOPS,每秒10^18次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一百億億次浮點(diǎn)運(yùn)算

1946年,世界上第一臺(tái)通用計(jì)算機(jī)誕生于美國賓夕法尼亞大學(xué),運(yùn)算速度為300FLOPS。早期樹莓派使用的博通CM2708 ARM11處理器,主頻為1GHz,運(yùn)算速度為316.56MFLOPS。2011年發(fā)射的“好奇號(hào)”火星探測(cè)器,使用的是IBM的PowerPC架構(gòu)的處理器,主頻為200MHz,運(yùn)算速度相當(dāng)于Intel 80386處理器的水平,差不多在0.4GFLOPS上下。

Intel的Core-i5-4210U處理器運(yùn)算速度為36GFLOPS,Microsoft Xbox 360運(yùn)算速度為240GFLOS,ARM Mali-T760 GPU主頻600MHz,運(yùn)算速度為326GFLOPS,NVIDIA GeForce 840M運(yùn)算速度為700GFLOPS,相當(dāng)于0.7TFLOPS。

“吃雞游戲 ”絕地求生的標(biāo)配顯卡NVIDIA Geforce GTX 1060運(yùn)算速度為3.85TFLOPS,GTX 1080 Ti運(yùn)算速度為11.5TFLOPS。最新的NVIDIA Tesla V100顯卡,運(yùn)算速度為125TFLOPS,是世界上第一個(gè)突破100萬億次的深度學(xué)習(xí)GPU。

2008年,中國第一臺(tái)闖入世界前10的超級(jí)計(jì)算機(jī):中國“曙光”5000A超級(jí)計(jì)算機(jī),計(jì)算速度為230TFLOPS,相當(dāng)于0.23PFLOPS。我國首臺(tái)千萬億次的超級(jí)計(jì)算機(jī)“天河一號(hào)”運(yùn)算速度為2.566PFLOPS,美國橡樹嶺國家實(shí)驗(yàn)室的“泰坦”超級(jí)計(jì)算機(jī)算力為17.59PFLOPS,“天河二號(hào)”的運(yùn)算速度為33.86PFLOPS,無錫“神威·太湖之光”的運(yùn)算速度為93.01PFLOPS,霸占超級(jí)計(jì)算機(jī)榜首多年。2019年11月18日發(fā)布的排在第一的是IBM設(shè)計(jì)的Summit超級(jí)計(jì)算機(jī),運(yùn)算速度為154.5PFLOPS,即0.1545EFLOPS。2020年11月最新發(fā)布的超級(jí)計(jì)算機(jī)排行榜發(fā)布,Summit被日本的Fugaku富岳反超,富岳超級(jí)計(jì)算機(jī)是首次采用全ARM架構(gòu)的超級(jí)計(jì)算機(jī),其中包含了7,299,072個(gè)core,算力為442PFLOPS,相當(dāng)于0.442EFLOPS,算力差不多是summit的三倍。

2013年比特幣的全網(wǎng)算力為1EFLOPS,2018年5月,比特幣的全網(wǎng)算力為35EFLOPS。2020年5月,比特幣的全網(wǎng)算力峰值高達(dá)70EFLOPS以上,隨著比特幣價(jià)格的上下波動(dòng),比特幣的全網(wǎng)挖礦算力也隨之上下起伏。

Google公司在2017年發(fā)布的TPU v2處理器運(yùn)算能力達(dá)到了180 TFLOPS,2019年發(fā)布的TPU v3版本,算力是420 TFLOPS。華為2018年發(fā)布的昇騰910 AI處理器,CPU算力達(dá)到640 TOPS@INT8,浮點(diǎn)運(yùn)算能力為320 TFLOPS@FP16。這些都是服務(wù)器端的CPU算力,不用考慮功耗,所以算力都很高。

為了對(duì)比一下算力差距,將單位統(tǒng)一到 GFLOPS 后的數(shù)據(jù)如下:

圖片

圖片

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19547

    瀏覽量

    231869
  • 人工智能
    +關(guān)注

    關(guān)注

    1800

    文章

    48094

    瀏覽量

    242228
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8929

    瀏覽量

    138318
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ”的分層定義-初級(jí)

    ”(Computility,也被稱為計(jì)算能力或計(jì)算力)通常而言是指計(jì)算機(jī)、服務(wù)器、GPU或其他硬件設(shè)備執(zhí)行
    的頭像 發(fā)表于 07-27 14:02 ?3711次閱讀
    “<b class='flag-5'>算</b><b class='flag-5'>力</b>”的分層定義-初級(jí)<b class='flag-5'>算</b><b class='flag-5'>力</b>

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    社會(huì)資源和資本力量關(guān)注芯片的發(fā)展,希望我們的國家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能芯片。 內(nèi)容簡介: 本書介紹了超級(jí)計(jì)算機(jī)
    發(fā)表于 09-02 10:09

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺(tái)提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講芯片CPU
    發(fā)表于 10-15 22:08

    進(jìn)迭時(shí)空 K1 系列 8 64 位 RISC - V AI CPU 芯片介紹

    、云電腦、智能機(jī)器人、工業(yè)控制、邊緣計(jì)算機(jī)等領(lǐng)域。二、具體特性(一)卓越的 CPU 性能核心配置 :具有 8 RISC - V AI CPU,能夠提供 50KD MIPS
    發(fā)表于 01-06 17:37

    rx580,rx580顯卡,rx588,rx588顯卡 精選資料分享

    已下是rx580顯卡9-11 Mh 沒有開啟計(jì)算模式,挖幾分種重啟自動(dòng)開啟,計(jì)算模式只支持WIN1022-28 Mh 原版BIOS,開啟時(shí)序,并設(shè)置超頻29-32 Mh 正常
    發(fā)表于 07-23 06:59

    數(shù)據(jù)、算法和其實(shí)現(xiàn)載體是什么

    背景介紹數(shù)據(jù)、算法和是人工智能技術(shù)的三大要素。其中,體現(xiàn)著人工智能(AI)技術(shù)具體實(shí)現(xiàn)的能力,實(shí)現(xiàn)載體主要有CPU、GPU、FPGA
    發(fā)表于 07-26 06:47

    BananaPi BPI-M2S 是新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D,NPU for AI 支持 5.0 TOPS,板載4G內(nèi)存和16gb eMMC存儲(chǔ)

    ? BananaPi BPI-M2S 是香蕉派開源社區(qū)2021新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D四ARM Cortex-A73和雙
    發(fā)表于 09-30 12:41

    BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS,板載4G內(nèi)存和16gb eMMC存儲(chǔ)

    ? BananaPi BPI-M2S 是香蕉派開源社區(qū)2021新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D四ARM Cortex-A73和雙
    發(fā)表于 09-30 14:37

    Xilinx Zynq7035指標(biāo)

    目的本文介紹廣州星嵌DSP C6657+Xilinx Zynq7035平臺(tái)下Xilinx Zynq7035指標(biāo)?;靖拍頕LOPs/FLOPSFLOPs,F(xiàn)loating Point
    發(fā)表于 12-15 21:19

    何為

    由基于CPU芯片的服務(wù)器所提供的,主要用于基礎(chǔ)通用計(jì)算。日常提到的云計(jì)算、邊緣計(jì)算等都屬于基
    的頭像 發(fā)表于 05-13 14:36 ?8436次閱讀

    什么是如何衡量?

    簡而言之就是設(shè)備的計(jì)算能力(Computing Power)。小至手機(jī)、PC,大到超級(jí)計(jì)算機(jī),支撐各種軟硬件的正常應(yīng)用,為生活、生產(chǎn)提供計(jì)算能力。以PC而言,搭載的CPU、顯卡、內(nèi)存配
    的頭像 發(fā)表于 11-02 10:23 ?1.8w次閱讀

    GPU是顯卡嗎 cpu和gpu哪個(gè)強(qiáng)

    很大的區(qū)別,因此它們的計(jì)算能力也不同。 首先,我們來看一下CPU(中央處理器)的CPU是一種通用處理器,它被設(shè)計(jì)用于處理各種不同類型的
    的頭像 發(fā)表于 01-10 15:45 ?5931次閱讀

    中心的如何衡量?

    (ComputationalPower)是指智中心通過其內(nèi)部的計(jì)算設(shè)備(如CPU、GPU、AI芯片等)對(duì)數(shù)據(jù)進(jìn)行處理和計(jì)算的能力。它體現(xiàn)了智
    的頭像 發(fā)表于 01-16 14:03 ?943次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    云 GPU 加速計(jì)算:突破傳統(tǒng)瓶頸的利刃

    ,猶如一把利刃,成功突破了傳統(tǒng)的瓶頸。 傳統(tǒng)的 CPU 計(jì)算在面對(duì)大規(guī)模并行計(jì)算任務(wù)時(shí),往往顯得力不從心。
    的頭像 發(fā)表于 02-17 10:36 ?116次閱讀