在同構(gòu)處理器時(shí)代,我們一般使用主頻來衡量一個(gè)處理器的性能。而到了異構(gòu)處理器時(shí)代,隨著人工智能、大數(shù)據(jù)、多媒體編解碼對(duì)海量數(shù)據(jù)的計(jì)算需求,我們一般使用浮點(diǎn)運(yùn)算能力來衡量一個(gè)處理器的性能。
每秒浮點(diǎn)運(yùn)算次數(shù)(Floating Point Operations Per Second,F(xiàn)LOPS),又稱為每秒峰值速度。浮點(diǎn)運(yùn)算在科研領(lǐng)域大量使用,現(xiàn)在的CPU除了支持整數(shù)運(yùn)算,一般還支持浮點(diǎn)運(yùn)算,有專門的浮點(diǎn)運(yùn)算單元,F(xiàn)LOPS測(cè)量的就是處理器的浮點(diǎn)運(yùn)算能力。FLOPS的計(jì)算公式如下:
浮點(diǎn)運(yùn)算能力 = 處理器核數(shù) * 每周期浮點(diǎn)運(yùn)算次數(shù) * 處理器主頻
除了FLOPS,還有MFLOPS、GFLOPS、TFLOPS、PFLOPS、EFLOPS等單位,它們之間的換算關(guān)系如下。
MFLOPS:megaFLOPS,每秒10^6次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一百萬次浮點(diǎn)運(yùn)算
GFLOPS:gigaFLOPS,每秒10^9次浮點(diǎn)運(yùn)算,相當(dāng)于每秒十億次浮點(diǎn)運(yùn)算
TFLOPS:teraFLOPS,每秒10^12次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一萬億次浮點(diǎn)運(yùn)算
PFLOPS:petaFLOPS,每秒10^15次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一千萬億次浮點(diǎn)運(yùn)算
EFLOPS:exaFLOPS,每秒10^18次浮點(diǎn)運(yùn)算,相當(dāng)于每秒一百億億次浮點(diǎn)運(yùn)算
1946年,世界上第一臺(tái)通用計(jì)算機(jī)誕生于美國賓夕法尼亞大學(xué),運(yùn)算速度為300FLOPS。早期樹莓派使用的博通CM2708 ARM11處理器,主頻為1GHz,運(yùn)算速度為316.56MFLOPS。2011年發(fā)射的“好奇號(hào)”火星探測(cè)器,使用的是IBM的PowerPC架構(gòu)的處理器,主頻為200MHz,運(yùn)算速度相當(dāng)于Intel 80386處理器的水平,差不多在0.4GFLOPS上下。
Intel的Core-i5-4210U處理器運(yùn)算速度為36GFLOPS,Microsoft Xbox 360運(yùn)算速度為240GFLOS,ARM Mali-T760 GPU主頻600MHz,運(yùn)算速度為326GFLOPS,NVIDIA GeForce 840M運(yùn)算速度為700GFLOPS,相當(dāng)于0.7TFLOPS。
“吃雞游戲 ”絕地求生的標(biāo)配顯卡NVIDIA Geforce GTX 1060運(yùn)算速度為3.85TFLOPS,GTX 1080 Ti運(yùn)算速度為11.5TFLOPS。最新的NVIDIA Tesla V100顯卡,運(yùn)算速度為125TFLOPS,是世界上第一個(gè)突破100萬億次的深度學(xué)習(xí)GPU。
2008年,中國第一臺(tái)闖入世界前10的超級(jí)計(jì)算機(jī):中國“曙光”5000A超級(jí)計(jì)算機(jī),計(jì)算速度為230TFLOPS,相當(dāng)于0.23PFLOPS。我國首臺(tái)千萬億次的超級(jí)計(jì)算機(jī)“天河一號(hào)”運(yùn)算速度為2.566PFLOPS,美國橡樹嶺國家實(shí)驗(yàn)室的“泰坦”超級(jí)計(jì)算機(jī)算力為17.59PFLOPS,“天河二號(hào)”的運(yùn)算速度為33.86PFLOPS,無錫“神威·太湖之光”的運(yùn)算速度為93.01PFLOPS,霸占超級(jí)計(jì)算機(jī)榜首多年。2019年11月18日發(fā)布的排在第一的是IBM設(shè)計(jì)的Summit超級(jí)計(jì)算機(jī),運(yùn)算速度為154.5PFLOPS,即0.1545EFLOPS。2020年11月最新發(fā)布的超級(jí)計(jì)算機(jī)排行榜發(fā)布,Summit被日本的Fugaku富岳反超,富岳超級(jí)計(jì)算機(jī)是首次采用全ARM架構(gòu)的超級(jí)計(jì)算機(jī),其中包含了7,299,072個(gè)core,算力為442PFLOPS,相當(dāng)于0.442EFLOPS,算力差不多是summit的三倍。
2013年比特幣的全網(wǎng)算力為1EFLOPS,2018年5月,比特幣的全網(wǎng)算力為35EFLOPS。2020年5月,比特幣的全網(wǎng)算力峰值高達(dá)70EFLOPS以上,隨著比特幣價(jià)格的上下波動(dòng),比特幣的全網(wǎng)挖礦算力也隨之上下起伏。
Google公司在2017年發(fā)布的TPU v2處理器運(yùn)算能力達(dá)到了180 TFLOPS,2019年發(fā)布的TPU v3版本,算力是420 TFLOPS。華為2018年發(fā)布的昇騰910 AI處理器,CPU算力達(dá)到640 TOPS@INT8,浮點(diǎn)運(yùn)算能力為320 TFLOPS@FP16。這些都是服務(wù)器端的CPU算力,不用考慮功耗,所以算力都很高。
為了對(duì)比一下算力差距,將單位統(tǒng)一到 GFLOPS 后的數(shù)據(jù)如下:
-
處理器
+關(guān)注
關(guān)注
68文章
19547瀏覽量
231869 -
人工智能
+關(guān)注
關(guān)注
1800文章
48094瀏覽量
242228 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8929瀏覽量
138318
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
“算力”的分層定義-初級(jí)算力

名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽
進(jìn)迭時(shí)空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

rx580算力,rx580顯卡算力,rx588算力,rx588顯卡算力 精選資料分享
數(shù)據(jù)、算法和算力其實(shí)現(xiàn)載體是什么
BananaPi BPI-M2S 是新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲(chǔ)
BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲(chǔ)
Xilinx Zynq7035算力指標(biāo)
何為算力
什么是算力?算力如何衡量?
GPU是顯卡嗎 cpu和gpu哪個(gè)算力強(qiáng)
算智算中心的算力如何衡量?

評(píng)論