0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用CPU性能基準測試研究綜述

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-08-12 15:21 ? 次閱讀

信息基礎(chǔ)設(shè)施自主可控逐漸受到各國的重視,研發(fā)推廣X86 架構(gòu)之外的通用CPU,例如 ARM,RISC-V,Alpha,MIPS等指令集架構(gòu),已成為推動信息產(chǎn)業(yè)變革發(fā)展的主要路徑之一。

近年來,采用 X86,ARM 等不同指令集架構(gòu),常用于服務(wù)器和桌面計算的異構(gòu)通用CPU加速迭代升級,不同架構(gòu)CPU在功耗、適用場景等方面各有優(yōu)勢。但主流CPU性能測試工具與方法主要圍繞 X86 架構(gòu)芯片設(shè)計,如何對異構(gòu)通用 CPU 的質(zhì)量水平進行科學(xué)評價,成為引導(dǎo)技術(shù)突破、支撐重大信息化工程建設(shè)和促進行業(yè)發(fā)展的關(guān)鍵。

本文從測試目標、測試方法的角度綜述了 CPU 基準測試的發(fā)展現(xiàn)狀和趨勢,并對測試工具的演進和最新成果進行對比分析,旨在為研究者提供一個覆蓋 SPEC、TPC 等多類性能基準測試工具和多線程、跨平臺等各類場景,以及包含速度和速率性能指標分類、基于預(yù)置模型的測試結(jié)果修正等創(chuàng)新方法的說明,增加相關(guān)人員對通用 CPU 性能基準測試研究的理解。

b5ff5cf4-389e-11ee-9e74-dac502259ad0.png

一、常用的性能基準測試

1、SPEC基準測試

SPEC 性能基準測試于 1988 年由標準性能評估機構(gòu)SPEC 提出,目前已發(fā)展成為包含 CPU 性能、服務(wù)器能效、文件系統(tǒng)性能、高性能計算、Web 應(yīng)用性能等在內(nèi)的基準測試簇。其中 SPEC CPU系列基準是公認的、具有事實性影響力的CPU性能基準測試標準,通過測試程序在被測系統(tǒng)和基準系統(tǒng)中執(zhí)行時間的比值來考察系統(tǒng)CPU運算性能。

b62ece1c-389e-11ee-9e74-dac502259ad0.png

多年來,SPEC CPU性能基準測試與CPU的發(fā)展相互促進,基準測試程序不斷演進升級,CPU技術(shù)和產(chǎn)業(yè)應(yīng)用也加速創(chuàng)新發(fā)展。

SPEC CPU 92通過調(diào)整測試基準來應(yīng)對行業(yè)需求,迅速取代MIPS度量,成為產(chǎn)業(yè)界公認的事實標準,也驅(qū)動各界在提升整型運算和浮點型運算的同時,積極尋求新的CPU技術(shù)突破方向.隨著技術(shù)的創(chuàng)新迭代,CPU時鐘頻率加速攀升,高速緩存容量持續(xù)增大、性能不斷提高,也使得SPEC CPU 92的性能測試受到較大的影響。

為進一步提升測試準確性,業(yè)界推出了SPEC CPU 95,在應(yīng)對新的容量、性能測試需求時,提供了更全面的場景來豐富CPU性能測試能力,引導(dǎo)技術(shù)創(chuàng)新由局限于關(guān)注裸性能向注重實際場景應(yīng)用效果轉(zhuǎn)變。SPEC CPU 2000延續(xù)了SPEC CPU 95由兩套基準測試程序分別測試CPU整型運算性能和浮點運算性能模式。同時,為更好地應(yīng)對不斷普及的多核處理器計算系統(tǒng)測試需求,保證測試結(jié)果的科學(xué)性和合理性。

為了滿足更多場景的測試要求,SPEC再次對測試基準進行完善,推出了SPEC CPU 2006. SPEC CPU 2006新增的測試套件涵蓋到CPU、存儲系統(tǒng)、編譯器等。

經(jīng)過10年的沉淀,在SPEC CPU 2006的基礎(chǔ)上推出的SPEC CPU 2017,進一步豐富應(yīng)用場景,具體包含43個基準,分為兩類四個套件.其中,SPEC speedInteger和SPEC speed Floating Point套件用于比較計算機完成單個任務(wù)的時間,SPEC rate Integer和SPEC rateFloating Point套件則可以測量每單位時間內(nèi)的吞吐量或工作量。這也是第一次對速率(rate)和速度(speed)進行區(qū)分,以有效滿足復(fù)雜場景下對性能基準測試的穩(wěn)定性提出更高要求,進而指導(dǎo)CPU發(fā)展。

2、TPC基準測試

不同于SPEC從最初關(guān)注裸性能不斷拓展到系統(tǒng)性能,TPC性能基準測試在設(shè)計之初就將系統(tǒng)級應(yīng)用的綜合性能測評作為關(guān)注的重點。

用于度量系統(tǒng)對該類事務(wù)處理性能的主要測試基準包括TP1(Transaction Process 1)和DebitCredit。該類測試基準由于缺少對測試執(zhí)行過程和綜合測評結(jié)果的有效監(jiān)督,易出現(xiàn)測試過程不規(guī)范,甚至給出誤導(dǎo)性測試結(jié)果的情況。20世紀80年代末,第一個TPC基準TPC-A發(fā)布,對事務(wù)處理時限、測試系統(tǒng)終端數(shù)量等提出明確要求,澄清了當時混亂的市場,為推動CPU的系統(tǒng)級性能測試提供了重要依據(jù)。

b64d8cf8-389e-11ee-9e74-dac502259ad0.png

經(jīng)過持續(xù)迭代升級,TPC已發(fā)展成為能夠滿足多種應(yīng)用場景性能測試需求的基準測試簇,根據(jù)測試場景和測試事務(wù)的不同,可將 TPC性能基準測試分為三類:

聯(lián)機在線事務(wù)處理系統(tǒng)(OLTP)測試,包括TPC-C,TPCE;決策支持和大數(shù)據(jù)(DS)測試,包括 TPC-H,TPC-DS;服務(wù)器虛擬化(VMS)測試,包括TPC-VMS. 其中,TPC-C性能基準測試通過模擬較復(fù)雜且具有代表意義的OLTP應(yīng)用環(huán)境,來衡量聯(lián)機事務(wù)處理系統(tǒng)性能與可伸縮性。TPC-E 則在 TPC-C 的基礎(chǔ)上,對傳統(tǒng)的 C/S 架構(gòu)模擬環(huán)境進行了完善,從而實現(xiàn)對當時日益盛行的B/S架構(gòu)系統(tǒng)的高效評價,為引導(dǎo)產(chǎn)業(yè)提升大規(guī)模并發(fā)處理能力提供了重要依據(jù)。

TPC-H提供了一套決策支持系統(tǒng)的性能基準測試依據(jù),強調(diào)服務(wù)器在數(shù)據(jù)挖掘、分析處理方面的能力。TPC-DS 則補充了單用戶響應(yīng)時間、多用戶吞吐量等測試,對測試基準的數(shù)據(jù)模型、業(yè)務(wù)模型和執(zhí)行模式進行了完善。TPC-VMS的目標是模擬服務(wù)器虛擬化環(huán)境,并實現(xiàn)對 TPC-C,TPC-E,TPC-H,TPC-DS的綜合測試,從而推動CPU圍繞應(yīng)用日益廣泛的云計算模式不斷提升性能。

二、其他性能基準測試

在 CPU 性能基準測試的不同發(fā)展時期,學(xué)術(shù)界和產(chǎn)業(yè)界也提出了一系列有關(guān)的性能基準測試方法,針對跨平臺、內(nèi)存共享、多線程等多種場景進行測試。

Geekbench 是近年來受關(guān)注較多的一種跨平臺CPU 性能基準測試,其主要方式是通過構(gòu)建多維評分系統(tǒng),將單核、多核性能與模擬真實場景的工作負載分隔開。該性能基準測試適用于 Windows、Linux、macOS等多種操作系統(tǒng)下的測試。

Kozhirbayev 等人在利用Geekbench對單核和多核下的整形計算性能、浮點計算性能和存儲性能的基準測試中,獲得了很好的對比參考效果。Polvinen等人在實驗過程中,采用Geek?bench快速、準確地度量了處理器在向量點乘、矩陣 LU分解等場景中的性能.

此外,Splash,PARSEC Benchmark,LINPACK Bench-mark,MiBench,NAS Parallel Benchmark,CPU-Z 等也常用于計算實驗或?qū)嶋H應(yīng)用中的性能基準測試,來展示和對比CPU的各項性能。

三、性能基準測試的對比分析

為直觀地展示本文所述通用測試基準的測試重點,各類性能基準測試及相關(guān)工具的支持語言、編譯程序、適配系統(tǒng)、支持的CPU架構(gòu)及測試側(cè)重點信息。

表1中各類工具支持語言、編譯程序、適配系統(tǒng)、支持的 CPU 架構(gòu)均具有一定的差異性。特別是基于不同的測試目標,各類工具的重點測試內(nèi)容各異,不僅涉及運算能力、內(nèi)存性能、內(nèi)存帶寬等重要指標,而且與聯(lián)機業(yè)務(wù)處理、數(shù)據(jù)挖掘、并行計算等各類綜合應(yīng)用場景相關(guān)。

隨著CPU性能測試維度的增加,CPU裸性能以及單一場景下的基準測試,難以全面反映 CPU 的綜合性能,因此,多種基準測試工具的配合測試,已成為通用CPU性能基準測試行業(yè)共識。

b670d0fa-389e-11ee-9e74-dac502259ad0.png

在穩(wěn)定性方面,選取常用的性能基準測試工具——SPEC CPU和UnixBench,通過對實際應(yīng)用情況的分析和梳理,為通用CPU性能基準的深入研究提供參考。

測試工具 SPEC CPU 的重要參數(shù)包含緩存缺失率(cache-misses)、分支指令預(yù)測錯誤率(branch-misses)和地址塊表緩存缺失率(dTLB-load-misses)等,相關(guān)指標越大,表明 CPU 的測試強度越高。SPEC CPU 測試工具的三個版本分別發(fā)布于 2000年、2006年和 2017年。從2000年至2017年的17年間,商業(yè)通用CPU的性能至少增長了 10 倍 . SPEC CPU2000 /2006/2017 三個版本演進過程中,工具開發(fā)人員希望通過加大數(shù)據(jù)集等手段,提高對通用 CPU 的測試壓力,獲取更準確的性能評測結(jié)果。

本文首先對當前國際主流的CPU基準測試現(xiàn)狀進行了綜述,并對各類測試基準和工具的功能、算法、應(yīng)用場景等方面的迭代升級和最新成果進行了分析;然后對當前通用CPU性能指標和基準測試需求進行了梳理,并分析了通用CPU性能基準測試所面臨的挑戰(zhàn)。

目前,CPU性能基準測試工具和算法較早期已取得了較大的進步,滿足的測試場景不斷豐富,測試精度也有了明顯提升,但在適用性、性能優(yōu)化等方面依然有較大的提升空間。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7492

    瀏覽量

    163842
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    1019

    瀏覽量

    54897
  • 多核處理器
    +關(guān)注

    關(guān)注

    0

    文章

    109

    瀏覽量

    19915
  • MIPS處理器
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    8284
  • VMs
    VMs
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    5227

原文標題:通用CPU性能基準測試研究綜述(2023)

文章出處:【微信號:架構(gòu)師技術(shù)聯(lián)盟,微信公眾號:架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    通用CPU性能基準測試研究現(xiàn)狀

    經(jīng)過持續(xù)迭代升級,TPC已發(fā)展成為能夠滿足多種應(yīng)用場景性能測試需求的基準測試簇,根據(jù)測試場景和測試
    發(fā)表于 02-20 10:22 ?705次閱讀
    <b class='flag-5'>通用</b><b class='flag-5'>CPU</b><b class='flag-5'>性能</b><b class='flag-5'>基準</b><b class='flag-5'>測試</b>的<b class='flag-5'>研究</b>現(xiàn)狀

    AMD 8450 基準軟件性能測試

    AMD 8450  基準軟件性能測試測試平臺System HardwareProcessorAMD 
    發(fā)表于 01-22 23:03

    風機性能測試系統(tǒng)的設(shè)計與研究

    風機性能測試系統(tǒng)的設(shè)計與研究 風機性能測試系統(tǒng)的設(shè)計與研究風機
    發(fā)表于 09-06 08:35

    風機性能測試的軟件設(shè)計,風機性能測試系統(tǒng)的設(shè)計與研究.doc 精選資料分享

    風機性能測試系統(tǒng)的設(shè)計與研究風機性能測試系統(tǒng)的設(shè)計與研究風機
    發(fā)表于 09-13 08:35

    微處理器CPU性能測試基準Dhrystone介紹

    給大家介紹的是微處理器CPU性能測試基準Dhrystone。  在嵌入式系統(tǒng)行業(yè)用于評價CPU性能
    發(fā)表于 12-15 08:44

    嵌入式基準測試你想知道的都在這

    的真實應(yīng)用代碼。3 針對一個基準的編譯器優(yōu)化,并不能總能改善真實應(yīng)用的性能指標。4 嵌入式基準并不只關(guān)心執(zhí)行速度。5 CPU指令數(shù)不能用作性能
    發(fā)表于 12-21 06:37

    CPU性能基準介紹及其在國內(nèi)市場的應(yīng)用

    性能表示。 本白皮書詳細介紹了CPU性能基準測試的最新發(fā)展,以及它是如何從80年代早期的基準
    發(fā)表于 08-28 07:02

    服務(wù)器性能基準測試

    服務(wù)器性能基準測試  1、SPECweb96測試   SPEC96是由Standard Performance Evaluation Corp提供的、專供檢測服務(wù)器Web特性的
    發(fā)表于 01-27 11:41 ?1218次閱讀

    CPU綜述

    CPU綜述 前言   CPU是Central Processing Unit--中央處理器的縮寫,它是計算機中最重要的一個部分,由運算器和控 制器組成,如果把計算機比作一個人,那
    發(fā)表于 01-12 11:07 ?727次閱讀

    sysbench性能測試及安裝

    sysbench 是一個模塊化的、跨平臺、多線程基準測試工具,主要用于評估測試各種不同系統(tǒng)參數(shù)下的數(shù)據(jù)庫負載情況。 它主要包括以下幾種方式的測試: 1、
    發(fā)表于 11-06 10:46 ?0次下載

    cpu性能測試工具(ORTHOS)中文版免費下載

    cpu性能測試工具(ORTHOS)中文版免費下載
    發(fā)表于 12-12 16:51 ?0次下載
    <b class='flag-5'>cpu</b><b class='flag-5'>性能</b><b class='flag-5'>測試</b>工具(ORTHOS)中文版免費下載

    如何使用DPDK進行網(wǎng)絡(luò)性能基準測試

    描述英特爾如何使用DPDK第3層轉(zhuǎn)發(fā)(l3fwd)示例應(yīng)用程序工作負載執(zhí)行高吞吐量網(wǎng)絡(luò)性能基準測試
    的頭像 發(fā)表于 10-31 06:57 ?5981次閱讀

    MySQL基準測試和sysbench工具

    一、基準測試簡介 1、什么是基準測試 數(shù)據(jù)庫的基準測試是對數(shù)據(jù)庫的
    的頭像 發(fā)表于 01-06 16:01 ?1686次閱讀
    MySQL<b class='flag-5'>基準</b><b class='flag-5'>測試</b>和sysbench工具

    通用的動態(tài)社區(qū)發(fā)現(xiàn)研究框架綜述

    具有交叉更替性和時序性,因此對動態(tài)社區(qū)發(fā)現(xiàn)的硏究現(xiàn)狀進行分析和綜述。首先,基于復(fù)雜網(wǎng)絡(luò)的研究背景,提岀了通用的動態(tài)社區(qū)發(fā)現(xiàn)研究框架;接著,形式化表示動態(tài)社區(qū)發(fā)現(xiàn)的相關(guān)定義,并從網(wǎng)絡(luò)層面
    發(fā)表于 06-04 15:15 ?5次下載

    【飛凌RZ/G2L開發(fā)板試用體驗】性能測試CPU性能

    本文來源電子發(fā)燒友社區(qū),作者:李先生, 帖子地址: https://bbs.elecfans.com/jishu_2299901_1_1.html 性能測試CPU性能 前言 Core
    的頭像 發(fā)表于 10-24 17:37 ?795次閱讀
    【飛凌RZ/G2L開發(fā)板試用體驗】<b class='flag-5'>性能</b><b class='flag-5'>測試</b>之<b class='flag-5'>CPU</b><b class='flag-5'>性能</b>