最近,英特爾發(fā)布了一組基準(zhǔn)測試,比較了英特爾至強(qiáng) 8462Y+ CPU 與 AMD EPYC? 9354 CPU 在多個工作負(fù)載中的性能。本出版物圍繞 所使用的方法提出了幾個問題。 與 AMD EPYC(霄龍)配置相比,為什么至強(qiáng)配置使用了較新版本的操作系統(tǒng)(?幾乎總是具有更好的性能)?為什么將高性能至強(qiáng)處理器 8462Y+ 與主流 AMD EPYC? 9354 處理器相對應(yīng)?AMD EPYC? 9374F 在許多工作負(fù)載上一直表現(xiàn)出色,本來是“可比”的處理器。最后,為什么使用非行業(yè)標(biāo)準(zhǔn)基準(zhǔn),因為只有數(shù)量有限的可核查行業(yè)基準(zhǔn),沒有透明度?如果沒有更多的透明度,就不清楚 AMD EPYC(霄龍)系統(tǒng)是否按照已發(fā)布的 AMD EPYC(霄龍)?調(diào)優(yōu)指南中的建議進(jìn)行了調(diào)校以獲得最佳性能。
行業(yè)合作伙伴針對基于聯(lián)盟的標(biāo)準(zhǔn)基準(zhǔn)發(fā)布的結(jié)果代表了展示來自各種供應(yīng)商的計算系統(tǒng)性能的一致方式。這些基準(zhǔn)要求嚴(yán)格遵守基準(zhǔn)測試工具包、審計方法和審查流程,以確保合規(guī)性以及系統(tǒng)類型和配置之間一致和公平的比較方式。
主流計算
以下是業(yè)界廣泛使用的標(biāo)準(zhǔn)、可驗證基準(zhǔn)的幾個示例,這些基準(zhǔn)用于評估主流用例的實際性能。重要的是要了解所有這些測試都是由我們的合作伙伴執(zhí)行的。結(jié)果不言自明:
SPECcpu? 2017 是衡量處理器性能的最流行的基準(zhǔn)測試。它由一套由行業(yè)和學(xué)術(shù)界委員會選擇的計算密集型微基準(zhǔn)組成。表 1 顯示了 AMD EPYC(霄龍)處理器在 32 核和堆棧頂部均具有無可爭議的性能領(lǐng)先地位。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
規(guī)格率?2017_int_基數(shù) | 676 與 827(快 1.22 倍) | 1010 與 1800(快 1.78 倍) |
規(guī)格率?2017_fp_基數(shù) | 782 與 964(快 1.23 倍) | 1020 與 1480(快 1.45 倍) |
表 1:SPECcpu? 2017 性能比較
SPECjbb? 2015 是一種流行的衡量標(biāo)準(zhǔn),可以對基于服務(wù)器端 Java 的應(yīng)用程序進(jìn)行公平的性能測量。SPECjbb? 2015 模擬了一家擁有 IT 基礎(chǔ)架構(gòu)的公司,該基礎(chǔ)架構(gòu)處理銷售點請求、在線購買和數(shù)據(jù)挖掘操作的組合。在過去的二十年中,Java在整個行業(yè)中的迅速采用使該基準(zhǔn)與所有受眾相關(guān),包括Java虛擬機(jī)(JVM)供應(yīng)商,硬件開發(fā)人員,Java應(yīng)用程序開發(fā)人員,研究人員和學(xué)術(shù)界成員。表 2 顯示了 AMD EPYC 在 32 個內(nèi)核和堆棧頂部無可爭議的性能領(lǐng)先地位的另一個示例。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
SPECjbb2015 MultiJVM max-jOPS | 279,312 與 359,294 (快 1.29 倍) | 505,379 與 828,952 (快 1.64 倍) |
表 2:SPECjbb? 2015 性能比較
RDBMS: 讓我們看一下關(guān)系數(shù)據(jù)庫基準(zhǔn)測試。SAP-SD 是一種流行的基準(zhǔn)測試,旨在幫助客戶為其 IT 解決方案找到合適的硬件配置。采用 2 核 AMD EPYC 96 處理器的 9654P 系統(tǒng)可提供 809,570 SAPS,而采用英特爾至強(qiáng)鉑金 2H 處理器的 8490P 系統(tǒng)可提供 428,730 SAPS,在系統(tǒng)級別性能提升 ~1.88 倍 [4]。TPC Benchmark? E (TPC-E) 是用于對交易處理系統(tǒng)進(jìn)行基準(zhǔn)測試的行業(yè)標(biāo)準(zhǔn)。由 96 核 AMD EPYC 9654 處理器提供支持的單插槽服務(wù)器的性能優(yōu)于由兩個 60 核英特爾至強(qiáng)鉑金 8490H 處理器提供支持的雙插槽服務(wù)器,這兩個處理器都運行Microsoft? SQL Server。
虛擬化:VMware? VMmark3? 是業(yè)界領(lǐng)先的企業(yè)虛擬化整合基準(zhǔn)測試,可衡量 VMware vSphere? 虛擬機(jī)管理程序在各種硬件供應(yīng)商平臺上的性能和可擴(kuò)展性。近年來,AMD 在這一領(lǐng)域占據(jù)主導(dǎo)地位,在對客戶最重要的配置中創(chuàng)造了世界紀(jì)錄的虛擬化性能:2 節(jié)點 4 總插槽 SAN、4 節(jié)點 8 總插槽 vSAN 和整體領(lǐng)先地位。當(dāng)前一代 96 核 AMD EPYC 9654 提供了 40.51 @ 43 個模塊,而堆棧頂部的 60 核英特爾至強(qiáng)鉑金 8490 在類似的 23 節(jié)點、38 個插槽配置中提供了 23.2 @ 4 個模塊,具有 ~1.73 倍的性能優(yōu)勢。這種性能領(lǐng)先地位不僅限于第四代AMD EPYC(霄龍)處理器:第三代AMD EPYC 4X處理器的性能也優(yōu)于英特爾至強(qiáng)鉑金3H[7773]。
? 2008 SPECpower_ssj:SPECpower_ssj2008基準(zhǔn)測試套件可測量系統(tǒng)的功耗和性能特征。雙處理器 AMD EPYC 9654 系統(tǒng)的能效為 30,602,而雙處理器英特爾至強(qiáng) 8490H 系統(tǒng)的能效為 16,902,在比較總體ssj_ops/瓦指標(biāo)時為 SPECpower_ssj2008,根據(jù) spec.org 年公布的結(jié)果 - 基于 AMD EPYC 的服務(wù)器的能效提高了 ~1.81 倍。
人工智能 (AI) 生態(tài)系統(tǒng)不斷發(fā)展。基準(zhǔn)測試和工作負(fù)載在不斷變化。加速器(如英特爾的 AMX)可以幫助工作負(fù)載的某些計算受限部分。相比之下,AMD 戰(zhàn)略側(cè)重于提供性能最高的通用內(nèi)核,可在最廣泛的工作負(fù)載中提供高性能。許多 AI 工作負(fù)載受內(nèi)存限制(例如許多大型語言模型或 LLM),因此要么無法從 AMX 中受益,要么由于阿姆達(dá)爾定律而只能看到有限的加速。
成為應(yīng)用程序密集部分的AI周期通常會卸載到加速器,例如AMD Instinct MI250或AMD Alveo V70。持續(xù)的市場演變將推動未來任何為我們的通用設(shè)備增加加速的決策。AMD 利用我們強(qiáng)大的 IP 和軟件產(chǎn)品組合,例如我們的 7040U CPU。推理通常只占整個工作流程的一小部分;即使是較大的推理加速通常也只能提供較小的整體加速。
具有代表性的 AI 基準(zhǔn)可全面衡量整個工作流程的性能。事務(wù)處理性能委員會的TPC Express Benchmark AI(TPCx-AI)旨在通過測量數(shù)據(jù)中心和云中具有代表性的端到端數(shù)據(jù)AI用例,成為行業(yè)標(biāo)準(zhǔn)。該基準(zhǔn)測試涵蓋了不同比例因子(數(shù)據(jù)集大?。┑?10 個真實用例:客戶細(xì)分、客戶保護(hù)轉(zhuǎn)錄、銷售預(yù)測、垃圾郵件檢測、價格預(yù)測、硬件故障、產(chǎn)品評級、旅行分類、面部識別和欺詐檢測。AMD 以在比例因子 3、10、30、100、300、1000 和 <> 中擁有領(lǐng)先的性能和性價比而感到自豪。
高性能計算
自 1 年推出第一代 AMD EPYC 處理器以來,高性能計算 (HPC) 一直是 AMD 的優(yōu)先事項。在這方面,AMD EPYC(霄龍)處理器繼續(xù)為企業(yè)和國家實驗室提供領(lǐng)先的性能。AMD EPYC(霄龍)處理器在 2017 核和堆棧頂級處理器上均提供領(lǐng)先的性能,優(yōu)于競爭對手。AMD 工程師通過正確調(diào)整所有 AMD 和競爭系統(tǒng)以獲得最佳性能,例如類似的硬件設(shè)置和 BIOS 設(shè)置,并在所有系統(tǒng)中使用相同的操作系統(tǒng)和選項,努力確保所有平臺都以最佳狀態(tài)呈現(xiàn)。圖 32 和圖 1 顯示了相對性能數(shù)字,作為每個測試應(yīng)用程序的基準(zhǔn)測試的綜合平均值。
圖 1:32 核性能比較
圖 2:堆棧頂部性能比較
結(jié)論
AMD 依賴于由我們的生態(tài)系統(tǒng)合作伙伴執(zhí)行、審核和發(fā)布的獨立測試以及我們自己的內(nèi)部測試。我們還執(zhí)行自己的內(nèi)部測試,投入時間和資源來表征系統(tǒng),了解細(xì)微差別,并調(diào)整系統(tǒng)(包括我們自己和競爭對手的系統(tǒng))以獲得最佳性能。在 AMD,我們的客戶對我們很重要,因此展示我們的處理器在相關(guān)工作負(fù)載下的表現(xiàn)對我們很重要。了解系統(tǒng)級性能至關(guān)重要的縱向擴(kuò)展工作負(fù)載的堆棧頂部與堆棧頂部性能,以及與虛擬機(jī)密度很重要的云部署類似的性能比較對我們的客戶來說意義重大。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19293瀏覽量
229958 -
amd
+關(guān)注
關(guān)注
25文章
5470瀏覽量
134209 -
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269209
發(fā)布評論請先 登錄
相關(guān)推薦
評論