什么是算力
算力即計(jì)算能力(Computing Power),狹義上指對(duì)數(shù)字問(wèn)題的運(yùn)算能力,而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過(guò)程的能力都可抽象為算力。比如人類大腦、手機(jī)以及各類服務(wù)器對(duì)接收到的信息處理實(shí)際都屬于算力的應(yīng)用。
隨著信息技術(shù)的不斷發(fā)展,[《中國(guó)算力白皮書(2022)》]中將算力明確定義為數(shù)據(jù)中心的服務(wù)器通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。當(dāng)前行業(yè)中討論的算力,狹義上可理解為CPU、GPU等芯片的計(jì)算能力,廣義上可理解為芯片技術(shù)的計(jì)算能力,內(nèi)存、硬盤等存儲(chǔ)技術(shù)的存力,以及操作系統(tǒng)、數(shù)據(jù)庫(kù)等軟件技術(shù)的算法的三者集合。
算力的分類
隨著數(shù)字經(jīng)濟(jì)時(shí)代的到來(lái),算力發(fā)展迎來(lái)高潮,廣泛應(yīng)用于各個(gè)領(lǐng)域,其中包括但不限于日常消費(fèi)領(lǐng)域、人工智能領(lǐng)域、半導(dǎo)體技術(shù)領(lǐng)域。不同應(yīng)用場(chǎng)景對(duì)算力的需求各異,需要不同類型的算力支撐。目前算力主要分為通用算力、智能算力和超算算力。未來(lái)還會(huì)出現(xiàn)比傳統(tǒng)計(jì)算更高效、更快速的新一代算力,例如量子算力等。
通用算力
通用算力主要以CPU為代表,即CPU芯片執(zhí)行計(jì)算任務(wù)時(shí)所表現(xiàn)出的計(jì)算能力。不同架構(gòu)的CPU計(jì)算能力不同,因?yàn)镃PU算力受核心數(shù)量、主頻、緩存大小等多種因素影響。目前可以根據(jù)DMIPS指標(biāo)來(lái)衡量CPU性能。該指標(biāo)表示CPU每秒能執(zhí)行多少百萬(wàn)條Dhrystone指令。
分類 | 特點(diǎn) | 引領(lǐng)者 | 優(yōu)劣勢(shì) |
---|---|---|---|
x86 | 復(fù)雜指令集、單核能力強(qiáng) | Intel、AMD、海光、兆芯 | 軟件生態(tài)好,占有率高;指令集實(shí)現(xiàn)復(fù)雜,功耗高 |
ARM | 精簡(jiǎn)指令集、追求多核、低功耗 | 安謀、高通、Amazon | 授權(quán)廠商多,能效比高;軟件生態(tài)劣于x86 |
MIPS | 精簡(jiǎn)指令集、低功耗 | 龍芯 | 軟件生態(tài)弱、市占率正在下降 |
Power | 單核能力強(qiáng)、高可靠性、高成本 | IBM | IBM掌控技術(shù),應(yīng)用于金融領(lǐng)域 |
RISC-V | 精簡(jiǎn)指令集 | RISC-V基金會(huì)、阿里巴巴、兆易創(chuàng)新 | 完全開(kāi)放開(kāi)源、模塊化、可擴(kuò)展 |
Alpha | 精簡(jiǎn)指令集、速度快 | 申威 | 軟件生態(tài)弱,市占率小 |
通用算力計(jì)算量小,但能夠提供高效、靈活、通用的計(jì)算能力。因?yàn)镃PU的架構(gòu)屬于少量的高性能核心結(jié)構(gòu),即核心數(shù)量少,但核心頻率高,更加擅長(zhǎng)處理復(fù)雜的邏輯判斷和串行計(jì)算的單線程任務(wù),如操作系統(tǒng)的管理、應(yīng)用程序的執(zhí)行以及各類后臺(tái)服務(wù)等。而這樣的設(shè)計(jì)在面對(duì)大規(guī)模并行計(jì)算任務(wù)時(shí)則顯得力不從心。
智能算力
智能算力主要以GPU、FPGA、ASIC芯片為代表。每種類型的芯片具有各自的特點(diǎn)和優(yōu)勢(shì)。
- GPU(Graphics Processing Unit,圖形處理器):GPU在設(shè)計(jì)之初用于圖形渲染,即同時(shí)處理大量簡(jiǎn)單的計(jì)算任務(wù)。不同于CPU的少量高性能核心架構(gòu),GPU擁有大量的核心數(shù)但較小的控制單元和緩存,能夠完成高度并行的計(jì)算任務(wù)。GPU主要應(yīng)用在機(jī)器學(xué)習(xí)的訓(xùn)練階段,因?yàn)闄C(jī)器學(xué)習(xí)的操作并不依賴于復(fù)雜指令,而是大規(guī)模的并行計(jì)算。
- FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程邏輯門陣列):FPGA是在PAL、GAL 等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。FPGA是半定制集成電路,具有可重配置的邏輯結(jié)構(gòu)。其內(nèi)部的電路不是硬刻蝕的,而是可以通過(guò)HDL(硬件描述語(yǔ)言)編程來(lái)重新配置。這種可編程靈活性使其可以完成人工神經(jīng)網(wǎng)絡(luò)的特定計(jì)算模式,輕松升級(jí)硬件以適應(yīng)AI場(chǎng)景中新的應(yīng)用需求。除此以外,F(xiàn)PGA的每個(gè)組件功能在重新配置階段都可以定制,因此在運(yùn)行時(shí)無(wú)需指令,可顯著降低功耗并提高整體性能。
- ASIC(Application-Specific Integrated Circuit,應(yīng)用特定集成電路):ASIC是專為滿足特定需求而設(shè)計(jì)的全定制集成電路芯片。ASIC的優(yōu)勢(shì)在于其能夠針對(duì)特定任務(wù)進(jìn)行深度優(yōu)化,從而實(shí)現(xiàn)更高的性能和更低的功耗。一旦量產(chǎn),其單位成本會(huì)顯著降低,尤其適合于大規(guī)模生產(chǎn)和應(yīng)用。然而,ASIC設(shè)計(jì)周期長(zhǎng)、成本高,一旦設(shè)計(jì)完成,很難進(jìn)行修改或升級(jí)以適應(yīng)新的應(yīng)用需求。因此,在選擇使用ASIC還是FPGA時(shí),需要根據(jù)具體的應(yīng)用場(chǎng)景和需求進(jìn)行權(quán)衡。對(duì)于需要高性能、低功耗且應(yīng)用場(chǎng)景相對(duì)固定的系統(tǒng),ASIC可能是更好的選擇;而對(duì)于需要快速適應(yīng)新技術(shù)和市場(chǎng)需求變化的應(yīng)用場(chǎng)景,F(xiàn)PGA則更具優(yōu)勢(shì)。
GPU、FPGA、ASIC能力對(duì)比表格:
td {white-space:nowrap;border:1px solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;} | | GPU | FPGA | ASIC |
| -------------- | -------------------------- | -------------------------------- | ----------------------------- |
| 并行計(jì)算能力 | 強(qiáng)大 | 靈活配置 | 高效但定制 |
| 靈活性 | 較低(專用于圖形和計(jì)算) | 高(可編程) | 低(定制后固定) |
| 功耗 | 高 | 適中 | 低 |
| 成本 | 中等 | 低 | 高(設(shè)計(jì)和制造) |
| 整體性能 | 高 | 中等(因可重置而消耗芯片資源) | 非常高(高度定制針對(duì)性強(qiáng) ) |
| 應(yīng)用領(lǐng)域 | 圖形處理、機(jī)器學(xué)習(xí)等 | 實(shí)時(shí)計(jì)算、原型設(shè)計(jì)等 | 特定應(yīng)用場(chǎng)景(如數(shù)據(jù)中心) |
超算算力
超算即超級(jí)計(jì)算,又稱高性能計(jì)算 (HPC),利用并行工作的多臺(tái)計(jì)算機(jī)系統(tǒng)的集中式計(jì)算資源,通過(guò)專用的操作系統(tǒng)來(lái)處理極端復(fù)雜的或數(shù)據(jù)密集型的問(wèn)題。超算算力則是由這些超級(jí)計(jì)算機(jī)等高性能計(jì)算集群所提供的算力,主要應(yīng)用于尖端科研、國(guó)防軍工等大科學(xué)、大工程、大系統(tǒng)中,是衡量一個(gè)國(guó)家或地區(qū)科技核心競(jìng)爭(zhēng)力和綜合國(guó)力的重要標(biāo)志。目前,美國(guó)的Frontier以 1.206 EFlop/s的HPL性能位居全球超級(jí)計(jì)算機(jī)Top500榜第一,達(dá)到了E級(jí)計(jì)算。
中國(guó)信息通信研究院結(jié)合業(yè)內(nèi)實(shí)踐和設(shè)想,提出了超算參考架構(gòu),由計(jì)算系統(tǒng)、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、管理系統(tǒng)、安全系統(tǒng)五部分構(gòu)成。
- 計(jì)算系統(tǒng):由CPU和異構(gòu)加速卡計(jì)算節(jié)點(diǎn)共同組成。
- 存儲(chǔ)系統(tǒng):采用分布式存儲(chǔ),可提供PB級(jí)別以上的容量來(lái)進(jìn)行數(shù)據(jù)和算據(jù)存儲(chǔ)。
- 網(wǎng)絡(luò)系統(tǒng):分為存儲(chǔ)網(wǎng)絡(luò)、業(yè)務(wù)網(wǎng)絡(luò)以及監(jiān)控網(wǎng)絡(luò)等多個(gè)網(wǎng)絡(luò)平面,實(shí)現(xiàn)超算系統(tǒng)間各個(gè)硬件設(shè)備以及子系統(tǒng)間的通信互聯(lián)。
- 管理系統(tǒng):包括資源與業(yè)務(wù)監(jiān)控、告警監(jiān)控、可視化等功能。
- 安全系統(tǒng):由防火墻、負(fù)載均衡、堡壘機(jī)、抗DDoS、日志審計(jì)、漏洞掃描、DNS服務(wù)器等設(shè)備組成。
新一代算力
自人工智能加速應(yīng)用后,算力需求激增,人們很難保證在未來(lái)經(jīng)典計(jì)算能一直滿足指數(shù)級(jí)的算力增長(zhǎng)并應(yīng)用于重大計(jì)算問(wèn)題。于是在全球科技競(jìng)爭(zhēng)加劇、數(shù)字經(jīng)濟(jì)快速發(fā)展以及新興技術(shù)的推動(dòng)下出現(xiàn)了以量子計(jì)算為代表的新一代算力。
量子計(jì)算運(yùn)用量子態(tài)的疊加性,使得量子比特?fù)碛懈鼜?qiáng)的信息編碼能力,并可實(shí)現(xiàn)多個(gè)量子比特的量子糾纏,性能上限遠(yuǎn)超經(jīng)典計(jì)算。量子計(jì)算機(jī)使用亞原子粒子的物理學(xué)領(lǐng)域來(lái)執(zhí)行復(fù)雜的并行計(jì)算,從而取代了當(dāng)今計(jì)算機(jī)系統(tǒng)中更簡(jiǎn)單的晶體管。傳統(tǒng)計(jì)算機(jī)中的字符,要么打開(kāi),要么關(guān)閉,要么是 1,要么是 0。而在量子比特計(jì)算中,計(jì)算單元是可以打開(kāi),關(guān)閉或之間的任何值。量子比特的“疊加態(tài)”能力,為計(jì)算方程增加了強(qiáng)大的功能,使量子計(jì)算機(jī)在某種數(shù)學(xué)運(yùn)算中更勝一籌。
目前阿里巴巴、Google、Honeywell、IBM 、IonQ 和 Xanadu 等少數(shù)幾家公司都運(yùn)營(yíng)著量子計(jì)算機(jī),但仍存在退相干、噪聲與誤差、可擴(kuò)展性等問(wèn)題,處于硬件開(kāi)發(fā)的早期階段。根據(jù)專家預(yù)測(cè),想要進(jìn)入量子計(jì)算機(jī)真正有用的高保真時(shí)代,還得需要幾十年。
數(shù)據(jù)中心算力組成
數(shù)據(jù)中心的計(jì)算能力主要依賴于服務(wù)器。目前CPU類型的服務(wù)器幾乎部署在所有的數(shù)據(jù)中心中,而高性能算力GPU等更多的使用在AI應(yīng)用場(chǎng)景中,小規(guī)模部署于部分?jǐn)?shù)據(jù)中心中。然而隨著機(jī)器學(xué)習(xí)、人工智能、無(wú)人駕駛、工業(yè)仿真等新興技術(shù)領(lǐng)域的崛起,傳統(tǒng)數(shù)據(jù)中心遭遇通用CPU在處理海量計(jì)算、 海量數(shù)據(jù)時(shí)越來(lái)越多的性能瓶頸。 在數(shù)據(jù)中心加快步伐部署48核以及64核心等更高核心CPU來(lái)應(yīng)對(duì)激增的算力需求的同時(shí),為了應(yīng)對(duì)計(jì)算多元化的需求,越來(lái)越多的場(chǎng)景開(kāi)始引入加速芯片,如前文提到的GPU、 FPGA、 ASIC 等。這些加速硬件承擔(dān)了大部分的新算力需求。
然而實(shí)際上的數(shù)據(jù)中心是一個(gè)匯集大量服務(wù)器、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備的基礎(chǔ)設(shè)施,數(shù)據(jù)中心算力是服務(wù)器、存儲(chǔ)及網(wǎng)絡(luò)設(shè)備合力作用的結(jié)果,計(jì)算、存儲(chǔ)及網(wǎng)絡(luò)傳輸能力相互協(xié)同才能促使數(shù)據(jù)中心算力水平的提升。單獨(dú)討論服務(wù)器的算力水平并不能反映數(shù)據(jù)中心的實(shí)際算力水平。
總之,數(shù)據(jù)中心是人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈等應(yīng)用服務(wù)的重要載體。數(shù)據(jù)中心算力水平的提升將會(huì)在很大程度上推動(dòng)全社會(huì)總體算力供給,滿足各行業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中的算力需求。
數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備
以實(shí)際情況來(lái)說(shuō),數(shù)據(jù)中心的算力水平不僅取決于服務(wù)器的算力,同時(shí)還會(huì)在很大程度上受到網(wǎng)絡(luò)設(shè)備的影響,如果網(wǎng)絡(luò)設(shè)備算力水平無(wú)法滿足要求,很有可能引發(fā)“木桶效應(yīng)”,拉低整個(gè)數(shù)據(jù)中心的實(shí)際算力水平。
星融元[CX-N系列] 交換機(jī)可以幫助用戶構(gòu)建超低時(shí)延、 靈活可靠、按需橫向擴(kuò)展的數(shù)據(jù)中心網(wǎng)絡(luò)。
- 超低時(shí)延:所搭載的交換芯片具備業(yè)界領(lǐng)先的超低時(shí)延能力,最低時(shí)延達(dá)到400ns左右。
- 高可靠性:通過(guò)MC-LAG、EVPN Multihoming、ECMP構(gòu)建無(wú)環(huán)路、高可靠、可獨(dú)立升級(jí)的數(shù)據(jù)中心網(wǎng)絡(luò)。
- RoCEv2能力:全系列標(biāo)配RoCEv2能力,提供PFC、ECN等一系列面向生產(chǎn)環(huán)境的增強(qiáng)網(wǎng)絡(luò)特性。
- RESTful API:支持REST架構(gòu)的第三方平臺(tái)和應(yīng)用都能自動(dòng)化地管理、調(diào)度星融元數(shù)據(jù)中心網(wǎng)絡(luò)。
不論是在[AI智算] 還是[HPC高性能計(jì)算] 場(chǎng)景下,CX-N交換機(jī)都達(dá)到了媲美InfiniBand專用交換機(jī)的性能,以下是場(chǎng)景測(cè)試數(shù)據(jù)表:
表一:AIGC場(chǎng)景性能測(cè)試結(jié)果
帶寬 | 時(shí)延 | 備注 | |
---|---|---|---|
E2E網(wǎng)卡直連 | 392.95Gb/s | 1.95us | |
E2E跨交換機(jī) | 392.96Gb/s | 2.51us | 交換機(jī)時(shí)延560ns |
NCCL網(wǎng)卡直連 | 371.27GB/s | / | |
NCCL跨交換機(jī) | 368.99GB/s | / | CX-N交換機(jī)端口利用率95%。 |
表二:HPC應(yīng)用測(cè)試(對(duì)比IB交換機(jī))
HPC應(yīng)用測(cè)試 | CX-N交換機(jī) | MSB7000 | ||||||
---|---|---|---|---|---|---|---|---|
HPC應(yīng)用 | Test1[sec] | Test2[sec] | Test1[sec] | avg[sec] | Test1[sec] | Test2[sec] | Test3[sec] | avg[sec] |
WRF | 1140.35 | 1134.64 | 1128.35 | 1134.44 | 1106.72 | 1099.36 | 1112.68 | 1106.25 |
LAMMPS | 341.25 | 347.19 | 342.61 | 343.69 | 330.47 | 335.58 | 332.46 | 332.83 |
參考文獻(xiàn):
https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgqvv2nAYowLyGBA.pdf
https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgk4DrjQYo76ziRQ.pdf
審核編輯 黃宇
-
交換機(jī)
+關(guān)注
關(guān)注
21文章
2640瀏覽量
99638 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4778瀏覽量
72123 -
AI算力
+關(guān)注
關(guān)注
0文章
72瀏覽量
8675 -
算力
+關(guān)注
關(guān)注
1文章
977瀏覽量
14809
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論