0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

是如何定義算力

科技綠洲 ? 來(lái)源:中科馭數(shù) ? 作者:中科馭數(shù) ? 2022-06-10 16:47 ? 次閱讀

01算力,是數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力

算力網(wǎng)絡(luò)基礎(chǔ)設(shè)施的普及是智能時(shí)代標(biāo)志之一。隨著5G、IoT、人工智能、工業(yè)互聯(lián)網(wǎng)等技術(shù)的逐步成熟,“新基建”成為我們國(guó)家下一步基礎(chǔ)設(shè)施建設(shè)的大方向。國(guó)家發(fā)改委在2020年4月對(duì)新基建的含義進(jìn)行了闡述,特別是對(duì)新基建范疇的“信息基礎(chǔ)設(shè)施”中明確提出了“算力基礎(chǔ)設(shè)施”的概念。同期,以中國(guó)聯(lián)通、中國(guó)移動(dòng)等電信運(yùn)營(yíng)商為代表的企業(yè),先后開(kāi)始進(jìn)行“算力網(wǎng)絡(luò)”的規(guī)劃與實(shí)施,一方面是響應(yīng)國(guó)家在算力基礎(chǔ)設(shè)施建設(shè)的戰(zhàn)略規(guī)劃,另一方面也是謀求運(yùn)營(yíng)商轉(zhuǎn)型發(fā)展的問(wèn)題。隨著“東數(shù)西算”在2022年2月正式啟動(dòng),進(jìn)一步加速了全國(guó)一體化算力網(wǎng)絡(luò)國(guó)家樞紐節(jié)點(diǎn)的建設(shè)步伐。在《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,算力指數(shù)每提高一個(gè)點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)千分之3.3和千分之1.8。算力已經(jīng)成為了數(shù)字經(jīng)濟(jì)時(shí)代核心生產(chǎn)力。

從算力網(wǎng)絡(luò)的系統(tǒng)架構(gòu)角度看,目前的算力網(wǎng)絡(luò)架構(gòu)大體可劃分成“三橫一縱”的架構(gòu),其中“三橫”代表了三個(gè)層次:服務(wù)提供層,網(wǎng)絡(luò)控制層,算力資源層;“一縱”代表了服務(wù)與資源編排,貫穿“三橫”。但是,目前的算力網(wǎng)絡(luò)的系統(tǒng)架構(gòu)規(guī)劃,大多側(cè)重如何運(yùn)營(yíng),如何打通服務(wù)提供方和服務(wù)消費(fèi)者,如何整合現(xiàn)有的網(wǎng)絡(luò)和云基礎(chǔ)設(shè)施,將“網(wǎng)云融合”改造升級(jí)為“算網(wǎng)一體”等方面的內(nèi)容。但是對(duì)于支撐算力網(wǎng)絡(luò)需要底層核心技術(shù)、芯片架構(gòu)等討論不多。作者認(rèn)為高效的算力資源層就是算力網(wǎng)絡(luò)這座大廈的根基。根基的牢靠程度將直接影響算力網(wǎng)絡(luò)愿景是否能實(shí)現(xiàn),特別是在當(dāng)前低能耗的要求下,算力網(wǎng)絡(luò)的建設(shè)有低碳的約束,間接制約了通過(guò)直接擴(kuò)大規(guī)模來(lái)?yè)Q取算力增長(zhǎng)的技術(shù)路線(xiàn)。軟件生態(tài)可以逐步完善,運(yùn)營(yíng)模式可以調(diào)整,各個(gè)抽象層次的接口標(biāo)準(zhǔn)可以逐步規(guī)范。然而,核心問(wèn)題是,現(xiàn)有的底層處理芯片,數(shù)據(jù)傳輸?shù)任锢韺拥漠a(chǎn)品和技術(shù)是否可以支撐“算力網(wǎng)絡(luò)”這個(gè)構(gòu)想?算力網(wǎng)絡(luò)的有效實(shí)施的最大挑戰(zhàn)除了資源整合、服務(wù)創(chuàng)新,可能還有待新核心技術(shù)的突破!(本文主要是從算力芯片視角,所涉及的內(nèi)容可能不能覆蓋算力網(wǎng)絡(luò)底層核心技術(shù)的全貌。)

02算力網(wǎng)絡(luò)的定義

中國(guó)移動(dòng)定義的算力網(wǎng)絡(luò)是“以算為中心、網(wǎng)為根基,網(wǎng)、云、數(shù)、智、安、邊、端、鏈等深度融合、提供一體化服務(wù)的新型信息基礎(chǔ)設(shè)施”。中國(guó)聯(lián)通的定義是“指在計(jì)算能力不斷泛在化發(fā)展的基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)手段將計(jì)算、 存儲(chǔ)等基礎(chǔ)資源在云-邊-端之間進(jìn)行有效調(diào)配的方式,以此提升業(yè)務(wù)服務(wù)質(zhì)量和用戶(hù)的服務(wù)體驗(yàn)”。前者定義中涉及到從“網(wǎng)”到“鏈”的多個(gè)技術(shù)的融合,后者的定義重點(diǎn)是將算力網(wǎng)絡(luò)作為基礎(chǔ)資源在云-邊-端的調(diào)配方式。實(shí)施算力網(wǎng)絡(luò)的共同目標(biāo)都是“提升業(yè)務(wù)服務(wù)質(zhì)量,優(yōu)化用戶(hù)體驗(yàn)”,較為具象化的愿景闡述是“使算力成為像水、電一樣,可“一點(diǎn)接入,即取即用”的社會(huì)級(jí)服務(wù)”。

o4YBAGC24DOAHECBAAAARmu_22A208.png以上的定義更多從運(yùn)營(yíng)商角度來(lái)審視算力網(wǎng)絡(luò),這里我們給出另外一種從技術(shù)角度的定義:算力網(wǎng)絡(luò)是與應(yīng)用需求密切匹配的網(wǎng)絡(luò)化計(jì)算基礎(chǔ)設(shè)施,使得算力可應(yīng)需集結(jié),并與網(wǎng)絡(luò)一樣泛在,最終實(shí)現(xiàn)“網(wǎng)絡(luò)即計(jì)算”(NaaC,Network as a Computer)。要實(shí)現(xiàn)這一目標(biāo),當(dāng)然需要算力計(jì)量、數(shù)據(jù)安全、操作平臺(tái)、應(yīng)用商店等等運(yùn)營(yíng)措施的配套完善和應(yīng)用生態(tài)的不斷豐富,但根基在于底層核心技術(shù)的突破——這也是本文關(guān)注的焦點(diǎn)。正所謂萬(wàn)丈高樓平地起,基礎(chǔ)是關(guān)鍵!好比在20年前功能機(jī)的時(shí)代,即便人們對(duì)移動(dòng)互聯(lián)網(wǎng)的需求足夠強(qiáng)烈,也不可能構(gòu)建出目前琳瑯滿(mǎn)目的應(yīng)用生態(tài)和服務(wù),因?yàn)榛A(chǔ)設(shè)施支撐能力不足;直到智能手機(jī)的出現(xiàn),寬帶互聯(lián)網(wǎng)和3G、4G移動(dòng)網(wǎng)絡(luò)的普及,才真正推動(dòng)了移動(dòng)互聯(lián)網(wǎng)的業(yè)態(tài)成為現(xiàn)實(shí)。智能手機(jī)、無(wú)線(xiàn)寬帶網(wǎng)絡(luò)、云計(jì)算這些創(chuàng)新產(chǎn)品和技術(shù)才是移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ),而隨之發(fā)展起來(lái)的應(yīng)用生態(tài),線(xiàn)上線(xiàn)下融合,則成為在基礎(chǔ)之上發(fā)展起來(lái)的新應(yīng)用、新服務(wù)和全新的商業(yè)模式。

03算力與電力的對(duì)比

算力的定義

首先面臨的一個(gè)問(wèn)題是如何定義算力(Computing Power)?現(xiàn)在不少文獻(xiàn)提到算力都會(huì)引用諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主Nordhaus教授給的算力的定義,即“單位時(shí)間系統(tǒng)輸出的信息量(the amount of information delivered per second by the machine)”,這里的“信息量”是按照香農(nóng)信息論中的依據(jù)狀態(tài)概率(P)的定義方法,即-log2(P)比特。進(jìn)一步,Nordhaus教授給出了算力的一個(gè)度量方法,稱(chēng)之為單位時(shí)間的標(biāo)準(zhǔn)操作數(shù)(SOPS,Standardized operations per second),并給出一個(gè)計(jì)算公式:

SOPS=0.05{[6+log2(memory)+word length]/[(7*addtime+mult time)/8]},其中,0.05是一個(gè)縮放因子,目的是為了把最終計(jì)算的值調(diào)整到與某類(lèi)計(jì)算機(jī)的MIPS指標(biāo)基本一致的的數(shù)值,“memory”指系統(tǒng)中存儲(chǔ)器的比特?cái)?shù),“word length”是機(jī)器字長(zhǎng),“add time”和“mult time”是做一次加法和乘法的時(shí)間周期數(shù)。

顯然,這一算力的定義方法放在“算力網(wǎng)絡(luò)”的背景下非常不直觀,對(duì)于度量一臺(tái)現(xiàn)代計(jì)算機(jī)的算力缺乏現(xiàn)實(shí)的意義,我們也不可能用這個(gè)公式來(lái)計(jì)算“算力網(wǎng)絡(luò)”的算力指標(biāo)。但這個(gè)定義的核心是信息量,之所以這樣的定義的原因是作者希望找一個(gè)指標(biāo)適用于一個(gè)大時(shí)間跨度(從1900年到2000年)、不同時(shí)代的計(jì)算設(shè)備(從機(jī)械計(jì)算機(jī),電子管計(jì)算器,再到微處理器計(jì)算機(jī))所提供的“算力”的對(duì)比,除了訴諸于信息論的方法,似乎也沒(méi)有更好的定義方法了。

在工程實(shí)踐中,如果一個(gè)指標(biāo)無(wú)法度量,則無(wú)從優(yōu)化。所以一個(gè)更具現(xiàn)實(shí)意義的“算力”應(yīng)該滿(mǎn)足幾個(gè)條件:

1)容易統(tǒng)計(jì)和計(jì)算,且相對(duì)直觀;

2)與用戶(hù)感知基本一致;

3)能客觀反映系統(tǒng)的規(guī)模大小;

4)避免長(zhǎng)尾偏差。

考慮到算力網(wǎng)絡(luò)上承載的主要是各種服務(wù),而服務(wù)的載體主要是虛擬機(jī)、容器或裸金屬服務(wù)器,因此,在算力網(wǎng)絡(luò)的場(chǎng)景下,我們把算力定義為整個(gè)系統(tǒng)可承載的最大虛擬機(jī)/容器/裸金屬服務(wù)器的數(shù)量。直觀理解,升級(jí)了CPU、網(wǎng)絡(luò)等設(shè)備來(lái)提升算力,直接的目的就是為了提高所支持的虛擬機(jī)、容器的數(shù)量;用戶(hù)需要的服務(wù),部署的業(yè)務(wù),通常也是以虛擬機(jī)和容器作為載體;虛擬機(jī)、容器的規(guī)模也可以客觀反映系統(tǒng)容量的大小。

但是這一定以方法存在的局限性是,虛擬機(jī)、容器、裸金屬服務(wù)器的數(shù)量可能是動(dòng)態(tài)變化的,比如一臺(tái)休眠的虛擬機(jī)和活躍的虛擬機(jī)消耗的物理資源顯然是不同的,具體取決于業(yè)務(wù)部署的需求,這就會(huì)導(dǎo)致同即便一個(gè)算力網(wǎng)絡(luò)在不同情況下得出不同的算力值。因此,我們將算力的定義修正為如下表述:系統(tǒng)可承載的最大虛擬機(jī)/容器/裸金屬服務(wù)器的數(shù)量。即

o4YBAGC24DOAHECBAAAARmu_22A208.png其中,a,b,c為三個(gè)權(quán)重常數(shù),大于等于0,且a+b+c歸一化為1,t為采樣時(shí)間。由此可見(jiàn),這一算力的度量方式是基于實(shí)際系統(tǒng)采樣得到的后驗(yàn)值,通過(guò)取最大值,消除由于利用率等問(wèn)題帶來(lái)的偏差。如果采用了更先進(jìn)的網(wǎng)絡(luò)、DPU等技術(shù)帶來(lái)的“擴(kuò)容”效應(yīng),也會(huì)直接反映在更大數(shù)量的虛擬機(jī)、容器、裸金屬服務(wù)器上。至于三個(gè)權(quán)重常數(shù)如何設(shè)定,可以交給系統(tǒng)的運(yùn)營(yíng)人員根據(jù)上層業(yè)務(wù)需求來(lái)調(diào)整。例如,如果虛擬機(jī)場(chǎng)景多,可以適當(dāng)放大權(quán)重a,如果裸金屬需求多,可以放大權(quán)重c。

算力與電力的類(lèi)比

電力和算力都被視為跨時(shí)代的基礎(chǔ)設(shè)施級(jí)的驅(qū)動(dòng)力。電力的廣泛采用是19世紀(jì)中期發(fā)生的第二次工業(yè)革命的標(biāo)志,人類(lèi)正式進(jìn)入了“電氣時(shí)代”。電的“泛在”,只需要鋪設(shè)好輸送網(wǎng)絡(luò)——電網(wǎng),即可完成。電力所帶來(lái)的生產(chǎn)力躍升來(lái)源于各種各樣的終端電氣設(shè)備的發(fā)明和大規(guī)模應(yīng)用。簡(jiǎn)言之,電氣化=電網(wǎng)+電氣設(shè)備。電力時(shí)代可以認(rèn)為是電網(wǎng)與電器一體化的產(chǎn)物。

o4YBAGC24DOAHECBAAAARmu_22A208.png如果把“算力”類(lèi)比為“電力”,電的泛在可以通過(guò)鋪設(shè)電網(wǎng)來(lái)實(shí)現(xiàn),那么“算力”的泛在能否通過(guò)鋪設(shè)鋪設(shè)信息網(wǎng)絡(luò)(包括無(wú)線(xiàn)通信網(wǎng))來(lái)實(shí)現(xiàn)呢?達(dá)到能聯(lián)網(wǎng)的地方就能方便、應(yīng)需地使用算力?答案似乎不是很顯然。目前寬帶、電信網(wǎng)絡(luò)也基本上算是無(wú)所不在,但“算力網(wǎng)絡(luò)”愿景顯然尚未成為現(xiàn)實(shí),“算力”尚未達(dá)到“一點(diǎn)接入”的方便程度,也沒(méi)有實(shí)現(xiàn)“即取即用”的使用彈性,這是為何呢?我們認(rèn)為其中一個(gè)原因還是整合算力資源面臨巨大的挑戰(zhàn),整合算力資源的的難度要比整合電力資源的難度要高,池化算力要比“池化”電力更具挑戰(zhàn)!

電力的源端是發(fā)電站,無(wú)論裝機(jī)容量的大小,發(fā)電的方式差異,生產(chǎn)的電力本質(zhì)是無(wú)差別的,可以認(rèn)為發(fā)電資源的“池化”只需要簡(jiǎn)單的電網(wǎng)并網(wǎng)即可實(shí)現(xiàn)。相比而言,算力的源端更加的“異構(gòu)”,既包括云端的數(shù)據(jù)中心、超算中心、智算中心等,也包括邊緣側(cè)通常規(guī)模較小,分布更廣泛的的邊緣側(cè)數(shù)據(jù)中心、計(jì)算中心、基站等,池化算力的源端資源要比電站并網(wǎng)更加挑戰(zhàn)。此外,電的傳輸對(duì)延遲并沒(méi)有特殊要求(但是對(duì)傳輸?shù)膿p耗要求較高,所以需要特高壓輸電技術(shù)),而算力的調(diào)用通常都對(duì)延遲有嚴(yán)格的要求,這也是決定服務(wù)質(zhì)量(QoS)的關(guān)鍵因素之一。

此外,不同于電力這種客觀存在的物質(zhì),算力不是一種客觀存在的物質(zhì),而是一種“能力”,是分析、存儲(chǔ)、處理數(shù)據(jù)的能力,“蘊(yùn)含”在計(jì)算設(shè)備和軟件中。電力的基本操作是開(kāi)通/斷開(kāi),如何使用是由終端設(shè)備來(lái)決定的,并不需要告知源端(發(fā)電站)。但是算力的的基本操作除了開(kāi)通、斷開(kāi)以外,還要定義 “算什么”,甚至還要定義“怎么算”,所以,基本操作要復(fù)雜得多。相比電力的“終端”(電器)完全定義了功能, 算力的終端通常并不具備足夠的“算力”(否則也就不需要構(gòu)建算力網(wǎng)了),終端大多數(shù)情況只負(fù)責(zé)“提問(wèn)”,即發(fā)送計(jì)算請(qǐng)求,而源端通過(guò)大規(guī)模計(jì)算來(lái)負(fù)責(zé)給出“解答”。從某種意義上說(shuō),算力網(wǎng)絡(luò)在使用方式上與云計(jì)算還比較相似,云計(jì)算也許可以被視為算力網(wǎng)絡(luò)雛形。

04算力網(wǎng)絡(luò)的底層基礎(chǔ)設(shè)施有待新技術(shù)突破

o4YBAGC24DOAHECBAAAARmu_22A208.png直觀的理解算力網(wǎng)絡(luò)包含兩個(gè)關(guān)鍵部分:一是“算力”,二是“網(wǎng)絡(luò)”。然而,“算力網(wǎng)絡(luò)”的效力不應(yīng)該是二者的簡(jiǎn)單的加和,而應(yīng)該是“倍乘”,通過(guò)網(wǎng)絡(luò)來(lái)對(duì)算力進(jìn)行價(jià)值放大,承載更多的應(yīng)用。缺乏算力的網(wǎng)絡(luò)只能作為數(shù)據(jù)的傳輸網(wǎng),而缺乏網(wǎng)絡(luò)的算力的使用價(jià)值也將大大降低。根據(jù)著名的梅特卡夫定律,一個(gè)網(wǎng)絡(luò)的價(jià)值等于該網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)數(shù)的平方。對(duì)于算力網(wǎng)絡(luò),宏觀來(lái)看“節(jié)點(diǎn)”包括的各種算力中心(如數(shù)據(jù)中心、超算中心、智算中心、邊緣計(jì)算節(jié)點(diǎn)等等)和服務(wù)的終端應(yīng)用(如PC、智能手機(jī)等具有強(qiáng)交互性的設(shè)備,也包括攝像頭、智能電表等弱交互性設(shè)備)。因特網(wǎng)的發(fā)展已經(jīng)顯示出了梅特卡夫定律的巨大威力,將人類(lèi)帶入了信息時(shí)代。如果算力網(wǎng)絡(luò)的梅特卡夫定律能繼續(xù)發(fā)揮作用,必將會(huì)把人類(lèi)帶入一個(gè)新的時(shí)代——也許就是智能時(shí)代。

o4YBAGC24DOAHECBAAAARmu_22A208.png然而,新酒還需新瓶來(lái)裝?,F(xiàn)有的計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)基礎(chǔ)設(shè)施,可能還不能完全支撐算力網(wǎng)絡(luò)的愿景成為現(xiàn)實(shí)。研究表明從1940年到2010年間的60年中,我們看到計(jì)算能耗效率(單位為每千瓦時(shí)的計(jì)算量,Computaions per kWh)隨時(shí)間呈現(xiàn)穩(wěn)定的指數(shù)增長(zhǎng),大約每1.6年這個(gè)效率指標(biāo)就會(huì)加倍。本質(zhì)上得益于摩爾定律和登納德縮放定律在此期間基本的有效性。計(jì)算效率的持續(xù)性指數(shù)級(jí)提升使得通過(guò)線(xiàn)性的計(jì)算節(jié)點(diǎn)的規(guī)模和能耗水平的增長(zhǎng),即可獲得指數(shù)級(jí)的算力。籍此,在這個(gè)世紀(jì)的前十年我們得以將一臺(tái)PC的算力裝在了手機(jī)中,直接賦能了移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展。

相比于算力增速而言,數(shù)據(jù)量的增速也毫不遜色,甚至已經(jīng)形成趕超之勢(shì)。從2005年開(kāi)始至今,數(shù)據(jù)量大約每?jī)赡攴环?a target="_blank">IDC預(yù)測(cè)到2025年將達(dá)到175澤字節(jié)(ZettaBytes)。然而,摩爾定律從2015年開(kāi)始放緩,單位能耗下的算力增速已經(jīng)逐漸被數(shù)據(jù)量增速拉開(kāi)差距?,F(xiàn)有的網(wǎng)絡(luò)化算力可以部分解決利用率不均衡的問(wèn)題,但是并不能本質(zhì)上解決算力增速放緩的局面。

應(yīng)用層算力與基礎(chǔ)層算力

為了便于分析算力相關(guān)的核心基礎(chǔ)技術(shù),我們把算力劃分為兩大類(lèi):應(yīng)用層算力(Application-Domain Computing Power)和基礎(chǔ)層算力(Infrastructure-Domain Computing Power)。其中應(yīng)用層算力,顧名思義,指用于執(zhí)行業(yè)務(wù)層應(yīng)用的算力,例如視頻解析,數(shù)據(jù)查詢(xún),路徑規(guī)劃,圖像渲染等,大體對(duì)應(yīng)到全系統(tǒng)分層架構(gòu)SaaS和PaaS層。基礎(chǔ)層算力指用來(lái)做資源池化,數(shù)據(jù)轉(zhuǎn)發(fā),壓縮存儲(chǔ),加密解密,文件系統(tǒng),網(wǎng)絡(luò)功能虛擬化等基礎(chǔ)層負(fù)載的算力,大體對(duì)應(yīng)到IaaS層。預(yù)計(jì)應(yīng)用算力的提升主要來(lái)自于專(zhuān)用服務(wù)器的采用,雖然局部來(lái)看,應(yīng)用層算力一方面得益于更高性能CPU、GPU的采用,另一方面得益于計(jì)算從通用走向?qū)S玫倪^(guò)程中各種FPGAASIC的XPU的引入。雖然引入了大量專(zhuān)用計(jì)算單元,但宏觀來(lái)看,得益于CPU的核心地位,仍然可以維持算力的通用性。

基礎(chǔ)層算力主要與網(wǎng)絡(luò)、存儲(chǔ)和安全相關(guān),預(yù)計(jì)基礎(chǔ)算力的提升將主要得益于DPU、5G移動(dòng)邊緣計(jì)算技術(shù)、超高速光電混合網(wǎng)絡(luò)技術(shù),NVMe oF等技術(shù)的采用。網(wǎng)絡(luò)和存儲(chǔ)都比較依賴(lài)各種協(xié)議的處理,不同的物理層實(shí)現(xiàn)?;A(chǔ)層算力不僅需要幫助提升IO的帶寬,降低延遲,還要維持訪(fǎng)問(wèn)方式的一致性、匹配應(yīng)用的需求。這些復(fù)雜的需求非常依賴(lài)于更靈活的網(wǎng)絡(luò)可編程性,更高效的硬件虛擬化技術(shù)來(lái)支持。例如,對(duì)于窄帶寬但低延遲的需求,與帶寬要求高但延遲不敏感的應(yīng)用,顯然應(yīng)該適配不同的網(wǎng)絡(luò)資源;對(duì)于突發(fā)性高并發(fā),小數(shù)據(jù)量與穩(wěn)定性低并發(fā)但大數(shù)據(jù)量的業(yè)務(wù)也需要網(wǎng)絡(luò)和IO配給不同的資源。按照前文“算力網(wǎng)絡(luò)”的定義中“匹配應(yīng)用需求”的角度來(lái)看,軟件定義網(wǎng)絡(luò)、軟件定義存儲(chǔ)、軟件定義加速器等一系列“軟件定義”技術(shù)路線(xiàn)還有很大提升空間。預(yù)計(jì)算力網(wǎng)絡(luò)的基礎(chǔ)層將會(huì)有如下幾方面的技術(shù)突破。

技術(shù)突破一:通過(guò)DSA維繼應(yīng)用算力的指數(shù)級(jí)提升

簡(jiǎn)言之,如何增強(qiáng)應(yīng)用算力。短期來(lái)看,專(zhuān)用體系結(jié)構(gòu)的廣泛采用有望維持2~3個(gè)數(shù)量級(jí)的算力提升的潛力。這也是領(lǐng)域?qū)S眉軜?gòu)(DSA)技術(shù)路線(xiàn)得到重視的原因。DSA技術(shù)的采用,必然導(dǎo)致算力源端的異構(gòu)化,如何在現(xiàn)有的體系結(jié)構(gòu)下,即發(fā)揮出DSA的能效優(yōu)勢(shì),又對(duì)上屏蔽其差異性,是一個(gè)不小的挑戰(zhàn)?,F(xiàn)在提出的一些非-馮諾伊曼架構(gòu),例如存內(nèi)計(jì)算,網(wǎng)內(nèi)計(jì)算、類(lèi)腦計(jì)算等,都在嘗試用非傳統(tǒng)計(jì)算架構(gòu)來(lái)提升計(jì)算效能。從技術(shù)成熟度角度看,通用GPU(GPGPU),面向深度學(xué)習(xí)模型的訓(xùn)練和推理的通用AI芯片,最有可能在短期內(nèi)發(fā)揮算力增強(qiáng)的作用。報(bào)告預(yù)測(cè),裝備GPGPU和AI芯片的AI服務(wù)器預(yù)計(jì)到2025年將達(dá)到算力總支出的25%。

技術(shù)突破二:通過(guò)DPU釋放應(yīng)用層算力的同時(shí)擴(kuò)容基礎(chǔ)算力的管道

基礎(chǔ)算力層的核心功能之一是構(gòu)建算力流通的“管道”,在傳統(tǒng)系統(tǒng)架構(gòu)中,網(wǎng)絡(luò)與計(jì)算是分離,計(jì)算的主體是服務(wù)器,網(wǎng)絡(luò)的主體是網(wǎng)卡、路由器和交換機(jī)。隨著DPU技術(shù)的逐漸成熟,我們看到大量原本在服務(wù)器上運(yùn)行的基礎(chǔ)層負(fù)載可以被卸載到與服務(wù)器CPU直連的DPU上,保持網(wǎng)絡(luò)特性的功能不再由服務(wù)器端的CPU來(lái)維護(hù)。DPU的存在,將本地物理資源虛擬化,也將遠(yuǎn)層訪(fǎng)問(wèn)本地化。DPU開(kāi)始承載基礎(chǔ)算力的角色,并且是在不改變現(xiàn)有路由器和交換機(jī)的前提下。DPU的出現(xiàn)也使得網(wǎng)內(nèi)計(jì)算(In-Network Computing)的成熟度得到進(jìn)一步提升。

技術(shù)突破三:通過(guò)數(shù)據(jù)面代理賦能無(wú)服務(wù)器(Serverless)服務(wù)和云原生應(yīng)用

隨著云原生微服務(wù)架構(gòu)的普及,服務(wù)網(wǎng)格(Service Mesh)作為微服務(wù)間通信的專(zhuān)用基礎(chǔ)設(shè)施層,它在微服務(wù)架構(gòu)中實(shí)現(xiàn)可靠、快速和安全的服務(wù)間調(diào)用,同時(shí)提供了出色的可觀測(cè)性、流量控制能力和安全保障。但是,服務(wù)網(wǎng)格也存在一定的局限性,主要體現(xiàn)在其增加了網(wǎng)絡(luò)的復(fù)雜性。服務(wù)網(wǎng)格能力的發(fā)揮依賴(lài)于數(shù)據(jù)面代理,為了保持應(yīng)用與服務(wù)的解耦,采用非侵入性的數(shù)據(jù)面代理邊車(chē)(Side-Car)機(jī)制,任意兩個(gè)微服務(wù)間的通信都增加了兩跳七層應(yīng)用代理,而基于CPU軟件實(shí)現(xiàn)的七層應(yīng)用代理數(shù)據(jù)處理周期較長(zhǎng),微服務(wù)間通信的時(shí)延顯著增加,限制了云原生應(yīng)用的大規(guī)模部署。針對(duì)當(dāng)前云原生服務(wù)網(wǎng)格存在的這一問(wèn)題,可以通過(guò)DPU實(shí)現(xiàn)服務(wù)網(wǎng)格數(shù)據(jù)面代理,進(jìn)而解決了CPU和內(nèi)存的消耗和微服務(wù)間訪(fǎng)問(wèn)延遲的問(wèn)題。

結(jié)語(yǔ)

算力網(wǎng)絡(luò)是實(shí)現(xiàn)“算力”基礎(chǔ)設(shè)施化的一個(gè)重要載體,是一整套從技術(shù)到運(yùn)營(yíng)的系統(tǒng)性技術(shù)綜合的成果。如果成功落地,“新瓶裝新酒”,必將會(huì)有力促進(jìn)我國(guó)數(shù)字經(jīng)濟(jì)的跨越式發(fā)展。目前我們?cè)跇?gòu)建算力網(wǎng)絡(luò)上有較好的基礎(chǔ),比如基建化程度、網(wǎng)絡(luò)覆蓋率、運(yùn)營(yíng)水平、業(yè)務(wù)整體容量等,光纖到戶(hù)比率遠(yuǎn)高于國(guó)際平均水平,但是在技術(shù)層面也還面臨一些關(guān)鍵挑戰(zhàn),特別是核心算力芯片的自主率過(guò)低,核心光電器件主要依賴(lài)進(jìn)口。在“東算西數(shù)”、構(gòu)建全國(guó)一體化算力基礎(chǔ)設(shè)施等相關(guān)政策的引導(dǎo)下,可以看到巨大的“盤(pán)活存量、優(yōu)化增量”的機(jī)遇,早日讓“算力”成為普惠大眾的生產(chǎn)力。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    51600

    瀏覽量

    429919
  • 網(wǎng)絡(luò)化
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    25460
  • 光電器件
    +關(guān)注

    關(guān)注

    1

    文章

    180

    瀏覽量

    18692
  • 數(shù)據(jù)處理
    +關(guān)注

    關(guān)注

    0

    文章

    623

    瀏覽量

    28736
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【一文看懂】什么是端側(cè)?

    向您介紹全方面端側(cè):1.端側(cè)定義2.端側(cè)
    的頭像 發(fā)表于 02-24 12:02 ?458次閱讀
    【一文看懂】什么是端側(cè)<b class='flag-5'>算</b><b class='flag-5'>力</b>?

    基于 Flexus 云服務(wù)器 X 實(shí)例的簡(jiǎn)單性能測(cè)評(píng)

    做個(gè)簡(jiǎn)單的測(cè)評(píng),看看這款服務(wù)器到底怎么樣。 華為云 Flexus 云服務(wù)器 X 實(shí)例介紹 智能感知業(yè)務(wù)負(fù)載,量體裁衣無(wú)浪費(fèi),開(kāi)啟應(yīng)用定義新時(shí)代 進(jìn)入華為云官網(wǎng)后,點(diǎn)擊云服務(wù)器,我們可以看到列出來(lái)了好多服務(wù)器,其中第二款就是我
    的頭像 發(fā)表于 01-23 17:14 ?156次閱讀
    基于 Flexus 云服務(wù)器 X 實(shí)例的簡(jiǎn)單性能測(cè)評(píng)

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?945次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?202次閱讀

    杰和課堂|帶你認(rèn)識(shí)

    主板內(nèi)置34TOPS的NPU。那么究竟什么是?一、
    的頭像 發(fā)表于 12-06 10:24 ?577次閱讀
    杰和課堂|帶你認(rèn)識(shí)<b class='flag-5'>算</b><b class='flag-5'>力</b>

    調(diào)度的基礎(chǔ)知識(shí)

    編者按 “調(diào)度”的概念,這幾年越來(lái)越多的被提及。剛聽(tīng)到這個(gè)概念的時(shí)候,我腦海里一直拐不過(guò)彎。作為底層芯片出身的我,一直認(rèn)為:是硬件的服務(wù)器和集群,他在某個(gè)地方,就是固定的;根本
    的頭像 發(fā)表于 11-27 17:13 ?447次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度的基礎(chǔ)知識(shí)

    基礎(chǔ)篇:從零開(kāi)始了解

    即計(jì)算能力(Computing Power),狹義上指對(duì)數(shù)字問(wèn)題的運(yùn)算能力,而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過(guò)程的能力都可抽象為。比
    的頭像 發(fā)表于 11-15 14:22 ?1339次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)篇:從零開(kāi)始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿(mǎn)足其AI應(yīng)用的需求。以下是對(duì)企業(yè)AI
    的頭像 發(fā)表于 11-14 09:30 ?1568次閱讀

    GPU開(kāi)發(fā)平臺(tái)是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。AI租賃作為一種新興的服務(wù)模式,正逐漸成為企業(yè)獲取
    的頭像 發(fā)表于 10-31 10:31 ?360次閱讀

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書(shū)中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國(guó)信通院公布首個(gè)《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智構(gòu)建的全國(guó)一體化
    的頭像 發(fā)表于 08-06 14:23 ?985次閱讀

    基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    編者按網(wǎng)絡(luò)有一個(gè)美好的愿景,就是希望網(wǎng),能像電力和電網(wǎng)一樣:
    的頭像 發(fā)表于 06-13 08:27 ?699次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    力系列基礎(chǔ)篇——101:從零開(kāi)始了解

    相信大家已經(jīng)感受到,我們正處在一個(gè)人工智能時(shí)代。如果要問(wèn)在人工智能時(shí)代最重要的是什么?那必須是:!
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開(kāi)始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    中心:數(shù)字經(jīng)濟(jì)發(fā)展的新引擎

    、建設(shè)與發(fā)展,并分析其對(duì)數(shù)字經(jīng)濟(jì)發(fā)展的影響。01、中心的定義與概述中心是指具備高性能計(jì)算、大規(guī)模存儲(chǔ)、高速網(wǎng)絡(luò)等基礎(chǔ)設(shè)施的計(jì)算中心,
    的頭像 發(fā)表于 04-13 08:27 ?2127次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>中心:數(shù)字經(jīng)濟(jì)發(fā)展的新引擎