0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU發(fā)展面臨的困境和機(jī)遇

jf_C6sANWk1 ? 來源:軟硬件融合 ? 2023-02-07 09:45 ? 次閱讀

編者按

有一些投資人認(rèn)為,DPU賽道比較雞肋:CPU/GPU同量級的高投入,但市場規(guī)模卻不大。并且因?yàn)镈PU跟用戶的業(yè)務(wù)休戚相關(guān),很多用戶傾向自研,這進(jìn)一步導(dǎo)致公開市場規(guī)模更加有限。

即使強(qiáng)如NVIDIA,其DPU已經(jīng)發(fā)布兩年左右,目前仍沒有用戶真正大規(guī)模采用。這里面存在的問題到底是什么?有沒有破解之道?

這篇文章會(huì)對DPU發(fā)展過程中存在的問題進(jìn)行細(xì)致分析,拋磚引玉,期待更優(yōu)的、可大范圍落地的創(chuàng)新型產(chǎn)品出現(xiàn)。

更本質(zhì)的,DPU是在目前算力困境的大背景下產(chǎn)生的,預(yù)示著一個(gè)新的算力時(shí)代的到來。行業(yè)需要更多的技術(shù)創(chuàng)新,更好的服務(wù) “東數(shù)西算”國家大戰(zhàn)略和數(shù)字經(jīng)濟(jì)發(fā)展。

1 DPU發(fā)展面臨的困境

1.1 芯片研發(fā)成本高昂

8aaa1312-a606-11ed-bfe3-dac502259ad0.png

摩爾定律預(yù)示了:芯片工藝的發(fā)展,會(huì)使得晶體管數(shù)量大約每兩年提升一倍。雖然工藝的進(jìn)步逐步進(jìn)入瓶頸,但Chiplet越來越成為行業(yè)發(fā)展的重點(diǎn),這使得芯片的晶體管數(shù)量可以再一次數(shù)量級的提升。

在先進(jìn)工藝的設(shè)計(jì)成本方面,知名半導(dǎo)體研究機(jī)構(gòu)Semiengingeering統(tǒng)計(jì)了不同工藝下芯片所需費(fèi)用(費(fèi)用包括了):

28nm節(jié)點(diǎn)開發(fā)芯片只需要5130萬美元;

16nm節(jié)點(diǎn)則需要1億美元;

7nm節(jié)點(diǎn)需要2.97億美元;

到了5nm節(jié)點(diǎn),費(fèi)用高達(dá)5.42億美元;

3nm節(jié)點(diǎn)的研發(fā)費(fèi)用,預(yù)計(jì)將接近10億美元。

就意味著,大芯片需要足夠通用,足夠大范圍落地,才能在商業(yè)邏輯上成立。做一個(gè)基本的估算:

終端場景,(大)芯片的銷售量至少需要達(dá)到數(shù)千萬級才能有效攤薄一次性的研發(fā)成本;

在數(shù)據(jù)中心場景,則需要50萬甚至100萬以上的銷售量,才能有效攤薄研發(fā)成本。

并且,在研發(fā)方面的投入,DPU相比CPU、GPU還要更高:

開發(fā)DPU芯片,不但需要高性能CPU IP、高性能總線IP,還包括高速PCIe、Ethernet以及DDR/HBM等;

還需要開發(fā)非常多的、并且開發(fā)難度也非常高的各類加速引擎,如網(wǎng)絡(luò)協(xié)議處理加速引擎、高性能網(wǎng)絡(luò)加速引擎、存儲(chǔ)加速引擎、各類安全加速引擎等;

還需要把IaaS等很多上層的軟件服務(wù)融入到芯片的軟硬件方案中,并且需要跟不同用戶的不同場景進(jìn)行對接。

1.2 多領(lǐng)域場景需求

8ac619e0-a606-11ed-bfe3-dac502259ad0.png

CPU性能瓶頸之后,傳統(tǒng)在CPU側(cè)軟件運(yùn)行的工作任務(wù),很多會(huì)沉淀到硬件去加速。這樣,就需要有一個(gè)平臺(tái)來承載這些加速,而DPU就是這個(gè)承載各類加速的芯片平臺(tái)。

CPU通過標(biāo)準(zhǔn)ISA實(shí)現(xiàn)軟硬件解耦,CPU引擎也就只有一類,CPU設(shè)計(jì)工程師可以不用太過關(guān)心具體的需求,而只需要關(guān)注具體的CPU設(shè)計(jì)即可。

GPU也通過CUDA以及GPGPU架構(gòu)實(shí)現(xiàn)了軟硬件解耦,GPU引擎也只有一類,并且 GPU的設(shè)計(jì)工程師也是只需要把重心放在GPU的具體設(shè)計(jì)中。

跟CPU和GPU的設(shè)計(jì)相比,DPU有如下兩個(gè)難點(diǎn):

多場景,挑戰(zhàn)更大。相比CPU和GPU的單個(gè)引擎類型,DPU的處理引擎(或者說涉及的領(lǐng)域/場景)會(huì)有很多,如基礎(chǔ)設(shè)施層的虛擬化、網(wǎng)絡(luò)、存儲(chǔ)、安全等的處理引擎,以及各類開發(fā)庫、文件系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)訪問等的處理引擎。

場景的軟硬件解耦難度大。CPU和GPU實(shí)現(xiàn)了軟硬件解耦,軟件開發(fā)者和芯片開發(fā)者可以并行不悖,各自相對獨(dú)立的完成工作。而到了DPU的領(lǐng)域加速,要想實(shí)現(xiàn)軟硬件解耦非常困難;如果硬是要要采用ASIC的完全定制硬件加速,則是場景和硬件完全緊耦合,開發(fā)難度更大,靈活性更低,風(fēng)險(xiǎn)更高。

當(dāng)然,這里有個(gè)矛盾:承載更多領(lǐng)域和場景的功能,可以提升DPU價(jià)值;但承載這么多的功能,開發(fā)難度卻又非常大。那么,均衡點(diǎn)在哪里?有沒有既可以卸載更多領(lǐng)域和場景的功能,又不提升開發(fā)難度的辦法?

1.3 宏觀視角看需求:場景的橫向和縱向差異性

軟件的迭代很快,大概3-6個(gè)月;而芯片的迭代很慢,開發(fā)周期2年,生命周期5年,合計(jì)七年的時(shí)間,很難支撐軟件的這么頻繁而長期的迭代。

差異性主要體現(xiàn)在兩方面:

業(yè)務(wù)場景的橫向差異性,指的是即使在同一領(lǐng)域,不同用戶的業(yè)務(wù)邏輯仍有差異,甚至同一企業(yè)(用戶),其內(nèi)部也會(huì)有很多不同的團(tuán)隊(duì),在同一領(lǐng)域的業(yè)務(wù)邏輯也存在差異。

業(yè)務(wù)場景的縱向差異性,指的是同一用戶/同一團(tuán)隊(duì)業(yè)務(wù)邏輯的長期快速迭代。

針對業(yè)務(wù)場景的縱向和橫向的差異,主要有三類做法:

芯片廠家,根據(jù)自身對場景的理解,給出的自認(rèn)為最優(yōu)化的方案(場景定制方案)。這樣,其實(shí)有點(diǎn)越庖代俎,消除了不同用戶業(yè)務(wù)場景的差異性,也限制了用戶的業(yè)務(wù)創(chuàng)新。用戶會(huì)對芯片廠家形成強(qiáng)依賴關(guān)系,這是用戶不愿意看到的。

一些大用戶,自身具備芯片研發(fā)實(shí)力,根據(jù)自身業(yè)務(wù)需求,定制芯片。但大用戶內(nèi)部也是由許多不同的小團(tuán)隊(duì)組成,不同團(tuán)隊(duì)業(yè)務(wù)場景仍然存在差異性,定制芯片也存在技術(shù)的、商業(yè)邏輯的方方面面的挑戰(zhàn)。

前兩類都是定制的解決方案,這里則是通用的解決方案?!笆谌艘贼~,不如授人以漁”,通過通用的設(shè)計(jì),確保在每個(gè)領(lǐng)域,都能夠?qū)崿F(xiàn)一定程度上的軟硬件解耦。芯片公司提供“通用”的硬件平臺(tái),讓用戶通過編程的方式實(shí)現(xiàn)業(yè)務(wù)差異化,“讓用戶掌控一切”。挑戰(zhàn)則在于,存在通用的解決方案嗎?通用解決方案的軟硬件如何解耦?

1.4 針對場景定制設(shè)計(jì)是一件高難度的事情

復(fù)雜的系統(tǒng),軟硬件設(shè)計(jì)需要解耦。只有通過解耦,才能解放彼此,各自努力又相互協(xié)同,最終實(shí)現(xiàn)功能強(qiáng)大、性能強(qiáng)勁的系統(tǒng)。

通常,大家都以為,定制設(shè)計(jì)是性能和效率最優(yōu)的。但實(shí)際上,卻不是這樣:

定制設(shè)計(jì),沒有冗余,理論上是最極致的性能。但因?yàn)槎ㄖ圃O(shè)計(jì)是場景跟硬件設(shè)計(jì)完全耦合,硬件開發(fā)的難度很高,難以實(shí)現(xiàn)超大規(guī)模的定制設(shè)計(jì)。

理論上來說定制設(shè)計(jì)的資源效率是最高的,但由于定制設(shè)計(jì)必然覆蓋的場景較小,芯片設(shè)計(jì)為了覆蓋盡可能多的場景,不得不實(shí)現(xiàn)功能超集。實(shí)際的功能利用率和資源效率反而不是最高。

定制設(shè)計(jì)功能完全確定,難以覆蓋復(fù)雜計(jì)算場景的差異化要求。差異化包含兩個(gè)方面:橫向的不同用戶的差異化需求,縱向的單個(gè)用戶的長期快速迭代。

即使同一場景,不同芯片廠家的定制設(shè)計(jì)引擎架構(gòu)依然五花八門,毫無生態(tài)可言。

因此,可以認(rèn)為,定制設(shè)計(jì)是一項(xiàng)非常高難度,并且“吃力不討好”的事情。特別是在云和邊緣計(jì)算等,對靈活可編程能力有著極高的要求的,復(fù)雜場景,定制設(shè)計(jì)更是難有用武之地。

1.5 價(jià)值和定位不高

8adfc430-a606-11ed-bfe3-dac502259ad0.png

目前,對于DPU的定義,行業(yè)還存在一些爭議,大家對DPU的功能定義依然沒有定論。那么DPU的市場規(guī)模到底有多少?我們以中國市場為例:

如果認(rèn)為DPU就是加速卡:那么則是完全碎片化的市場,每個(gè)領(lǐng)域的加速市場規(guī)模大概在5億RMB左右。因?yàn)樗槠?,隨著其他整合方案越來越流行之后,加速卡未來的市場則有可能會(huì)快速萎縮。

如果定位SmartNIC:智能網(wǎng)卡只在一些純網(wǎng)絡(luò)加速的場景有用,市場規(guī)模大概50億RMB左右。而計(jì)算類的則是相對綜合的場景,不但需要網(wǎng)絡(luò),還需要存儲(chǔ)、虛擬化、安全等場景加速。

如果定位基礎(chǔ)設(shè)施處理器IPU(基本等同于DPU,不同的命名方式):市場規(guī)模在500億左右,這就比較符合市場規(guī)模預(yù)期。但即便如此,IPU的價(jià)值定位仍然要比CPU和GPU低,而研發(fā)資源投入和風(fēng)險(xiǎn)卻又比CPU和GPU高。這一里一外的差距,即是DPU發(fā)展最大的挑戰(zhàn)。

針對DPU的功能定位,目前形成共識的說法是:DPU作為CPU和GPU的輔助,負(fù)責(zé)一些數(shù)據(jù)類處理的加速。這樣的定位,則成了DPU發(fā)展的天花板和魔咒。

1.6 用戶的訴求:支撐自身的業(yè)務(wù)創(chuàng)新

互聯(lián)網(wǎng)行業(yè),目前有很多客戶開始自研芯片,這是一個(gè)重要的趨勢:

很多人認(rèn)為,互聯(lián)網(wǎng)公司為了構(gòu)建自己的護(hù)城河,開始構(gòu)建一套“封閉”體系。

我更多的是認(rèn)為:隨著互聯(lián)網(wǎng)云和邊緣計(jì)算的發(fā)展,上層的軟件業(yè)務(wù)對底層硬件要求越來越高。而傳統(tǒng)的芯片公司,雖然有一些先進(jìn)的技術(shù),但局限于閉門造車,這些技術(shù)并沒有為客戶帶來新的更大的價(jià)值,反而在一些方面,約束了客戶的價(jià)值發(fā)揮。

這些矛盾,逼迫著一些有實(shí)例自研的用戶,不得不“自己動(dòng)手,豐衣足食”,開始了自研之路。

那么,“想喝牛奶,真的要自己養(yǎng)牛嗎?”用戶的訴求到底是什么?這里我們深入分析一下:

更高性能/成本比。性價(jià)比是永恒的話題,都希望最低廉的成本下提供最高的性能價(jià)值。

差異化。toB市場,互聯(lián)網(wǎng)云計(jì)算公司需要有足夠理想的硬件平臺(tái),能夠支撐自身業(yè)務(wù)的差異化,也能夠支撐云計(jì)算提供差異化的價(jià)值給到云的用戶(也即用戶的用戶)。

可迭代。軟件的迭代很快,而為了延遲設(shè)備的生命周期(也是一種降成本的手段),則需要硬件能夠盡可能支持軟件服務(wù)的更長期迭代。

快速業(yè)務(wù)創(chuàng)新。用戶的業(yè)務(wù)是核心競爭力,而研發(fā)芯片不是。用戶需要的是能夠自己掌控一切的開發(fā)平臺(tái),來實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新,來增強(qiáng)自身的核心競爭力。

如果存在通用的芯片方案,能夠滿足上述這些需求,用戶不會(huì)產(chǎn)生平臺(tái)依賴,不對用戶自身業(yè)務(wù)的核心競爭力構(gòu)成威脅,并且功能更加強(qiáng)大,性能更加強(qiáng)勁,價(jià)格更具有顯著優(yōu)勢,客戶還需要自研嗎?

人類發(fā)展的過程,就是從“男耕女織”到“手工作坊”,再到流水線的“工業(yè)化大生產(chǎn)”,再到現(xiàn)在的“全球化大分工”。從更宏大更長期的視角看,隨著時(shí)間推移,很多技術(shù)會(huì)沉淀,云計(jì)算這樣的互聯(lián)網(wǎng)底層技術(shù)也不例外?;ヂ?lián)網(wǎng)整個(gè)技術(shù)體系會(huì)繼續(xù)枝繁葉茂,并且會(huì)持續(xù)的、更精細(xì)化的分工。而底層的芯片,唯有創(chuàng)新,才能真正幫助客戶,成就客戶。

2 跳脫束縛,尋找更大的機(jī)遇

2.1 通過增強(qiáng)功能來覆蓋更多場景

8af4b868-a606-11ed-bfe3-dac502259ad0.png

我們站在CPU工作任務(wù)卸載到硬件加速的視角來看:

階段0:CPU性能足夠,由于其靈活可編程能力很好,是數(shù)據(jù)中心處理器當(dāng)仁不讓的第一選擇。

隨著CPU性能提升緩慢,有一些性能敏感的任務(wù)需要加速。于是有了各類加速器(卡),這個(gè)時(shí)候都局限于某一個(gè)特定任務(wù)的加速,各個(gè)加速方案是完全獨(dú)立的孤島。網(wǎng)絡(luò)加速是比較特殊的一個(gè),因?yàn)槠鋭偤锰幵谡麄€(gè)服務(wù)器的I/O路徑上,價(jià)值更大,應(yīng)用領(lǐng)域也更多。

更進(jìn)一步的,虛擬化的底層基礎(chǔ)設(shè)施,如虛擬化管理、網(wǎng)絡(luò)(包括設(shè)備虛擬化和網(wǎng)絡(luò)服務(wù))、存儲(chǔ)(包括設(shè)備虛擬化和存儲(chǔ)服務(wù))、安全等,都可以從CPU側(cè)卸載到硬件加速。

更進(jìn)一步的,全棧卸載。只有整個(gè)系統(tǒng)堆棧中的任務(wù)足夠性能敏感(占用非常多的CPU資源),并且大范圍的被部署,則此任務(wù)就適合被卸載到硬件加速。其性能/成本比的優(yōu)化效果也更加立竿見影。

但即便如此,這個(gè)承載了各類加速的平臺(tái),即DPU,其功能和價(jià)值還依然不夠。它,需要跳脫束縛,自成一體。

8b206670-a606-11ed-bfe3-dac502259ad0.png

CPU、GPU和DPU,既相互協(xié)作,又相互競爭?!暗萌肟谡叩锰煜隆保?/p>

傳統(tǒng)觀點(diǎn)認(rèn)為,DPU是CPU/GPU的任務(wù)卸載加速。

按照軟硬件融合演進(jìn)的觀點(diǎn):DPU/IPU則是數(shù)據(jù)中心算力和服務(wù)的核心,而獨(dú)立CPU/GPU則是DPU的擴(kuò)展。

我們詳細(xì)講解一下:

小系統(tǒng)。DPU自身是包含CPU、GPU、FPGA、DSA、ASIC等各種處理引擎的一個(gè)超大的SOC。本身就能處理所有的任務(wù)。在一些業(yè)務(wù)應(yīng)用層算力要求不高的情況下,最小計(jì)算系統(tǒng)的獨(dú)立的DPU就能滿足計(jì)算的要求。

中系統(tǒng)。DPU+CPU。在一些場景,業(yè)務(wù)應(yīng)用層有更高的算力要求,或者必須業(yè)務(wù)和基礎(chǔ)設(shè)施分離。這樣,DPU+CPU的中等計(jì)算系統(tǒng)能夠滿足此類場景需求。

大系統(tǒng)。DPU+CPU+GPU。例如AI訓(xùn)練類的場景,例如一些應(yīng)用需要加速的場景,并且需要業(yè)務(wù)和基礎(chǔ)設(shè)施分離。這樣的時(shí)候,DPU+CPU+DPU的最大就成為必須的選擇。

8b2f53b0-a606-11ed-bfe3-dac502259ad0.png

最后,上圖是Intel認(rèn)為的數(shù)據(jù)中心未來架構(gòu)圖,在這張圖中,IPU成為數(shù)據(jù)中心中最關(guān)鍵的處理器:

后臺(tái)的存儲(chǔ)服務(wù)器和加速器池化服務(wù)器采用的是DPU小系統(tǒng);

通用計(jì)算服務(wù)器采用的是DPU+CPU的中系統(tǒng);

AI服務(wù)器采用的是DPU+CPU+GPU的大系統(tǒng)。

2.2 通過通用可編程能力來提升功能覆蓋

8b516810-a606-11ed-bfe3-dac502259ad0.png

我們以網(wǎng)絡(luò)交換芯片為例。網(wǎng)絡(luò)交換芯片通常是一個(gè)緊耦合的ASIC芯片設(shè)計(jì),隨著需要支持的網(wǎng)絡(luò)協(xié)議和功能越來越多,ASIC芯片并不都能一一滿足用戶需求。

有很多用戶(特別是巨頭用戶),都有非常多的創(chuàng)新的和自定義的協(xié)議及功能需求。如果把需求反饋給芯片廠家(如博通、思科等),它們再在新一代的芯片研發(fā)中心去支持(并且,是否支持新的協(xié)議或功能還需要內(nèi)部決策,有可能一些認(rèn)為不太重要的協(xié)議或功能就無法得到支持),然后等到用戶更新到自己的軟件服務(wù)中去,至少需要2年時(shí)間。

8b706562-a606-11ed-bfe3-dac502259ad0.png

Intel收購的Barefoot提供了可編程交換機(jī),在沒有軟件編程的情況下,交換機(jī)是沒有具體功能的。通過編程,用戶可以實(shí)現(xiàn)自己想要的任何網(wǎng)絡(luò)協(xié)議和功能的支持,甚至實(shí)現(xiàn)一些用戶自定義協(xié)議。并且,這種可編程能力是在ASIC級別的處理引擎上實(shí)現(xiàn),也即能達(dá)到ASIC級別的性能。大家把這種網(wǎng)絡(luò)可編程的ASIC稱之為網(wǎng)絡(luò)DSA。

同樣的,其他各種領(lǐng)域和場景都可以采用類似的設(shè)計(jì),來實(shí)現(xiàn)一定程度的功能可編程,來提升硬件所能覆蓋的功能范圍。

2.3 超異構(gòu)計(jì)算,更充分的利用更加龐大的晶體管資源

8b8bc776-a606-11ed-bfe3-dac502259ad0.png

芯片工藝帶來的資源規(guī)模越來越大,所能支撐的設(shè)計(jì)規(guī)模也越來越大,這給架構(gòu)創(chuàng)新提供了非常堅(jiān)實(shí)的基礎(chǔ)。我們可以采用多種處理引擎共存,“專業(yè)的人做專業(yè)的事情”,來共同協(xié)作的完成復(fù)雜系統(tǒng)的計(jì)算任務(wù)。并且,CPU、GPU、FPGA、一些特定的算法引擎,都可以作為IP,被集成到更大的系統(tǒng)中。這樣,構(gòu)建一個(gè)更大規(guī)模的芯片設(shè)計(jì)成為了可能。這里,我們稱之為“超異構(gòu)計(jì)算”。如上圖所示,超異構(gòu)指的是由CPU、GPU、FPGA、DSA、ASIC以及其他各種形態(tài)的處理器引擎共同組成的超大規(guī)模的復(fù)雜芯片系統(tǒng)。

超異構(gòu)計(jì)算本質(zhì)上是系統(tǒng)芯片SOC(System on Chip),但準(zhǔn)確的定義應(yīng)該是宏系統(tǒng)芯片MSOC(Macro-System on Chip)。如果不能認(rèn)識到超異構(gòu)和傳統(tǒng)SOC的區(qū)別,那么則無法把握問題本質(zhì)。

站在系統(tǒng)的角度,傳統(tǒng)SOC是單系統(tǒng),而超異構(gòu)宏系統(tǒng),即多個(gè)系統(tǒng)整合到一起的大系統(tǒng)。傳統(tǒng)SOC和超異構(gòu)系統(tǒng)芯片的主要區(qū)別和聯(lián)系如下表所示。

8ba5c8e2-a606-11ed-bfe3-dac502259ad0.png

從DPU持續(xù)擴(kuò)展,成就廣義的DPU:

DPU成為一個(gè)靈活的SOC,既可以作為CPU/GPU的助手,也可以獨(dú)立工作。就像2.1節(jié)提到的DPU小系統(tǒng),但這個(gè)SOC系統(tǒng)規(guī)模較小,價(jià)值仍有待提高。

通過超異構(gòu),進(jìn)一步提升DPU的系統(tǒng)規(guī)模,讓DPU能夠覆蓋更多復(fù)雜計(jì)算場景。

自成一體,成就更大的價(jià)值。

當(dāng)然,這個(gè)時(shí)候,DPU的定義已經(jīng)無法覆蓋這個(gè)功能強(qiáng)大的處理器了,稱之為超異構(gòu)處理器HPU更合適一些。

2.4 多領(lǐng)域多場景的挑戰(zhàn),唯有開源開放

可支持的領(lǐng)域和場景包括:

網(wǎng)絡(luò)領(lǐng)域,包括VPC、EIP、LB、網(wǎng)關(guān)等場景;

存儲(chǔ)領(lǐng)域,包括本地存儲(chǔ)、分布式塊存儲(chǔ)、對象存儲(chǔ)、冷存儲(chǔ)等場景;

安全領(lǐng)域,包括網(wǎng)絡(luò)安全、數(shù)據(jù)加密、零信任、可信計(jì)算等場景;

虛擬化領(lǐng)域,包括計(jì)算機(jī)虛擬化管理、容器虛擬化管理、監(jiān)控、設(shè)備模擬、運(yùn)行時(shí)和熱遷移等具體場景;

甚至,可以包括應(yīng)用層的各類加速領(lǐng)域和場景。

這些領(lǐng)域和場景,每一個(gè)都涉及到非常強(qiáng)大的既有生態(tài),已經(jīng)有若干得到行業(yè)大范圍使用各類開源(或閉源)軟件。沒有任何一家芯片功能能夠“獨(dú)占”這些生態(tài),能做的,只有去擁抱既有生態(tài)。對芯片公司來說,要做的是:把傳統(tǒng)硬件定義軟件的模式,徹底的變成軟件定義硬件的模式。

另一方面,也需要軟件架構(gòu)和開放模式的改變,軟件需要原生支持硬件加速。在軟件設(shè)計(jì)的時(shí)候,控制平面和計(jì)算平面分離,可以支持計(jì)算平面既可以在軟件運(yùn)行,也可以下沉到硬件運(yùn)行。真正實(shí)現(xiàn)“軟件定義一切,硬件加速一切”。

8bbc6020-a606-11ed-bfe3-dac502259ad0.png

講完了單個(gè)領(lǐng)域和場景的視角,我們再回到整體系統(tǒng)的視角。

通常,我們是通過一些虛擬抽象層把硬件平臺(tái)的不一致性“烙平”,也即把差異化的硬件屏蔽,提供給上層軟件一致性的訪問接口。隨著性能需求的進(jìn)一步提升,虛擬化都完全沉淀到硬件加速。硬件平臺(tái)的接口則直接暴露給上層的VM和容器。軟件運(yùn)行平臺(tái)需要高可用,需要硬件支持軟件在不同平臺(tái)遷移,這樣就需要完全一致的硬件平臺(tái)。

這樣就會(huì)形成一對新的矛盾:

站在芯片廠家的視角,期望的是,一顆芯片,能夠被眾多廠家采用。也即是自己的硬件平臺(tái),很多用戶都采用。甚至,私心一點(diǎn),希望用戶捆綁到自己私有的架構(gòu)平臺(tái)上,讓用戶形成依賴。

站在用戶的視角,一方面是商業(yè)方面(不形成特定廠家依賴)的考慮,一方面是技術(shù)方面(即上面提到的跨硬件平臺(tái)遷移,需要硬件一致性)的考慮。用戶需要的是一致性的硬件平臺(tái)。即所有芯片供應(yīng)商提供給自己的是一個(gè)一致性的平臺(tái)。甚至可能的話,是自己軟件定義的硬件平臺(tái)。

因此,最終的結(jié)果,是芯片廠家和一些主流的客戶一起,形成行業(yè)共識,即形成一個(gè)開源開放的行業(yè)生態(tài)。

8bd80d66-a606-11ed-bfe3-dac502259ad0.png

基礎(chǔ)設(shè)施程序員開發(fā)套件 (IPDK) 是Intel發(fā)起的一個(gè)開源的、供應(yīng)商無關(guān)的驅(qū)動(dòng)程序和 API 框架,用于在 CPU、IPU、DPU 或交換機(jī)上運(yùn)行的基礎(chǔ)設(shè)施卸載和管理。IPDK在Linux中運(yùn)行,并使用一套完善的工具(如 SPDK、DPDK 和 P4)來啟用平臺(tái)中的網(wǎng)絡(luò)虛擬化、存儲(chǔ)虛擬化、工作負(fù)載供應(yīng)、信任根和卸載功能。2022年3月15日,由Intel、Redhat和F5等發(fā)起Open Programmable Infrastructure Event,邀請了產(chǎn)業(yè)界的相關(guān)公司共同探討IPU/DPU軟件生態(tài)建設(shè)。這些事件,可以認(rèn)為是行業(yè)巨頭在力推開源開放的整體生態(tài),并試圖在其中占據(jù)主導(dǎo)作用。

更長遠(yuǎn)的看,開源開放的生態(tài)是行業(yè)發(fā)展的大事情。在可預(yù)見的未來,這件事情會(huì)徹底改變IT行業(yè)的生態(tài)邏輯。國內(nèi)的廠商,不管是做DPU的,還是做CPU、GPU以及做AI芯片的,大家都應(yīng)快速跟進(jìn)、積極參與甚至引領(lǐng)這個(gè)開放可編程平臺(tái)和生態(tài)。雖然目前還只聚焦在DPU領(lǐng)域。

3 一些結(jié)論

DPU的未來發(fā)展如何?基于軟硬件融合理念,這里給出幾個(gè)關(guān)于未來五年行業(yè)發(fā)展的推斷,與大家探討:

DPU是超異構(gòu)計(jì)算時(shí)代來臨的一個(gè)起始;

未來所有(大)芯片都會(huì)是超異構(gòu)芯片;

超異構(gòu)和SOC是兩個(gè)完全不同的概念;

超異構(gòu)大芯片需要足夠通用,而不是專用;

超異構(gòu)需要開源開放的生態(tài);

要想駕馭超異構(gòu)的超大系統(tǒng)規(guī)模,就需要軟硬件融合。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    51600

    瀏覽量

    429920
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10951

    瀏覽量

    213948
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5109

    瀏覽量

    104519
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4832

    瀏覽量

    129797
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    375

    瀏覽量

    24372
收藏 人收藏

    評論

    相關(guān)推薦

    《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測評

    來說,DPU的應(yīng)用前景其實(shí)還是分為兩部分。一部分是基于云計(jì)算的,一部分是基于邊緣計(jì)算的。 1、邊緣計(jì)算 目前來說,基于邊緣計(jì)算的DPU計(jì)算還在發(fā)展,但是這里恰好是DPU的起源,當(dāng)然,從
    發(fā)表于 12-24 10:54

    2018年車聯(lián)網(wǎng)的發(fā)展現(xiàn)狀和發(fā)展機(jī)遇解讀

    我國車聯(lián)網(wǎng)的發(fā)展現(xiàn)狀是怎樣的?未來的發(fā)展機(jī)遇有哪些?車聯(lián)網(wǎng)是近年來很熱的一個(gè)話題,雖然我國車聯(lián)網(wǎng)還處在探索發(fā)展期,但是很多人對車聯(lián)網(wǎng)的發(fā)展
    發(fā)表于 01-23 16:17

    DVB-H接收器設(shè)計(jì)所面臨機(jī)遇和挑戰(zhàn)討論

    隨著數(shù)字移動(dòng)電視不斷向移動(dòng)設(shè)備的應(yīng)用轉(zhuǎn)移,應(yīng)用和系統(tǒng)工程師正面臨著各種挑戰(zhàn),比如外形尺寸的小型化、更低的功耗以及信號完整性。對現(xiàn)有移動(dòng)電視標(biāo)準(zhǔn)的研究重點(diǎn)將放在了DVB-H上。本文將從系統(tǒng)角度討論DVB-H接收器設(shè)計(jì)所面臨機(jī)遇
    發(fā)表于 07-08 07:35

    我國物聯(lián)網(wǎng)發(fā)展面臨什么困境

    都連接起來,并對遠(yuǎn)程物體加以識別與管理,從而對經(jīng)濟(jì)社會(huì)發(fā)展產(chǎn)生重大的影響。毫無疑問,物聯(lián)網(wǎng)將成為繼計(jì)算機(jī)、互聯(lián)網(wǎng)與移動(dòng)通信網(wǎng)之后的又一次信息產(chǎn)業(yè)浪潮。
    發(fā)表于 07-29 07:39

    國產(chǎn)模數(shù)轉(zhuǎn)換ADC芯片的現(xiàn)狀如何、會(huì)面臨什么困境和歷史機(jī)遇?

      如何把模擬信號轉(zhuǎn)換成數(shù)字信號呢?  針對各種的 ADC 芯片,如何快速區(qū)分和了解 ADC 芯片的性能的好壞呢?  什么是高端 ADC 芯片呢?  國內(nèi)做 ADC 的企業(yè)有哪些?  ?國產(chǎn) ADC 芯片產(chǎn)業(yè)的的現(xiàn)狀及機(jī)遇?
    發(fā)表于 03-11 07:55

    自主車載網(wǎng)絡(luò)面臨困境是什么?怎么解決?

    自主車載網(wǎng)絡(luò)面臨困境是什么?怎么解決?
    發(fā)表于 05-13 06:56

    DVB-H接收器設(shè)計(jì)所面臨機(jī)遇和挑戰(zhàn)是什么?

    本文將從系統(tǒng)角度討論DVB-H接收器設(shè)計(jì)所面臨機(jī)遇和挑戰(zhàn),并重點(diǎn)介紹射頻前端。
    發(fā)表于 06-02 06:35

    業(yè)內(nèi)首部白皮書《DPU技術(shù)白皮書》——中科院計(jì)算所主編

    本帖最后由 jf_35791075 于 2022-3-14 17:39 編輯 內(nèi)容提要 DPU(Data Processing Unit)是新近發(fā)展起來的一種專用處理器。2020年NVIDIA
    發(fā)表于 03-14 17:30

    專?數(shù)據(jù)處理器 (DPU) 技術(shù)??書

    發(fā)展歷程 161.4. DPU與CPU、GPU的關(guān)系 191.5. DPU的產(chǎn)業(yè)化機(jī)遇 212.DPU特征結(jié)構(gòu)232.1.
    發(fā)表于 03-14 17:35

    大禹智芯宣布加入歐拉開源社區(qū),助力構(gòu)建DPU行業(yè)發(fā)展新生態(tài)

    ,對社區(qū)積極做出自己的貢獻(xiàn),并與社區(qū)成員一道探索在DPU領(lǐng)域中的軟件生態(tài)發(fā)展。大禹智芯是注冊創(chuàng)立時(shí),即專注于做DPU的科技初創(chuàng)公司,是國內(nèi)領(lǐng)先的DPU企業(yè)。大禹智芯通過現(xiàn)有和自主研發(fā)的
    發(fā)表于 08-15 13:56

    什么是DPU

    什么是DPU? 相信很多人對于CPU(中央處理器)已經(jīng)非常熟悉了。靈活、響應(yīng)迅速的CPU多年來一直是大多數(shù)計(jì)算機(jī)中唯一的可編程元件。 近年來,GPU(圖形處理單元)逐漸成為了計(jì)算的中心。最初GPU
    發(fā)表于 11-03 10:55

    2022年中國DPU行業(yè)白皮書 DPU將成為CPU、GPU后的第三塊主力芯片

    本報(bào)告旨在分析 DPU 發(fā)展現(xiàn)狀、產(chǎn)品特點(diǎn)、技術(shù)動(dòng)向及發(fā)展趨勢,并識別中國芯片廠商與海外芯片廠商的差異,從而判斷中國DPU行業(yè)的現(xiàn)狀與發(fā)展
    的頭像 發(fā)表于 06-30 16:05 ?1.1w次閱讀
    2022年中國<b class='flag-5'>DPU</b>行業(yè)白皮書 <b class='flag-5'>DPU</b>將成為CPU、GPU后的第三塊主力芯片

    DPU技術(shù)解決方案的挑戰(zhàn)和機(jī)遇

    ,因此 DPU 產(chǎn)業(yè)發(fā)展與軟硬件市場的配合度存在強(qiáng)關(guān)聯(lián)。能否理解行業(yè)需求,拉通軟硬件形成完整解決方案成為 DPU 發(fā)展與落地的關(guān)鍵。
    的頭像 發(fā)表于 10-11 15:33 ?1939次閱讀

    中科馭數(shù)分享DPU在AI大模型時(shí)代下面臨機(jī)遇

    中科馭數(shù)正式加入“移動(dòng)云信息技術(shù)融合應(yīng)用創(chuàng)新產(chǎn)業(yè)生態(tài)聯(lián)合體”,創(chuàng)始人、CEO鄢貴海應(yīng)邀在“磐石算力底座”論壇圓桌對話發(fā)言,分享DPU在AI大模型時(shí)代下面臨機(jī)遇。
    的頭像 發(fā)表于 05-08 09:21 ?1346次閱讀

    中國DPU行業(yè)白皮書

    發(fā)展機(jī)遇。核心內(nèi)容摘要:1、DPU 將成為繼 CPU、GPU 的"第三塊主力芯片"DPU具備高度靈活可編程性,其功能可通過軟件定義向網(wǎng)絡(luò)、存儲(chǔ)、安全等應(yīng)用進(jìn)行延伸。
    發(fā)表于 07-07 15:59 ?37次下載