2023年6月,第三屆網(wǎng)絡(luò)開源技術(shù)生態(tài)峰會在北京成功召開。中科馭數(shù)高級副總裁、CTO盧文巖博士受邀出席本屆峰會,并在活動主論壇分享題為《P4可編程的DPU 讓算網(wǎng)生態(tài)更加開放融合》的主題演講。
■數(shù)據(jù)中心“稅”與異網(wǎng)融合“稅”是當(dāng)前算網(wǎng)生態(tài)的兩大痛點(diǎn)
算力,毫無疑問是當(dāng)前數(shù)字經(jīng)濟(jì)發(fā)展的核心增長力,已經(jīng)成為像水、電、網(wǎng)一樣的基礎(chǔ)性生產(chǎn)要素,事關(guān)到整個核心要素的升級,是驅(qū)動經(jīng)濟(jì)社會數(shù)字化轉(zhuǎn)型的新引擎。 演講伊始,盧文巖博士簡要介紹了針對當(dāng)前業(yè)界普遍達(dá)成共識的分層算力網(wǎng)絡(luò)結(jié)構(gòu),并表示統(tǒng)籌云、網(wǎng)、邊、端于一體的新一代計算技術(shù)已成為算力網(wǎng)絡(luò)的發(fā)展方向。 最上層的云層是各類云計算平臺和云服務(wù)提供商,提供大規(guī)模的計算和存儲資源;網(wǎng)層提供云之間的高速連接;邊層位于離用戶和數(shù)據(jù)源更近的位置,提供低延遲、高可用性的計算和存儲服務(wù);端層是接入側(cè)的設(shè)備,是數(shù)據(jù)的產(chǎn)生和接入點(diǎn)。這一分層結(jié)構(gòu)使得算力網(wǎng)絡(luò)能夠滿足不同應(yīng)用場景的需求,實(shí)現(xiàn)云、網(wǎng)、邊、端的協(xié)同工作。 這一算力網(wǎng)絡(luò)架構(gòu),在發(fā)展過程中面臨著數(shù)據(jù)中心“稅”與異網(wǎng)融合“稅”兩大痛點(diǎn)。前者是指在現(xiàn)在的基礎(chǔ)設(shè)施架構(gòu)中,虛擬化管理和網(wǎng)絡(luò)需要占據(jù)很多CPU資源。以某公有云廠商網(wǎng)絡(luò)增強(qiáng)型云主機(jī)為例,基于2x25G普通網(wǎng)卡,24核CPU中4核用于虛擬網(wǎng)絡(luò)功能,1核用于虛擬化管理功能,可用CPU資源不足80%。 而后者的痛點(diǎn)則在于異網(wǎng)融合的過程中,往往需要解決沉重的歷史包袱,不同網(wǎng)絡(luò)協(xié)議之間的通信需要大量專用的網(wǎng)絡(luò)設(shè)備完成相應(yīng)的轉(zhuǎn)換,隨著算網(wǎng)規(guī)模的擴(kuò)大,不僅增加了網(wǎng)絡(luò)管理的復(fù)雜性,還限制了算力網(wǎng)絡(luò)的靈活性和可擴(kuò)展性。
這些挑戰(zhàn)和限制,在來自云廠商和芯片廠商的行業(yè)專家的演講中也得到了回應(yīng),他們結(jié)合各家實(shí)踐經(jīng)驗(yàn),給出了更為具體的闡述。 中國移動研究院副院長段曉東指出,智算中心的發(fā)展是整個算力網(wǎng)絡(luò)體系架構(gòu)發(fā)展的重中之重,如何構(gòu)筑一個區(qū)別于傳統(tǒng)運(yùn)營中心的新型智算中心,在算、存、網(wǎng)、管、效五個方面都有很大的提升和不同。傳統(tǒng)的數(shù)據(jù)中心以CPU為核心的單機(jī)雙路到GPU為核心的八卡互聯(lián),總線結(jié)構(gòu)發(fā)生了飛躍變化。存儲也從結(jié)構(gòu)化單一到混合協(xié)議存儲大量非結(jié)構(gòu)數(shù)據(jù)。網(wǎng)絡(luò)技術(shù)更重要,從普通以太網(wǎng)以10G、20G為核心,現(xiàn)在躍遷到200-400G。異構(gòu)算力、算力原生,已經(jīng)成為非常重要的訴求。 騰訊云與邊緣網(wǎng)絡(luò)技術(shù)總監(jiān)陳煒先生在談到騰訊云在算力網(wǎng)絡(luò)方面的實(shí)踐時提及,進(jìn)入大AI模型時代,整個機(jī)房對電和算力的基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)帶來了新的挑戰(zhàn)。堆砌GPU集群,已不再意味著能充分釋放算力。極端情況下,網(wǎng)絡(luò)通信時延會占據(jù)整個一次模型訓(xùn)練50%的時間,是非常驚人的數(shù)字。同時丟包給整個的網(wǎng)絡(luò)的吞吐,也會帶來50%的下降。 英特爾資深云網(wǎng)絡(luò)技術(shù)專家丁曉艷也表示當(dāng)前最大的瓶頸在于,隨著算網(wǎng)融合、算力運(yùn)算等各種云網(wǎng)絡(luò)、邊緣網(wǎng)絡(luò)新應(yīng)用的發(fā)展,以Tofino為代表的P4交換機(jī)無法應(yīng)對隨之而來的帶寬需求,對于延時和抖動也無法得到保證。
■DPU是下一代“算力網(wǎng)絡(luò)”的核心算力芯片
為了解決當(dāng)前算網(wǎng)生態(tài)面臨的問題,靈活可編程的網(wǎng)絡(luò)接入設(shè)備是解決此類問題的一個最優(yōu)解。因此,DPU(Data Processing Unit)作為下一代"算力網(wǎng)絡(luò)"的核心算力芯片應(yīng)運(yùn)而生,能夠從硬件層面直接解決底層基礎(chǔ)設(shè)施層面臨的關(guān)鍵問題。 盧文巖博士指出,DPU本質(zhì)上是一個可編程的Switch,中科馭數(shù)在兩年前就發(fā)現(xiàn)了P4的魅力所在,并在DPU芯片功能定義的研發(fā)階段布局了P4技術(shù)。到現(xiàn)在為止,中科馭數(shù)DPU芯片已全面支持P4編程,能夠在數(shù)據(jù)中心、網(wǎng)絡(luò)邊緣和終端設(shè)備上提供了更大的靈活性和可擴(kuò)展性;圍繞DPU構(gòu)建的軟件開發(fā)平臺HADOS,也可以為P4提供完善的技術(shù)支撐,加速P4技術(shù)在SDN網(wǎng)絡(luò)中的研發(fā)落地應(yīng)用。
P4可編程的DPU優(yōu)勢,首先在于高性能,整個執(zhí)行下沉到專用硬件邏輯之中,可以有效提升系統(tǒng)的執(zhí)行效率和處理能力;其次是高度可編程,當(dāng)前算網(wǎng)融合過程中需要解決各類網(wǎng)絡(luò)協(xié)議的轉(zhuǎn)化和融合問題,DPU具備可編程能力可支撐自定義的場景、支持自定義協(xié)議棧快速開發(fā);第三是低數(shù)據(jù)中心“稅”,網(wǎng)絡(luò)數(shù)據(jù)面處理完全下沉后可以大幅度降低現(xiàn)有數(shù)據(jù)中心的數(shù)據(jù)“稅”,P4 runtime管控面也可以下沉到DPU,進(jìn)一步釋放服務(wù)器算力。 針對傳統(tǒng)P4技術(shù)在有狀態(tài)卸載、多功能核融合兩方面存在的缺陷,盧文巖博士著重介紹了中科馭數(shù)第三代DPU芯片K2 Pro,并對其中網(wǎng)絡(luò)架構(gòu)的處理核展開詳細(xì)展開說明——K2 Pro在芯片內(nèi)部專門集成了可編程網(wǎng)絡(luò)處理引擎以及專用數(shù)據(jù)分析引擎,不僅可以高效地完成數(shù)據(jù)增刪改查、甚至更復(fù)雜的操作,更主要的目的——支持有狀態(tài)的信息存儲和查詢,有效提升DPU芯片的性能、靈活性和資源利用效率。
■DPU P4技術(shù)將為算力網(wǎng)絡(luò)提供堅(jiān)實(shí)的可編程底座 對于DPU P4技術(shù)在算網(wǎng)領(lǐng)域的落地場景,盧文巖博士也作了進(jìn)一步闡述。DPU P4技術(shù)的可編程性和靈活性,使得其在網(wǎng)關(guān)、服務(wù)器端、防火墻和比較協(xié)議等場景的應(yīng)用中具備更大的優(yōu)勢,網(wǎng)絡(luò)設(shè)備能夠根據(jù)實(shí)際需求動態(tài)調(diào)整和配置網(wǎng)絡(luò)協(xié)議,實(shí)現(xiàn)更高效、智能的數(shù)據(jù)處理和網(wǎng)絡(luò)管理。這一特點(diǎn)將為這些應(yīng)用場景帶來更好的性能、安全性和可靠性。 以分布式NAT網(wǎng)關(guān)為例,當(dāng)前公有云/混合云/私有云在與邊緣云對接的場景中,受限于各地不同接入條件,存在大量需要NAT轉(zhuǎn)換場景。傳統(tǒng)方案中往往使用專有網(wǎng)關(guān)設(shè)備實(shí)現(xiàn),成本高、性能差。DPU P4解決方案能夠靈活支持各種動態(tài)與靜態(tài)地址轉(zhuǎn)換需求?;诟咝阅苡布?,性能提升4倍以上;支持分布式網(wǎng)關(guān)部署,可以根據(jù)業(yè)務(wù)情況動態(tài)調(diào)整;網(wǎng)關(guān)DPU與服務(wù)器DPU采用相同硬件,可以更好的保護(hù)硬件投資。
本屆網(wǎng)絡(luò)開源技術(shù)生態(tài)峰會由中國通信學(xué)會指導(dǎo),中國通信學(xué)會開源技術(shù)委員會、江蘇省未來網(wǎng)絡(luò)創(chuàng)新研究院主辦,SDNLAB社區(qū)、阿里云計算有限公司協(xié)辦。主論壇深入探討了網(wǎng)絡(luò)開源技術(shù)的發(fā)展趨勢和未來的挑戰(zhàn),激發(fā)了新的思考和創(chuàng)新。相信通過共同努力,DPU P4技術(shù)將為算網(wǎng)生態(tài)的開放融合帶來新的可能性,推動算力網(wǎng)絡(luò)的發(fā)展和創(chuàng)新,為未來的數(shù)字化社會提供更強(qiáng)大、更可靠的算力支持。
責(zé)任編輯:彭菁
-
存儲
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85851 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8740瀏覽量
61782 -
開源技術(shù)
+關(guān)注
關(guān)注
0文章
389瀏覽量
7934
原文標(biāo)題:P4可編程的DPU 讓算網(wǎng)生態(tài)更加開放融合!|第三屆網(wǎng)絡(luò)開源技術(shù)生態(tài)峰會
文章出處:【微信號:yusurtech,微信公眾號:馭數(shù)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論