近日,中科馭數(shù)重磅發(fā)布第三代DPU芯片K2-Pro,是國內(nèi)首顆面向量產(chǎn)的全功能芯片!
K2-Pro采用自主研發(fā)的Kernel Processing Unit架構(gòu),集網(wǎng)絡(luò)、存儲、安全及計算等多業(yè)務(wù)卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網(wǎng)絡(luò)帶寬,具備高度可編程性,確保了系統(tǒng)的靈活擴展性,為數(shù)據(jù)中心的業(yè)務(wù)增長和算力擴容提供堅實基礎(chǔ)。在處理復(fù)雜任務(wù)時,K2-Pro相比上一代芯片能耗降低30%。
作為一款純國產(chǎn)的高性能解決方案, K2-Pro以其全面性能的均衡與卓越,成為數(shù)據(jù)中心戰(zhàn)場上的“六邊形戰(zhàn)士”,可廣泛適用于云計算、智能計算、及高性能計算等領(lǐng)域,也為數(shù)據(jù)中心的算力升級提供了全新解題思路。同時,K2-Pro也必將成為推動DPU芯片進入大規(guī)模量產(chǎn)的標桿之作。
自研KPU架構(gòu)和KISA指令集
用創(chuàng)新的體系結(jié)構(gòu)理論指導(dǎo)復(fù)雜的芯片架構(gòu)設(shè)計
對于中科馭數(shù)來說,DPU的研發(fā)之路上,架構(gòu)創(chuàng)新不是可選項,而是必選項。中科馭數(shù)在芯片研發(fā)領(lǐng)域持續(xù)深耕,從底層架構(gòu)入手,致力于解決DPU芯片面臨的高帶寬、低延遲及復(fù)雜業(yè)務(wù)需求挑戰(zhàn)的決心。
KPU架構(gòu)——專用計算代表性架構(gòu)
自主研發(fā)KPU芯片架構(gòu)是中科馭數(shù)多年體系結(jié)構(gòu)研究的結(jié)晶,基于軟件定義硬件的技術(shù)路線,創(chuàng)新性地提出了面向?qū)S糜嬎憬y(tǒng)一計算架構(gòu)KPU。該架構(gòu)采用異構(gòu)計算核作為基本單位,根據(jù)上層應(yīng)用的具體需求定制化設(shè)計,具有軟件可定義、超高并行處理能力、超強處理性能三大優(yōu)勢,配合數(shù)據(jù)流驅(qū)動的運算激活機制,確保了系統(tǒng)靈活性與高效運行的完美平衡,為DPU芯片設(shè)計打造新標桿。
KISA指令集——業(yè)界首個DPU指令集架構(gòu)
以此為基礎(chǔ),中科馭數(shù)進一步推出了首個專為DPU設(shè)計的指令集架構(gòu)——KISA,旨在解決專用計算領(lǐng)域編程范式的碎片化問題。不同于傳統(tǒng)的CPU指令集,KISA緊密貼合DPU的特性,強調(diào)數(shù)據(jù)處理而非控制流,高計算密度型而非低計算密度型,采用數(shù)據(jù)流而非字節(jié)作為基本操作單元。更重要的是,KISA首次在指令集層次支持敏捷異構(gòu),用一套統(tǒng)一的指令實現(xiàn)了多種異構(gòu)處理核進行管理調(diào)度。
目前,KISA指令集涵蓋了KISA基礎(chǔ)架構(gòu)、以及面向DPU專用處理擴展指令,包含包解析、轉(zhuǎn)發(fā)指令、以及表查詢指令等?;贙ISA已經(jīng)覆蓋25大類應(yīng)用場景,累計數(shù)百個用例,得到非常充分驗證。
KISA指令集的推出,將軟件定義技術(shù)路線向著更加可落地、可執(zhí)行的方向推進了一大步,系統(tǒng)性地解決了領(lǐng)域?qū)S糜嬎愕木幊谭妒交祀s的難題,讓開發(fā)變得更加簡單高效,讓每一行代碼直達DPU算力。
實用制勝,量產(chǎn)為王
K2-Pro何以稱為數(shù)據(jù)中心的“六邊形戰(zhàn)士”?
基于以上兩大底層技術(shù)創(chuàng)新,不僅打破了傳統(tǒng)DPU設(shè)計,更推動了DPU芯片向更高性能、更強靈活性和更低功耗方向發(fā)展。相較于單一性能的極致追求,中科馭數(shù)在DPU設(shè)計上秉持全面卓越的理念,致力于打造“全能冠軍”而非“單項冠軍”。
因此,K2-Pro在立項之初就把“實用制勝,量產(chǎn)為王”作為研發(fā)目標,確保技術(shù)創(chuàng)新與市場需求緊密結(jié)合。歷經(jīng)深度優(yōu)化以及融合了對數(shù)據(jù)中心未來中心場景的深入理解,K2-Pro最終實現(xiàn)以下六個方面的極致優(yōu)化:
K2-Pro是先進、好用的網(wǎng)絡(luò)芯片
對于DPU來說,首先是一個網(wǎng)卡,才能再談進一步拓展其復(fù)雜業(yè)務(wù)的處理能力。為此,中科馭數(shù)團隊在基礎(chǔ)網(wǎng)絡(luò)功能上苦下工夫,將K2-Pro打造成綜合能力強悍的網(wǎng)卡芯片。
一方面,在實現(xiàn)基礎(chǔ)網(wǎng)絡(luò)卸載功能上,K2-Pro集成了高通量DMA以及硬件虛擬化技術(shù),并通過豐富的軟件顯著增強了運維能力,這一進步在國產(chǎn)網(wǎng)卡領(lǐng)域中尤為突出,直接對標國外主流產(chǎn)品。
另一方面,K2-Pro著重在網(wǎng)絡(luò)延時、高階包處理能力上做了增強。通過優(yōu)化設(shè)計,K2-Pro將端到端網(wǎng)絡(luò)延遲控制在1.2微秒以下,處理帶寬達到200Gbps,做到業(yè)界領(lǐng)先水平,成功填補了國內(nèi)低延遲網(wǎng)卡市場的空白。
同時,結(jié)合其可編程的包處理引擎,K2-Pro打破了傳統(tǒng)網(wǎng)絡(luò)處理局限于二層包的框架,賦予用戶更高的靈活性去執(zhí)行包解析和深度數(shù)據(jù)分析任務(wù),根據(jù)自身需求設(shè)計特定的安全策略、流量優(yōu)化方案等等,讓用戶在硬件層面實現(xiàn)個性化配置,極大提升了數(shù)據(jù)中心網(wǎng)絡(luò)的智能化和定制化程度。
K2-Pro是高通量數(shù)據(jù)處理芯片
K2-Pro芯片,作為一款面向數(shù)據(jù)中心的高性能數(shù)據(jù)處理核心,其優(yōu)勢在于如何高效且有序地管理復(fù)雜多變的基礎(chǔ)設(shè)施層服務(wù)。
DPU業(yè)務(wù)里面有非常鮮明的特點:一是業(yè)務(wù)類型繁多且性質(zhì)各異,涵蓋網(wǎng)絡(luò)、存儲及各類用戶特定應(yīng)用,每種業(yè)務(wù)不僅要求精確解析,還需定制化處理邏輯,加之不同業(yè)務(wù)的處理時延各異,極易引發(fā)處理順序混亂等難題。二是并發(fā)級別極高,應(yīng)對千萬級別的數(shù)據(jù)流、管理動輒數(shù)百上千的虛擬機,是數(shù)據(jù)中心面臨的運營常態(tài)。三是對延遲高度敏感,與GPU的批處理加速模式不同,DPU要求在嚴格的時間窗口內(nèi)完成任務(wù),任何延誤都將導(dǎo)致數(shù)據(jù)丟失。
鑒于此,K2-Pro的高通量數(shù)據(jù)處理能力成為其核心競爭力,其背后的關(guān)鍵技術(shù)在于精細的流調(diào)度與隔離機制。經(jīng)過深入研究與優(yōu)化,K2-Pro從流的精準識別到并發(fā)處理能力均實現(xiàn)了顯著提升,確保在極端并發(fā)場景下仍能維持高水平性能,幾乎不受流量洪峰影響。最終做到了在承載千萬級并發(fā)流、服務(wù)上千租戶、處理千萬級流表及數(shù)十種不同租戶配置的復(fù)雜業(yè)務(wù)之下,穩(wěn)定輸出200Gbps數(shù)據(jù)吞吐率及40Mpps包處理能力的領(lǐng)先性能,讓數(shù)據(jù)處理更加“游刃有余”。
K2-Pro是強業(yè)務(wù)卸載芯片
在復(fù)雜的云服務(wù)環(huán)境中,尤其是面對如服務(wù)網(wǎng)格這類高控制復(fù)雜度的業(yè)務(wù),現(xiàn)有DPU技術(shù)往往難以有效承擔,其業(yè)務(wù)卸載效率低下,通常不足20%。業(yè)界普遍采取的應(yīng)對策略是增強控制層面的資源配置,極端時甚至采用服務(wù)器級CPU來維系控制功能。但這不僅未能從根本上改善服務(wù)質(zhì)量和降低延遲問題,反而可能導(dǎo)致資源浪費。
基于上述挑戰(zhàn),中科馭數(shù)團隊一直認為DPU必須輕控制,而非盲目追求與CPU相匹敵的控制能力。在此理念指導(dǎo)下,K2-Pro在設(shè)計上實現(xiàn)了多項關(guān)鍵技術(shù)突破,包括但不限于精密的流調(diào)度技術(shù)、高效數(shù)據(jù)交互協(xié)議,以及專門設(shè)計的網(wǎng)絡(luò)卸載、表項卸載、存儲卸載、RDMA卸載等重要引擎,將原本在DPU上難以卸載的業(yè)務(wù)比例從低于20%顯著提升至90%以上,大幅減輕了控制面的壓力。
服務(wù)治理場景下,K2-Pro也實現(xiàn)了量級的躍遷,將原先400us以上的治理延時降到了30us以內(nèi),顯著優(yōu)于當前市場上的解決方案,為確保高性能、低延遲的云服務(wù)環(huán)境提供了強大的技術(shù)支持。
K2-Pro是靈活可擴展處理芯片
雖然DPU出現(xiàn)時間不長,但是它的潛力在加速顯現(xiàn)。隨著更多業(yè)務(wù)向DPU轉(zhuǎn)移,以及協(xié)議迭代和任務(wù)類型的增加,DPU的擴展能力成為關(guān)鍵。因此,K2-Pro芯片在三個維度上實現(xiàn)了獨特性的可擴展性設(shè)計,讓業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴展:
可編程與卸載能力:K2-Pro自身不僅配備了高性能的可編程引擎,還融入了協(xié)議分析引擎(PPP)與通用算法引擎(CAE),確保了對不斷演進的協(xié)議和復(fù)雜算法的有效支持。中科馭數(shù)在金融領(lǐng)域做過一個嘗試,通過全面卸載特定的金融通信協(xié)議和業(yè)務(wù)算法至DPU,性能相比現(xiàn)有方案提升了十倍以上,刷新了行業(yè)認知。
芯片級聯(lián)與算力自由擴展:為滿足日益增長的算力需求,中科馭數(shù)創(chuàng)新設(shè)計了DPU間的高速互聯(lián)技術(shù),支持芯片級聯(lián),使多個DPU能夠無縫串聯(lián),實現(xiàn)DPU算力自由擴展。這一方案與行業(yè)標準接軌,為大規(guī)模數(shù)據(jù)中心的算力部署提供了高效路徑。舉例而言,通過多芯互聯(lián),能夠輕松部署高性能的NAT網(wǎng)關(guān)解決方案,為數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)升級和業(yè)務(wù)擴展打開了新的可能性。
開放的外接算力集成策略:K2-Pro還致力于與其他類型算力芯片的協(xié)同工作,提供了多元化的集成方案,既展現(xiàn)了DPU在構(gòu)建綜合性解決方案中的靈活性,也預(yù)示著未來將有更多跨領(lǐng)域的創(chuàng)新合作案例涌現(xiàn),進一步拓寬DPU的應(yīng)用邊界。如中科馭數(shù)在與安全芯片廠商的合作中,共同打造了處理能力達到百Gbps級別的安全解決方案。
K2-Pro是穩(wěn)如磐石的“管理”芯片
DPU在一般認知中常被視作輔助或“副手”角色,負責任務(wù)卸載,然而實際上,它在數(shù)據(jù)中心扮演著更為關(guān)鍵的主角身份。DPU不僅參與虛機的生命周期管理、資源調(diào)配等核心任務(wù),還必須保證全天候穩(wěn)定運行,是數(shù)據(jù)中心最中心的處理核心。
中科馭數(shù)對穩(wěn)定性給予了高度重視,對K2-Pro進行了深度優(yōu)化:納秒至毫秒級的分級異?;謴?fù)機制確??焖夙憫?yīng);系統(tǒng)與核心間的異常隔離設(shè)計,即使內(nèi)部模擬攻防,也能維持運行不中斷。配備的實時狀態(tài)監(jiān)測系統(tǒng),對芯片內(nèi)每個數(shù)據(jù)包、每個子系統(tǒng)的狀態(tài)進行不間斷監(jiān)測,及時發(fā)現(xiàn)并預(yù)警潛在問題,實現(xiàn)了芯片內(nèi)每個環(huán)節(jié)的全天候精準監(jiān)控。截至目前,這種級別的監(jiān)測精細度和系統(tǒng)穩(wěn)定性在同類DPU產(chǎn)品中尚屬罕見。
K2-Pro是極致能效比的網(wǎng)絡(luò)芯片
能耗考驗也是DPU在設(shè)計時面臨著的又一大難題。盡管DPU承擔的任務(wù)遠超傳統(tǒng)網(wǎng)卡,但在服務(wù)器架構(gòu)中,其安裝位置和功耗預(yù)算仍舊受限,類似于網(wǎng)卡的配置要求。鑒于此,中科馭數(shù)團隊深知,要想實現(xiàn)DPU的廣泛應(yīng)用,必須在能效比上取得突破。
中科馭數(shù)不僅采用了諸多成熟的低功耗技術(shù),更從應(yīng)用層面進行了深度優(yōu)化,通過精細的電源管理策略,實現(xiàn)了在不影響性能的前提下,對芯片面積和運行頻率的精準調(diào)控,這一過程雖充滿挑戰(zhàn),近乎苛刻,卻也體現(xiàn)了團隊對技術(shù)極限的不懈追求。最終,DPU在多種應(yīng)用場景下展現(xiàn)出了顯著的能效優(yōu)勢,相比上一代功耗降低30%,與國際DPU產(chǎn)品相比也有更為出色的能效表現(xiàn),為DPU的大規(guī)模部署奠定了堅實的能效基礎(chǔ)。
中科馭數(shù)高級副總裁、CTO盧文巖博士表示,正是我們堅持自主研發(fā),突破技術(shù)壁壘,我們才能開發(fā)出自主知識產(chǎn)權(quán)的KPU架構(gòu)與KISA指令集,為DPU領(lǐng)域貢獻了我們的創(chuàng)新成果;正是這份對六個關(guān)鍵領(lǐng)域“死磕到底”的決心,我們才能在造“芯”路上厚積薄發(fā),見證這個數(shù)據(jù)中心“六邊形戰(zhàn)士”的誕生;也正是我們堅持技術(shù)與市場的緊密結(jié)合,將量產(chǎn)與應(yīng)用視為同等重要,我們才能見證K2-Pro成為了一款真正可落地、可推廣的高性能DPU芯片。相信K2-Pro的問世,將會是數(shù)據(jù)中心算力技術(shù)革新的重要里程碑。期待見到它走向各行各業(yè),未來在數(shù)據(jù)中心乘風揚帆,在算力征途上破浪前行!
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
455文章
50851瀏覽量
423981 -
DPU
+關(guān)注
關(guān)注
0文章
363瀏覽量
24198 -
算力
+關(guān)注
關(guān)注
1文章
983瀏覽量
14835
發(fā)布評論請先 登錄
相關(guān)推薦
評論