久久婷婷国产一区二区三区,精品国产三级a∨在线,亚洲性色一二三区

從應(yīng)用特征來看，可以把應(yīng)用分為“IO密集型”和“計(jì)算密集型”兩類，如下圖所示。IO密集型應(yīng)用，通常體現(xiàn)為較高的輸入和輸出帶寬，數(shù)據(jù)直接來自于IO，數(shù)據(jù)通常具備流式特征，數(shù)據(jù)局部性不顯著，如果處理性能與帶寬匹配，片上緩存的作用就可以弱化。例如處理路由轉(zhuǎn)發(fā)、數(shù)據(jù)加密、壓縮等。計(jì)算密集型應(yīng)用，體現(xiàn)為較高的計(jì)算密度，通常浮點(diǎn)性能突出，數(shù)據(jù)來自主存，數(shù)據(jù)局部性顯著，復(fù)用性高，主存的大小對(duì)于問題求解的性能有直接影響。例如求解線性代數(shù)方程組，大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練、推理等。

圖不同類型的處理器的特征結(jié)構(gòu)

一個(gè)處理器芯片是“IO密集”還是“計(jì)算密集”只部分決定了芯片的結(jié)構(gòu)特征，并不能完全定義芯片的主體架構(gòu)。無論是IO密集，還是計(jì)算密集，即可以以通用CPU為核心構(gòu)造主體計(jì)算架構(gòu)，也可以以專用加速器為核心構(gòu)造主體計(jì)算架構(gòu)。前者可稱之為以控制為中心（control-centric）的模式，后者稱之為以數(shù)據(jù)為中心（data-centric）的模式。控制為中心的核心是實(shí)現(xiàn)“通用”，數(shù)據(jù)為中心的核心是通過定制化實(shí)現(xiàn)“高性能”。以應(yīng)用特征和架構(gòu)特征這兩個(gè)維度粗略劃分處理器芯片類型分布，如圖2-1所示。

通用CPU是偏向于控制為中心結(jié)構(gòu)，理論上看就是要“圖靈完備”，要支持完備的指令集，通過編程指令序列來定義計(jì)算任務(wù)，通過執(zhí)行指令序列來完成計(jì)算任務(wù)，因此具備極其靈活的編程支持，可以任意定義計(jì)算的邏輯實(shí)現(xiàn)“通用”——這也是CPU最大的優(yōu)勢(shì)。同時(shí)，為了提高編程的開發(fā)效率，降低編譯器復(fù)雜度，緩存管理和細(xì)粒度并行度的開發(fā)通常都是由硬件來完成。類似的，還有大量的用于各種嵌入式、移動(dòng)設(shè)備的微控制器 MCU，并不強(qiáng)調(diào)高帶寬，也是以控制為中心的結(jié)構(gòu)。NP，DSP也是便向于基于通用處理器來做專用化擴(kuò)展，但是非常注重高通量的性能屬性。例如，NP要支持?jǐn)?shù)Tbps的轉(zhuǎn)發(fā)帶寬，所以大體可以視為控制為中心、但是IO密集的處理器類型。

GPU是以數(shù)據(jù)為中心的結(jié)構(gòu)，形式上更傾向于專用加速器。GPU的結(jié)構(gòu)稱之為數(shù)據(jù)并行（data-parallel）結(jié)構(gòu)，優(yōu)化指令并行度并不是提升性能的重點(diǎn)，通過大規(guī)模同構(gòu)核進(jìn)行細(xì)粒度并行來消化大的數(shù)據(jù)帶寬才是重點(diǎn)。例如，最新的NVIDIA TITAN RTX GPU有4608個(gè)CUDA核、576個(gè)Tensor核，而且單片GPU通常配置數(shù)十GB的超大顯存。同時(shí)緩存管理多采用軟件顯示管理，降低硬件復(fù)雜度。這類超眾核結(jié)構(gòu)是以數(shù)據(jù)為中心、執(zhí)行計(jì)算密集型任務(wù)的代表性架構(gòu)。

DPU也偏向于數(shù)據(jù)為中心的結(jié)構(gòu)，形式上集成了更多類別的專用加速器，犧牲一定的指令靈活性以獲得更極致的性能。但是與GPU不同，DPU要應(yīng)對(duì)更多的網(wǎng)絡(luò)IO，既包括外部以太網(wǎng)，也包括內(nèi)部虛擬IO，所以DPU所面臨的數(shù)據(jù)并行更多可能是數(shù)據(jù)包并行，而不是圖像中的像素、像塊級(jí)并行。而且DPU也會(huì)配置少數(shù)通用核（如ARM，MIPS）來處理一定的控制面的任務(wù)，運(yùn)行輕量級(jí)操作系統(tǒng)來管理DPU上的眾多的異構(gòu)核資源，所以體現(xiàn)了一定“通用”性，但性能優(yōu)勢(shì)主要不源于這些通用核，而是大量專用計(jì)算核。早期的一些網(wǎng)絡(luò)處理器采用過類似Tile64的通用眾核結(jié)構(gòu)，以增加核的數(shù)量來應(yīng)對(duì)多路處理的數(shù)據(jù)，實(shí)現(xiàn)并發(fā)處理，但單路延遲性能通常都比較差。因此，DPU更偏向于以數(shù)據(jù)為中心，執(zhí)行IO密集任務(wù)。

DPU是軟件定義的技術(shù)路線下的重要產(chǎn)物。在軟件定義網(wǎng)絡(luò)中，將數(shù)據(jù)面與控制面分離是最核心的思想。DPU被定義為強(qiáng)化了數(shù)據(jù)面性能的專用處理器，配合控制面的CPU，可以實(shí)現(xiàn)性能與通用性的更佳的平衡。

來源：專用數(shù)據(jù)處理器（DPU）技術(shù)白皮書，中國(guó)科學(xué)院計(jì)算技術(shù)研究所，鄢貴海等

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

DPU

DPU

+關(guān)注

關(guān)注
0

文章
363

瀏覽量
24198

評(píng)論

相關(guān)推薦

安謀科技發(fā)布“玲瓏”DPU和新一代VPU

安謀科技（中國(guó)）有限公司在自研技術(shù)道路上再邁堅(jiān)實(shí)步伐，近日震撼發(fā)布首款“玲瓏”系列DPU（數(shù)據(jù)處理單元）及新一代VPU（視頻處理單元）。此次

發(fā)表于 09-24 14:33 ?309次閱讀

OMAP5912應(yīng)用處理器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《OMAP5912應(yīng)用處理器數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 08-07 09:16 ?0次下載

OMAP5912應(yīng)<b class='flag-5'>用處理器</b><b class='flag-5'>數(shù)據(jù)</b>表

中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實(shí)際應(yīng)用

的探索與實(shí)踐”專題論壇，業(yè)內(nèi)DPU專家們將討論焦點(diǎn)鎖定在了DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實(shí)際應(yīng)用，深入探討了如何利用DPU技術(shù)解決計(jì)算系統(tǒng)級(jí)問題，進(jìn)一步推動(dòng)了

發(fā)表于 08-02 11:21 ?716次閱讀

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

數(shù)據(jù)中心的第三顆“主力芯片”，主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)、安全等處理性能，助力服務(wù)器運(yùn)行效率顯著提升，有效降低成本。因此，

發(fā)表于 07-24 15:32

中科馭數(shù)：DPU是構(gòu)建高效智算中心基礎(chǔ)設(shè)施的必選項(xiàng)

先生在《基于DPU的高效智算中心算力底座》主題分享中提出，大模型等智算業(yè)務(wù)推動(dòng)算力需求規(guī)?？焖僭鲩L(zhǎng)，CPU+GPU+DPU的新型計(jì)算節(jié)點(diǎn)架構(gòu)已成為高效智算中心的標(biāo)準(zhǔn)配置，

發(fā)表于 07-08 10:51 ?712次閱讀

中科馭數(shù)發(fā)布第三代DPU芯片K2 Pro，較上一代能耗降低30%

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近日，中科馭數(shù)（北京）科技有限公司（以下簡(jiǎn)稱“中科馭數(shù)”）在北京發(fā)布了關(guān)于DPU（指數(shù)據(jù)處理器芯片）的一套核心技術(shù)，包括國(guó)內(nèi)首顆量產(chǎn)全功能DPU芯片K2P

發(fā)表于 07-01 07:32 ?3579次閱讀

中科馭數(shù)CEO鄢貴海：從計(jì)算系統(tǒng)的三個(gè)視角重新審視DPU的核心價(jià)值

如何找準(zhǔn)價(jià)值定位？而中科馭數(shù)作為國(guó)內(nèi)DPU先行者，又將如何解題，引領(lǐng)DPU行業(yè)進(jìn)入到一個(gè)全新的高度？ 6月19日，在中科馭數(shù)2024產(chǎn)品發(fā)布會(huì)上，中科馭數(shù)CEO鄢貴海發(fā)表了《重新定義DPU

發(fā)表于 06-28 14:27 ?486次閱讀

芯片軟件全上陣 DPU“全家桶”來了！中科馭數(shù)成功舉辦2024產(chǎn)品發(fā)布會(huì)

6月19日，中科馭數(shù)2024產(chǎn)品發(fā)布會(huì)在北京中關(guān)村展示中心正式舉辦。聚焦自研DPU核心技術(shù)，中科馭數(shù)重磅發(fā)布最新一代DPU芯片K2 Pro、軟件開發(fā)平臺(tái)HADOS、以及

發(fā)表于 06-23 11:09 ?864次閱讀

中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

在信息技術(shù)領(lǐng)域，每一次芯片技術(shù)的突破都代表著行業(yè)的一次飛躍。近日，DPU領(lǐng)域的領(lǐng)軍企業(yè)中科馭數(shù)宣布，成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布，標(biāo)志著中科馭

發(fā)表于 06-21 11:41 ?784次閱讀

芯啟源DPU賦能綠色數(shù)據(jù)中心，助力實(shí)現(xiàn)雙碳戰(zhàn)略

近日，深圳市計(jì)算機(jī)行業(yè)協(xié)會(huì)在南山區(qū)前海自貿(mào)區(qū)的博大數(shù)據(jù)深圳前海智算中心成功舉辦了“新質(zhì)生產(chǎn)力產(chǎn)品與AIPC應(yīng)用與挑戰(zhàn)技術(shù)交流會(huì)”。芯啟源助理副總裁顧宏波受邀分享《DPU賦能綠色數(shù)據(jù)中心

發(fā)表于 06-13 09:53 ?596次閱讀

DPU技術(shù)賦能下一代AI算力基礎(chǔ)設(shè)施

4月19日，在以“重構(gòu)世界奔赴未來”為主題的2024中國(guó)生成式AI大會(huì)上，中科馭數(shù)作為DPU新型算力基礎(chǔ)設(shè)施代表，受邀出席了中國(guó)智算中心創(chuàng)新論壇，發(fā)表了題為《以網(wǎng)絡(luò)為中心的AI算力底

發(fā)表于 04-20 11:31 ?859次閱讀

明天線上見！DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布！

算力，是數(shù)字經(jīng)濟(jì)時(shí)代的新質(zhì)生產(chǎn)力。隨著人工智能、智算中心建設(shè)等需求不斷拓展，DPU在各行各業(yè)數(shù)據(jù)中心的應(yīng)用逐步深入。異構(gòu)算力代表DPU在新質(zhì)生產(chǎn)力建設(shè)中，能否給出別開生面的答案，應(yīng)戰(zhàn)算

發(fā)表于 04-03 18:12 ?1007次閱讀

芯來科技正式發(fā)布首款專用處理器產(chǎn)品線Nuclei Intelligence系列

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布首款針對(duì)人工智能應(yīng)用的專用處理器產(chǎn)品線Nuclei Intelligence(NI)系列，以及NI系列的第一款A(yù)I

發(fā)表于 02-26 10:15 ?1290次閱讀

芯來科技發(fā)布AI專用RISC-V處理器內(nèi)核NI900系列

在AI技術(shù)迅速發(fā)展的當(dāng)下，RISC-V CPU IP領(lǐng)域的領(lǐng)軍企業(yè)芯來科技，正式發(fā)布了針對(duì)人工智能應(yīng)用的專用處理器產(chǎn)品線——Nuclei Intelligence (NI)系列。作為該系列的首款產(chǎn)品，NI900

發(fā)表于 02-26 09:36 ?778次閱讀

FPGA-Based DPU網(wǎng)卡的發(fā)展和應(yīng)用

采用單芯片的SoC形態(tài)，兼顧性能和功耗。FPGA-Based DPU在硬件設(shè)計(jì)上的挑戰(zhàn)主要來自芯片面積和功耗。

發(fā)表于 02-23 14:40 ?2100次閱讀