0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU內(nèi)存或GPU內(nèi)存進行分組方式實戰(zhàn)

Dbwd_Imgtec ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-05-03 09:01 ? 次閱讀

CPU+GPU協(xié)同計算中,CPU和GPU的計算能力不同,靜態(tài)地給CPU和GPU劃分任務(wù)會導(dǎo)致CPU和GPU計算不同步,導(dǎo)致嚴重的負載不均衡,為了實現(xiàn)CPU和GPU的負載均衡,需要對CPU和GPU不同的劃分方法。把每個節(jié)點上的所有CPU看成一個設(shè)備,每塊GPU卡看成一個設(shè)備,對集群節(jié)點上的所有CPU設(shè)備和GPU設(shè)備分別編號,每個節(jié)點上有M塊GPU卡,N個節(jié)點上共有N個CPU設(shè)備,編號為1,2,…,N;N個節(jié)點上共有M*N個GPU設(shè)備,編號為1,2,…,M*N。

設(shè)備編號之后就可以對設(shè)備進行分組,根據(jù)算法的要求,有些任務(wù)不能細分,一個CPU設(shè)備或GPU設(shè)備上可用的內(nèi)存空間可能不能滿足計算的內(nèi)存要求,需要多設(shè)備數(shù)據(jù)劃分、共同計算,這時需要根據(jù)CPU內(nèi)存或GPU內(nèi)存進行分組

1)根據(jù)CPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的CPU設(shè)備數(shù)目為GC個, GC=(Mcom+MemC-1)/MemC,其中一個節(jié)點的內(nèi)存大小為MemC,每個計算任務(wù)需要的內(nèi)存大小為Mcom。

所有的CPU設(shè)備分為N/GC個組,每個組計算同一個任務(wù),組內(nèi)的CPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)的劃分,因為組內(nèi)的CPU設(shè)備計算能力一致;

2)根據(jù)GPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的GPU設(shè)備數(shù)目為GG個, GG=(Mcom+MemG-1)/Mem,其中,一個GPU設(shè)備的內(nèi)存大小為MemG,每個計算任務(wù)需要的內(nèi)存大小為Mcom。

所有的GPU設(shè)備分為M*N/GG個組,每個組計算同一個任務(wù),組內(nèi)的GPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)劃分的方法。

CPU和GPU設(shè)備分組之后,就可以把任務(wù)動態(tài)分劃分給每個CPU組或GPU組,可以采用MPI通信進行劃分,由主進程進行動態(tài)的發(fā)送任務(wù)編號給各個CPU組或GPU組內(nèi)的組長,組長再把任務(wù)編號廣播給組內(nèi)的組員,然后組內(nèi)的設(shè)備同時計算,計算完畢之后即可向主進程請求下一個任務(wù),直到所有任務(wù)計算完畢為止。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211763
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128948

原文標(biāo)題:CPU+GPU集群計算中的一種動態(tài)負載均衡設(shè)計方法

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DDR內(nèi)存頻率對性能的影響

    的整體性能,特別是在處理大量數(shù)據(jù)運行復(fù)雜程序時,如視頻編輯、3D渲染和高端游戲等場景??焖俚?b class='flag-5'>內(nèi)存可以縮短CPU內(nèi)存之間的通信時間,從而提升整體系統(tǒng)的響應(yīng)效率。 二、多任務(wù)處理能力
    的頭像 發(fā)表于 11-20 14:25 ?754次閱讀

    RAM內(nèi)存不足的表現(xiàn)及解決方法

    ) 操作系統(tǒng)會將部分內(nèi)存數(shù)據(jù)暫時存儲到硬盤上,這個過程稱為頁面交換。如果頻繁發(fā)生,說明內(nèi)存不足。 高CPU使用率 由于內(nèi)存不足,CPU需要花
    的頭像 發(fā)表于 11-11 09:53 ?911次閱讀

    北橋芯片負責(zé)與cpu的聯(lián)系并控制內(nèi)存

    北橋芯片,也被稱為內(nèi)存控制器系統(tǒng)控制器,是計算機主板上的一個重要組成部分。它負責(zé)管理CPU、內(nèi)存、以及其他系統(tǒng)組件之間的數(shù)據(jù)傳輸和通信。 1. 北橋芯片的定義和功能 北橋芯片是主板上
    的頭像 發(fā)表于 10-14 10:37 ?548次閱讀

    Windows管理內(nèi)存的三種主要方式

    Windows操作系統(tǒng)提供了多種方式來管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關(guān)于Windows管理內(nèi)存的三種主要方式的詳細闡述,包括堆
    的頭像 發(fā)表于 10-12 17:09 ?783次閱讀

    前端總線與內(nèi)存頻率怎么配

    前端總線(FSB)與內(nèi)存頻率的配合是確保計算機系統(tǒng)穩(wěn)定運行并發(fā)揮最佳性能的關(guān)鍵因素之一。以下是對前端總線與內(nèi)存頻率配合關(guān)系的介紹: 一、前端總線與內(nèi)存頻率的基本概念 前端總線 :前端總線是CP
    的頭像 發(fā)表于 10-12 09:10 ?273次閱讀

    C2000 CPU內(nèi)存內(nèi)置自檢功能

    電子發(fā)燒友網(wǎng)站提供《C2000 CPU內(nèi)存內(nèi)置自檢功能.pdf》資料免費下載
    發(fā)表于 10-10 09:27 ?0次下載
    C2000 <b class='flag-5'>CPU</b><b class='flag-5'>內(nèi)存</b>內(nèi)置自檢功能

    內(nèi)存控制器概述和工作原理

    內(nèi)存控制器是計算機系統(tǒng)內(nèi)部控制內(nèi)存并負責(zé)內(nèi)存CPU之間數(shù)據(jù)交換的重要組成部分。它不僅是連接CPU內(nèi)存
    的頭像 發(fā)表于 09-04 14:19 ?761次閱讀

    反射內(nèi)存卡與普通內(nèi)存卡的區(qū)別

    應(yīng)用場景和目的反射內(nèi)存卡:主要用于需要多個設(shè)備系統(tǒng)之間進行高速、實時數(shù)據(jù)共享和通信的場景,例如工業(yè)控制、航空航天等領(lǐng)域。普通內(nèi)存卡:通常用于個人電子設(shè)備,如手機、相機、平板電腦等,用
    的頭像 發(fā)表于 09-04 10:24 ?615次閱讀
    反射<b class='flag-5'>內(nèi)存</b>卡與普通<b class='flag-5'>內(nèi)存</b>卡的區(qū)別

    主板內(nèi)存故障燈亮?xí)?b class='flag-5'>cpu的問題嗎

    主板內(nèi)存故障燈亮并不一定是CPU的問題,但CPU內(nèi)存之間的交互確實可能影響這一故障現(xiàn)象。以下是對主板內(nèi)存故障燈亮可能原因的分析: 一、
    的頭像 發(fā)表于 09-02 14:42 ?2760次閱讀

    主板自檢cpu內(nèi)存燈一直來回閃

    檢查CPU安裝 :確保CPU正確安裝在主板上,接觸良好。 檢查散熱 :確保CPU散熱器安裝正確,沒有松動,且散熱膏涂抹均勻。 檢查電源 :確保電源線連接正確,電源供應(yīng)穩(wěn)定。 1.2 內(nèi)存
    的頭像 發(fā)表于 09-02 14:38 ?1w次閱讀

    HarmonyOS實戰(zhàn)開發(fā)-內(nèi)存快照Snapshot Profiler功能使用指導(dǎo)

    DevEco Studio集成的DevEco Profiler性能調(diào)優(yōu)工具(以下簡稱為Profiler),提供Time、Allocation、Snapshot、CPU等場景化分析任務(wù)類型。內(nèi)存快照
    發(fā)表于 05-11 13:51

    聊聊GPU背后的大贏家-HBM

    HBM全稱為High Bandwidth Memory,直接翻譯即是高帶寬內(nèi)存,是一款新型的CPU/GPU內(nèi)存芯片。
    的頭像 發(fā)表于 04-20 15:27 ?1550次閱讀
    聊聊<b class='flag-5'>GPU</b>背后的大贏家-HBM

    CW32L052 DMA直接內(nèi)存訪問

    傳輸方式常見于需要將外設(shè)采集的數(shù)據(jù)快速傳輸?shù)?b class='flag-5'>內(nèi)存進行處理的應(yīng)用。 ? 內(nèi)存內(nèi)存之間 :例如在兩個不同的數(shù)組之間傳輸數(shù)據(jù),或者在不同的
    的頭像 發(fā)表于 02-28 16:48 ?943次閱讀
    CW32L052 DMA直接<b class='flag-5'>內(nèi)存</b>訪問

    為什么GPUCPU更快?

    大規(guī)模數(shù)據(jù)集時比CPU更快的根本原因。內(nèi)存帶寬:GPU內(nèi)存帶寬比CPU高得多。內(nèi)存帶寬是指數(shù)據(jù)
    的頭像 發(fā)表于 01-26 08:30 ?2410次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    系統(tǒng)內(nèi)存和運行內(nèi)存的區(qū)別

    系統(tǒng)內(nèi)存和運行內(nèi)存都是計算機中重要的概念,它們在計算機的存儲和運行方面起著不可或缺的作用。雖然它們與計算機存儲和運行息息相關(guān),但是它們具有不同的功能和實現(xiàn)方式。接下來我將詳細介紹系統(tǒng)內(nèi)存
    的頭像 發(fā)表于 01-15 16:32 ?3373次閱讀