在CPU+GPU協(xié)同計算中,CPU和GPU的計算能力不同,靜態(tài)地給CPU和GPU劃分任務(wù)會導(dǎo)致CPU和GPU計算不同步,導(dǎo)致嚴重的負載不均衡,為了實現(xiàn)CPU和GPU的負載均衡,需要對CPU和GPU不同的劃分方法。把每個節(jié)點上的所有CPU看成一個設(shè)備,每塊GPU卡看成一個設(shè)備,對集群節(jié)點上的所有CPU設(shè)備和GPU設(shè)備分別編號,每個節(jié)點上有M塊GPU卡,N個節(jié)點上共有N個CPU設(shè)備,編號為1,2,…,N;N個節(jié)點上共有M*N個GPU設(shè)備,編號為1,2,…,M*N。
設(shè)備編號之后就可以對設(shè)備進行分組,根據(jù)算法的要求,有些任務(wù)不能細分,一個CPU設(shè)備或GPU設(shè)備上可用的內(nèi)存空間可能不能滿足計算的內(nèi)存要求,需要多設(shè)備數(shù)據(jù)劃分、共同計算,這時需要根據(jù)CPU內(nèi)存或GPU內(nèi)存進行分組
1)根據(jù)CPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的CPU設(shè)備數(shù)目為GC個, GC=(Mcom+MemC-1)/MemC,其中一個節(jié)點的內(nèi)存大小為MemC,每個計算任務(wù)需要的內(nèi)存大小為Mcom。
所有的CPU設(shè)備分為N/GC個組,每個組計算同一個任務(wù),組內(nèi)的CPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)的劃分,因為組內(nèi)的CPU設(shè)備計算能力一致;
2)根據(jù)GPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的GPU設(shè)備數(shù)目為GG個, GG=(Mcom+MemG-1)/Mem,其中,一個GPU設(shè)備的內(nèi)存大小為MemG,每個計算任務(wù)需要的內(nèi)存大小為Mcom。
所有的GPU設(shè)備分為M*N/GG個組,每個組計算同一個任務(wù),組內(nèi)的GPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)劃分的方法。
CPU和GPU設(shè)備分組之后,就可以把任務(wù)動態(tài)分劃分給每個CPU組或GPU組,可以采用MPI通信進行劃分,由主進程進行動態(tài)的發(fā)送任務(wù)編號給各個CPU組或GPU組內(nèi)的組長,組長再把任務(wù)編號廣播給組內(nèi)的組員,然后組內(nèi)的設(shè)備同時計算,計算完畢之后即可向主進程請求下一個任務(wù),直到所有任務(wù)計算完畢為止。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
原文標(biāo)題:CPU+GPU集群計算中的一種動態(tài)負載均衡設(shè)計方法
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
的整體性能,特別是在處理大量數(shù)據(jù)或運行復(fù)雜程序時,如視頻編輯、3D渲染和高端游戲等場景??焖俚?b class='flag-5'>內(nèi)存可以縮短CPU和內(nèi)存之間的通信時間,從而提升整體系統(tǒng)的響應(yīng)效率。 二、多任務(wù)處理能力
發(fā)表于 11-20 14:25
?754次閱讀
) 操作系統(tǒng)會將部分內(nèi)存數(shù)據(jù)暫時存儲到硬盤上,這個過程稱為頁面交換。如果頻繁發(fā)生,說明內(nèi)存不足。 高CPU使用率 由于內(nèi)存不足,CPU需要花
發(fā)表于 11-11 09:53
?911次閱讀
北橋芯片,也被稱為內(nèi)存控制器或系統(tǒng)控制器,是計算機主板上的一個重要組成部分。它負責(zé)管理CPU、內(nèi)存、以及其他系統(tǒng)組件之間的數(shù)據(jù)傳輸和通信。 1. 北橋芯片的定義和功能 北橋芯片是主板上
發(fā)表于 10-14 10:37
?548次閱讀
Windows操作系統(tǒng)提供了多種方式來管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關(guān)于Windows管理內(nèi)存的三種主要方式的詳細闡述,包括堆
發(fā)表于 10-12 17:09
?783次閱讀
前端總線(FSB)與內(nèi)存頻率的配合是確保計算機系統(tǒng)穩(wěn)定運行并發(fā)揮最佳性能的關(guān)鍵因素之一。以下是對前端總線與內(nèi)存頻率配合關(guān)系的介紹: 一、前端總線與內(nèi)存頻率的基本概念 前端總線 :前端總線是CP
發(fā)表于 10-12 09:10
?273次閱讀
電子發(fā)燒友網(wǎng)站提供《C2000 CPU內(nèi)存內(nèi)置自檢功能.pdf》資料免費下載
發(fā)表于 10-10 09:27
?0次下載
內(nèi)存控制器是計算機系統(tǒng)內(nèi)部控制內(nèi)存并負責(zé)內(nèi)存與CPU之間數(shù)據(jù)交換的重要組成部分。它不僅是連接CPU與內(nèi)存
發(fā)表于 09-04 14:19
?761次閱讀
應(yīng)用場景和目的反射內(nèi)存卡:主要用于需要多個設(shè)備或系統(tǒng)之間進行高速、實時數(shù)據(jù)共享和通信的場景,例如工業(yè)控制、航空航天等領(lǐng)域。普通內(nèi)存卡:通常用于個人電子設(shè)備,如手機、相機、平板電腦等,用
發(fā)表于 09-04 10:24
?615次閱讀
主板內(nèi)存故障燈亮并不一定是CPU的問題,但CPU與內(nèi)存之間的交互確實可能影響這一故障現(xiàn)象。以下是對主板內(nèi)存故障燈亮可能原因的分析: 一、
發(fā)表于 09-02 14:42
?2760次閱讀
檢查CPU安裝 :確保CPU正確安裝在主板上,接觸良好。 檢查散熱 :確保CPU散熱器安裝正確,沒有松動,且散熱膏涂抹均勻。 檢查電源 :確保電源線連接正確,電源供應(yīng)穩(wěn)定。 1.2 內(nèi)存
發(fā)表于 09-02 14:38
?1w次閱讀
DevEco Studio集成的DevEco Profiler性能調(diào)優(yōu)工具(以下簡稱為Profiler),提供Time、Allocation、Snapshot、CPU等場景化分析任務(wù)類型。內(nèi)存快照
發(fā)表于 05-11 13:51
HBM全稱為High Bandwidth Memory,直接翻譯即是高帶寬內(nèi)存,是一款新型的CPU/GPU內(nèi)存芯片。
發(fā)表于 04-20 15:27
?1550次閱讀
傳輸方式常見于需要將外設(shè)采集的數(shù)據(jù)快速傳輸?shù)?b class='flag-5'>內(nèi)存進行處理的應(yīng)用。 ? 內(nèi)存和內(nèi)存之間 :例如在兩個不同的數(shù)組之間傳輸數(shù)據(jù),或者在不同的
發(fā)表于 02-28 16:48
?943次閱讀
大規(guī)模數(shù)據(jù)集時比CPU更快的根本原因。內(nèi)存帶寬:GPU的內(nèi)存帶寬比CPU高得多。內(nèi)存帶寬是指數(shù)據(jù)
發(fā)表于 01-26 08:30
?2410次閱讀
系統(tǒng)內(nèi)存和運行內(nèi)存都是計算機中重要的概念,它們在計算機的存儲和運行方面起著不可或缺的作用。雖然它們與計算機存儲和運行息息相關(guān),但是它們具有不同的功能和實現(xiàn)方式。接下來我將詳細介紹系統(tǒng)內(nèi)存
發(fā)表于 01-15 16:32
?3373次閱讀
評論