CPU是什么?
CPU,中央處理器(Central Processing Unit)是一臺(tái)計(jì)算機(jī)的運(yùn)算核心和控制核心。CPU、內(nèi)部存儲(chǔ)器和輸入/輸出設(shè)備是電子計(jì)算機(jī)三大核心部件。其功能主要是解釋計(jì)算機(jī)指令以及處理計(jì)算機(jī)軟件中的數(shù)據(jù)。
GPU是什么?
GPU,圖形處理器(Graphic Processing Unit)。一個(gè)專門的圖形核心處理器。GPU是顯示卡的“大腦”,決定了該顯卡的檔次和大部分性能,同時(shí)也是2D顯示卡和3D顯示卡的區(qū)別依據(jù)。2D顯示芯片在處理3D圖像和特效時(shí)主要依賴CPU的處理能力,稱為“軟加速”。3D顯示芯片是將三維圖像和特效處理功能集中在顯示芯片內(nèi),也即所謂的“硬件加速”功能。
GPU與CPU的區(qū)別
GPU的由來(lái)
計(jì)算機(jī)對(duì)圖像進(jìn)行實(shí)時(shí)渲染, 一般需要經(jīng)過(guò)圖形流水線的過(guò)程:頂點(diǎn)處理->圖元處理->柵格化->片段處理->像素操作
, 期間需要大量的計(jì)算,比如 640×480的分辨率的屏幕,為了顯示游戲畫面,大概有30萬(wàn)個(gè)像素需要渲染 ,為了讓人眼看到畫面動(dòng)起來(lái),其不像電影一樣只需要24幀,至少需要60幀, 即每秒我們需要完成1800 萬(wàn)次單個(gè)像素的渲染,每個(gè)像素都需要經(jīng)過(guò) 圖形流水線過(guò)程 ,需要耗費(fèi)大量資源
隨著圖像處理對(duì)于計(jì)算機(jī)來(lái)說(shuō)越來(lái)越重要,CPU越來(lái)越不從心了。CPU需要很強(qiáng)的通用性來(lái)處理各種不同的數(shù)據(jù)類型,同時(shí)又要邏輯判斷又會(huì)引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。
另一方面,當(dāng)芯片的集成度增加后,漏電流也隨之增大,但時(shí)鐘頻率的提高有限,而且晶體管的線寬很快就會(huì)到達(dá)物理極限,因此芯片的性能很難靠減小晶體管線寬來(lái)提高。所以工程師們開(kāi)始想辦法在設(shè)計(jì)上做文章:由于圖像渲染的流程是固定的,通過(guò)硬件來(lái)解決這個(gè)問(wèn)題,那就設(shè)計(jì)一個(gè)不需要考慮CPU的流水線停頓、亂序執(zhí)行、 分支預(yù)測(cè)、內(nèi)存管理、IO等等的各類問(wèn)題的芯片 ,這其實(shí)就是GPU。
并行計(jì)算
我們重點(diǎn)再介紹一下CPU并行,即并行計(jì)算
并行計(jì)算(Parallel Computing)是指同時(shí)使用多種計(jì)算資源解決計(jì)算問(wèn)題的過(guò)程,是提高計(jì)算機(jī)系統(tǒng)計(jì)算速度和處理能力的一種有效手段。它的基本思想是用多個(gè)處理器來(lái)共同求解同一問(wèn)題,即將被求解的問(wèn)題分解成若干個(gè)部分,各部分均由一個(gè)獨(dú)立的處理機(jī)來(lái)并行計(jì)算。
并行計(jì)算可分為時(shí)間上的并行
和空間上的并行
- 時(shí)間上的并行是指流水線技術(shù),采用流水線,可以在同一時(shí)間啟動(dòng)兩個(gè)或兩個(gè)以上的操作,大大提高計(jì)算性能。
- 空間上的并行是指多個(gè)處理機(jī)并發(fā)的執(zhí)行計(jì)算,即通過(guò)網(wǎng)絡(luò)將兩個(gè)以上的處理機(jī)連接起來(lái),達(dá)到同時(shí)計(jì)算同一個(gè)任務(wù)的不同部分,或者單個(gè)處理機(jī)無(wú)法解決的大型問(wèn)題。
GPU架構(gòu)優(yōu)化
我們來(lái)看看,現(xiàn)代的 GPU 為了圖形渲染、深度學(xué)習(xí)上有相較于CPU更強(qiáng)大的性能,做出來(lái)哪些設(shè)計(jì)上的優(yōu)化:
- 由于GPU不需要考慮CPU的流水線停頓、亂序執(zhí)行、 分支預(yù)測(cè)等等的各類問(wèn)題,只需要流式計(jì)算的功能,所以內(nèi)部許多CPU的電路是不需要的,這樣就節(jié)約了大量空間
- 由于GPU相比CPU電路就簡(jiǎn)單多了,這樣就可以塞入更多的電路,即更多的"核",他們都是并行的,能夠極大提升性能
- 除了塞更多的核,為了更大程度提升GPU的性能,還采用 SIMT技術(shù), 可以把多條數(shù)據(jù),交給不同的線程去處理。類似于CPU中,SIMD技術(shù),但是其只能一次性取出了固定 長(zhǎng)度的多個(gè)數(shù)據(jù),放到寄存器里面,用一個(gè)指令去執(zhí)行
- GPU同樣采用超線程技術(shù), 當(dāng)任務(wù)計(jì)算遇到停頓的時(shí)候,調(diào)度一些別的計(jì)算任務(wù)給當(dāng)前的 ALU,這樣就需要保證核心中提供更多的執(zhí)行上下文給ALU算數(shù)計(jì)算單元使用
我們?cè)倏纯聪旅娴腃PU和GPU的架構(gòu)圖,想必會(huì)有所得
- CPU架構(gòu)圖
CPU架構(gòu)
- GPU架構(gòu)圖
GPU架構(gòu)圖
從架構(gòu)圖我們就能很明顯的看出,GPU的構(gòu)成相對(duì)簡(jiǎn)單,GPU采用 流式并行計(jì)算模式 ,每一個(gè)計(jì)算單元可以單獨(dú)負(fù)責(zé)一個(gè)像素點(diǎn),每個(gè)像素點(diǎn)不依賴旁邊像素點(diǎn)的數(shù)據(jù),所以每個(gè)計(jì)算單元都是獨(dú)立并行的,不需要控制器額外干涉。CPU的核數(shù)一般2,4,8核;但是GPU可以達(dá)到上千核
擁有數(shù)量非常多的計(jì)算單元和超長(zhǎng)的流水線,計(jì)算能力非常強(qiáng)悍,特別適合處理大規(guī)模并發(fā)計(jì)算
我們需要知道GPU無(wú)法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作。CPU可單獨(dú)作用,處理復(fù)雜的邏輯運(yùn)算和不同的數(shù)據(jù)類型,但當(dāng)需要大量的處理類型統(tǒng)一的數(shù)據(jù)時(shí),則可調(diào)用GPU進(jìn)行并行計(jì)算。
GPU和CPU的應(yīng)用場(chǎng)景
小結(jié)一下
- CPU需要很強(qiáng)的通用性來(lái)處理各種不同的數(shù)據(jù)類型,同時(shí)又要邏輯判斷又會(huì)引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜,采用的是精兵戰(zhàn)術(shù),能力強(qiáng),但數(shù)量少,擅長(zhǎng)邏輯控制,串行運(yùn)算。
- GPU面對(duì)的則是類型高度統(tǒng)一的、相互無(wú)依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計(jì)算環(huán)境,采用的是人海戰(zhàn)術(shù),單個(gè)能力弱,但數(shù)量眾多,擅長(zhǎng)的是大規(guī)模并發(fā)計(jì)算。
雖然GPU是為了圖像處理而生的,隨著時(shí)代的發(fā)展,現(xiàn)在GPU不僅可以在圖像處理領(lǐng)域大顯身手,它還被用來(lái)深度學(xué)習(xí)、科學(xué)計(jì)算、密碼破解、數(shù)值分析,海量數(shù)據(jù)處理,金融分析等需要大規(guī)模并行計(jì)算的領(lǐng)域。
參考資料:《深入淺出計(jì)算機(jī)組成原理》 https://blog.csdn.net/shuiyixin/article/details/82915378
-
cpu
+關(guān)注
關(guān)注
68文章
10958瀏覽量
214085 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4415瀏覽量
86504 -
gpu
+關(guān)注
關(guān)注
28文章
4837瀏覽量
129849
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論