作者:Benny Har-Even
去年Imagination推出了最新的圖形架構(gòu)Furian,自2012年來首次對PowerVR進行了重大更新。這意味著在滿足越來越多的器件性能需求方面邁出了重要的一步,尤其對于一些新的應(yīng)用場景比如AR、VR和AI,這使得PowerVR在嵌入式GPU中保持最高的功效和性能。
Furian在設(shè)計之初就考慮到了可擴展性,無論著色處理單元(SPUs)的數(shù)量如何都能確保性能和面積效率的一致性。在這篇文章中,我們將特別關(guān)注該架構(gòu)的功效,以及是如何確保在每瓦特性能方面領(lǐng)先于其他競爭對手。
繼Furian架構(gòu)之后我們推出了第一個基于Furian的處理器核并且提供授權(quán)——PowerVR GT8525,現(xiàn)在我們又推出了PowerVR GT8540——這是一款針對于高端移動通信和汽車市場的四集群設(shè)計。
與目前高端智能手機和平板電腦上的多核設(shè)計相比, PowerVR GT8525中包含了雙集群的單一著色處理單元(SPU),作為第一款用于授權(quán)的Furian架構(gòu)GPU來說是一個相當(dāng)合適的選擇。然而它不應(yīng)該被低估,這款單SPU設(shè)計的性能已證明了Furian架構(gòu)對游戲的影響。
作為技術(shù)發(fā)燒友我們致力于開發(fā)領(lǐng)先的圖形設(shè)計,Imagination的高端產(chǎn)品一直擁有大量粉絲。事實上我們很多人口袋中都裝著性能強大的高端設(shè)備。然而這類設(shè)備在價格上無疑是昂貴的,而且越來越多的人認為對于大多數(shù)人來說成本低、價格合適、有足夠功能的產(chǎn)品更加的適用,這在很大程度上要精確到GPU,我們推出的PowerVR GT8525正適合這樣的“超級中端”市場。
對于很多人來說,一款價格合理的設(shè)備能夠提供足夠的性能來處理日常任務(wù),比如網(wǎng)頁瀏覽、查看社交媒體以及流暢的操作一些復(fù)雜的視覺游戲。它們甚至足以讓用戶體驗一些新的應(yīng)用,比如基于AR、VR和AI的應(yīng)用。更重要的是中端市場的SoC傳統(tǒng)上并不會采用先進的制造工藝,這將限制它們可用的功耗預(yù)算,因此采用更小型的GPU更可取。正是因為如此,這使得PowerVR GT8525的發(fā)布成為SoC供應(yīng)商理想的GPU,這得益于它在性能和效率之間的理想平衡。
架構(gòu)效率
然而在功效方面真正使我們能夠保持領(lǐng)先優(yōu)勢是因為建立在Rogue基礎(chǔ)上的Furian架構(gòu)所帶來的變化和提升。這些變化為的是優(yōu)化內(nèi)部效率,能夠在給定的功耗要求下提供更多的性能。
更高效的SPU
其中一個變化是在著色處理單元(SPU),它被重構(gòu)建以更高效的使用算數(shù)邏輯單元(ALU)。正如上圖所示紋理單元已經(jīng)有自己的緩存,確保在訪問數(shù)據(jù)時不需要與統(tǒng)一著色集群(USCs)發(fā)生競爭——結(jié)果就是使用更低的功耗同時提高吞吐量效率。紋理單元目前具有雙倍的填充效率,每個時鐘處理8個像素單元,僅在面積上略有增加。
2D Data Master(數(shù)據(jù)管理)
另一個提升是關(guān)于2D的數(shù)據(jù)管理(2D Data Master),2D Data Master第一次引入是在Series7XT,在這個有了進一步的提升?,F(xiàn)在它完全采用異步處理,內(nèi)核利用率和功效更高。它允許獨立提交2D工作任務(wù),繞過所有Tile(貼片)的工作開銷(比如調(diào)用3D來處理2D任務(wù)時),這使得像創(chuàng)建UIs等場合的效率大大提高——而且最重要的是這有助于降低功耗。
管道流加倍
另一個提高整體效率的主要原因是對主要ALU管道的改變(見下圖)。管道數(shù)據(jù)位寬進行了加倍,從16增加到32——每個時鐘的吞吐量也加倍了。但關(guān)鍵的是由于內(nèi)部設(shè)計的精簡和更多的共享控制邏輯,它并不會占用兩倍的硅面積。在Rougue架構(gòu)中這個管道包括兩個乘加功能模塊(MADs)。然而在仔細分析了開發(fā)人員編寫的著色器和內(nèi)核代碼之后,很明顯的發(fā)現(xiàn)這兩個MADs很少被充分利用,因為對于編譯器來說同時使用兩個MADs是很困難的。
因此在Furian架構(gòu)中我們實現(xiàn)了一個MAD和一個MUL,在實際情況中能夠提供更多的性能,同時控制硅面積的成本在嚴(yán)格的范圍內(nèi)。在一些場景可能需要兩個MAD操作,F(xiàn)urian采用的雙倍帶寬管道能夠提供匹敵Rogue架構(gòu)的性能(16×2 MADs = 32×1 MAD),因此在這個意義上說即使在最壞的情況下我們也并沒有失去什么,大多數(shù)情況下帶來的是吞吐量的顯著提升。
減少延遲
變化還不止于此,現(xiàn)在GPU驅(qū)動程序和GPU之間的函數(shù)調(diào)用不再需要通過OS(操作系統(tǒng))內(nèi)核層了,采用的是“用戶模式隊列”直接進行通信,降低了開銷和延遲,從而再次降低了功耗。
除此之外,現(xiàn)在GPU支持對更多本地內(nèi)存地址的同步訪問,這意味著每個ALU管道都可以直接訪問它們所需的內(nèi)存區(qū)域而不需要停機。
結(jié)論
那么這些變化的結(jié)果是什么呢?從下圖中我們可以看到采用目前流行的行業(yè)標(biāo)準(zhǔn)Kishonti GFXBench Manhattan 3.0 benchmark進行測試,Series8XT GT8525比PowerVR GT7450提供更多的fps/W參數(shù),我們上一代等效GPU與之前的15fps相比可以達到35fps(fps(每秒幀數(shù))指的是游戲在設(shè)備上運行的流暢程度,數(shù)字越大表示終端用戶的體驗越好)。更小的硅片面積(如下圖更小的圈所示)也是另一個優(yōu)勢。
PowerVR GT8525 vs GT7450 – Manhattan 3.0 FPS vs FPS/W 和面積
盡管功效是GPU的一個重要的綜合測量指標(biāo),但同樣重要的是絕對功耗,移動設(shè)備的SoC功耗一般被限制在3—3.5W,其中GPU占功率消耗的30%—50%。估計在35fps/W的情況下,Series8XT GT8525采用中端SoC制造工藝TSMC 10FF能夠?qū)崿F(xiàn)一個合適的功耗值,GPU的功耗控制在1.5W以下。
為了更直觀的展現(xiàn),針對我們上一代的Series7XT,我們期望在實現(xiàn)相同性能指標(biāo)(iso性能)的基礎(chǔ)上,Series8XT GT8525比Series7XT GT7450降低60%的功耗,這意味著性能功耗比將達到令人難以置信的75%!對于終端用戶來說,這意味著他們的設(shè)備將能夠持續(xù)使用更長的時間,尤其對于一些使用場景比如玩游戲。
當(dāng)然我們業(yè)界領(lǐng)先的功效特性是基于我們的TBDR(分塊延遲渲染)技術(shù),我們只需要渲染屏幕上能夠看到的像素,這也是Furian架構(gòu)所采用的的技術(shù)。如果你想了解更多,請查看我們之前的博客文章:深入探究TBDR。
總結(jié)
正如你所看到的,F(xiàn)urian架構(gòu)所引入的這些變化使得PowerVR Series8XT GT8525具有非常高的性價比,提高了大部分市場的器件門檻。我們已經(jīng)向關(guān)鍵客戶授權(quán)了我們的首款Series8XT內(nèi)核,我們期待在2018年提供更多選擇。
-
gpu
+關(guān)注
關(guān)注
28文章
4739瀏覽量
128941 -
powervr
+關(guān)注
關(guān)注
0文章
98瀏覽量
31068 -
imagination
+關(guān)注
關(guān)注
1文章
573瀏覽量
61327
發(fā)布評論請先 登錄
相關(guān)推薦
評論