作者:Robin Britton
由于屏幕分辨率的提高以及越來越復雜的渲染管道,使得游戲和其他應用對于帶寬的要求也越來越高,大量的數(shù)據(jù)需要從內(nèi)存拷貝或者寫入?,F(xiàn)在用戶普遍認為在無其他特殊情況下設(shè)備應該能夠支持2K的屏幕分辨率,高端游戲則具有更大的幾何復雜性,真正在屏幕上顯示圖像之前渲染管道通常要涉及多個中間渲染目標。即使一些休閑類游戲也可能具有一些全屏后的處理效果,需要幀緩存數(shù)據(jù)從片外存儲器中讀取和寫入。內(nèi)存訪問是非常消耗功率的,占用帶寬越大功耗則越高,這對于功率預算緊張的嵌入式系統(tǒng)尤其是個棘手的問題。
PowerVR GPU采用 PVR3C三重壓縮技術(shù)來解決這個問題,這三重壓縮解決方案包括紋理壓縮(涉及PVRTC和ASTC)、幾何壓縮(PVRGC)和本文的主題圖像壓縮(PVRIC)。
PowerVR圖片壓縮(PVRIC)
如上文所說,在現(xiàn)代實時圖形應用中內(nèi)存帶寬的最大壓力之一就是生成高質(zhì)量圖像所需的大量中間渲染對象。一個明顯的例子就是創(chuàng)建立方體環(huán)境貼圖( cube maps),通常用于反射效果。這包括從一個不動點向六個方向渲染一個場景,最后結(jié)果會形成一個立方體的貼圖紋理,然后對場景中的對象進行類似反射的采樣。其他示例包括分辨率縮放、渲染小地圖或其他場景視點、渲染平面反射貼圖,更不用說無盡的屏幕空間和后期處理效果了,比如可分離模糊處理、 SSAO、 景深效果以及色調(diào)映射等。
一個立方體貼圖的六個面可用于汽車上的近似反射,在汽車的窗戶上可以看到天空的倒影。
PVRIC通過高效、無損的壓縮方案大大降低了內(nèi)存帶寬成本,這種壓縮方案通常會使得圖像大小減少50%(依賴于很多元素)。前文提到的目標渲染在寫入GPU之前就進行了壓縮,然后從內(nèi)存中讀取時會被解壓,因為這種壓縮是無損的,所以可以從解壓數(shù)據(jù)中重構(gòu)得到完美的原始圖像,這也意味著圖像的質(zhì)量不會降低。
上圖展示了與GPU的所有交互,但更有利的是這有可能會將PVRIC技術(shù)集成到SoC級別的顯示管道中,使得最終的渲染圖像在寫入內(nèi)存之前會進行壓縮,然后在顯示控制器中進行解壓,這將更有效地節(jié)省總體帶寬。
在許多移動游戲和App中,紋理資源通常都會采用眾所周知的格式進行壓縮,比如 ETC、PVRTC等,但是開發(fā)者會選擇保留一部分未經(jīng)壓縮的紋理資源,比如字體或UI紋理,這些紋理在縮放時需要保持清晰和不失真。PVRIC方案的另一個好處是它允許將相同的無損壓縮應用到任何未經(jīng)壓縮的紋理上,然后上傳給GPU(如果紋理使用的是多種被支持的格式之一),根據(jù)不同的應用,這可能會帶來更大幅度的帶寬減少。
應用帶寬分析
我們在Synaptics BG5CT板卡(集成 PowerVR Series8XE GE8310 GPU,它采用了最新一代的PVRIC技術(shù)——PVRICv3)上運行API trace測試了多款流行的應用,我們看到了這種壓縮方案所帶來的性能提升,尤其是帶寬消耗的顯著降低。
下面的表格展示了不同應用的測試結(jié)果,需要注意的是,在這款器件上PVRIC并沒有集成到SoC的顯示管道中,如果集成了那么我們將會看到最后的幀緩存圖像會有更好的壓縮效果,正如前文所述。因為我們使用的是安卓平臺,幀緩存壓縮會應用到最終的渲染操作,Android SurfaceFlinger會將這些壓縮幀寫入內(nèi)存,讀取到GPU中。如果是這樣,那么SoC顯示管道也將受益于SurfaceFlinger的最終合成結(jié)果,。
那么這些結(jié)果到底意味著什么?這些數(shù)字可能有點兒誤導人。我們可以清楚的看到所有應用占用的總帶寬都有所減少,但有些應用比其他應用帶寬的降低程度要大得多,正如上文所提到的PVRIC技術(shù)涵蓋了紋理的渲染和解壓縮,但這只是總帶寬的一部分,幾何圖形、著色器等等也會占用一定的帶寬,但是它們并不會受PVRIC操作的影響,所以對于整體帶寬的占用情況我們能做的只是降低,雖然系統(tǒng)范圍內(nèi)的數(shù)據(jù)保持在較高的水平,但是我們想隔離受PVRIC影響的相關(guān)帶寬參數(shù),借助我們的內(nèi)部分析工具可以讓我們更精確的完成這些操作(雖然我們不能消除一切——比如紋理壓縮)。
在這里,我們隔離的只是GPU在執(zhí)行渲染操作時占用的帶寬,而忽略了貼圖操作所需要的幾何處理。為了簡化這一過程,測試平臺上已經(jīng)禁止了這些任務(wù)的重復。我們還能夠識別和忽略其他進程的任務(wù),現(xiàn)在我們需要分析為什么有些app會那樣運行,這需要我們了解app是如何在圖形API層工作的,不妨深入了解一下PVRTrace。
《minecraft》(《我的世界》)
我們使用PVRTrace對Minecraft這款應用進行分析,我們發(fā)現(xiàn)總體帶寬節(jié)省率比較低(大約2.42%),但是隔離圖片/紋理帶寬方面顯示帶寬節(jié)省率則更高(大約17.76%)。Minecraft采用的是完全未壓縮的紋理技術(shù),因此PVRIC的效果比較顯著,盡管這與典型場景中幾何圖形的數(shù)量(大約13萬4千個三角形)相比非常的少,更不用說很多紋理的尺寸非常的小,PVRIC只是完成了它所能實現(xiàn)的,但是對于Minecraft并沒有太多的事情可以做。請記?。和ㄟ^集成到顯示管道中,我們可以看到發(fā)送給顯示控制器的幀緩存更好的優(yōu)化效果。
《憤怒的小鳥 2》
在憤怒的小鳥 2這款應用中,幾何圖形(1萬6千個三角形)和紋理內(nèi)容各自占用的帶寬比例則更協(xié)調(diào)一些,因此我們能夠更加清晰的看到PVRIC所帶來的好處,系統(tǒng)整體帶寬節(jié)省43%,隔離帶寬節(jié)省56%。這款游戲既采用了壓縮的紋理格式也采用了一些未壓縮的紋理格式,因此PVRIC非常起作用。此外,整個場景在進行最終的展示之前會采用渲染中間件的形式(很多應用都使用這種技術(shù)來處理分辨率縮放或后續(xù)處理操作),這兩種因素的結(jié)合對于PVRIC技術(shù)是很好的展示。
《真實賽車 3》
真實賽車3是另一款使用大量幾何圖形(測試時顯示16萬個三角形)的應用,而且紋理/曲面也占用了相當一部分的帶寬。紋理壓縮技術(shù)(PowerVR的PVRTC技術(shù))在這款應用中被廣泛采用,這非常棒,但是還有很多未壓縮的紋理需要借助PVRIC技術(shù)來處理,此外還涉及一組512 x 512的立方體環(huán)境貼圖和全屏幕紋理渲染。最后的百分比可能不太明顯,但是這很好的展示了PVRIC與PVRTC相結(jié)合所帶來的好處,PVRTC可用于處理大部分的紋理,PVRIC則用于處理其他內(nèi)容。
從這些工作負載中可以看出,無論圖像數(shù)據(jù)是否占用應用程序的大部分帶寬,采用PVRIC技術(shù)后都會帶來顯著的影響,在很大程度上減少了圖像占用的帶寬。
功耗分析
為了能夠更清楚的了解PVRIC技術(shù)和降低帶寬對于功耗的影響,我們修改了平臺,使其支持功耗分析并連接了數(shù)據(jù)采集設(shè)備從而可以收集一些功耗數(shù)據(jù),下面的圖表就是我們的發(fā)現(xiàn):
在憤怒的小鳥2同一段5秒的運行過程中,我們發(fā)現(xiàn):使用PVRIC時內(nèi)存的功耗會更低一些,采用兩組數(shù)據(jù)之間的差值并進行平滑處理,我們發(fā)現(xiàn)內(nèi)存功耗降低了18%。這個效果非常的顯著,對于采用電池驅(qū)動的設(shè)備比如移動手機可以在充電之前使用更長的時間,當然對于功耗和電池壽命的影響還有很多其他因素,而且不同設(shè)備之間也會有所差別。
總結(jié)
總而言之,PVRIC技術(shù)是PVR3C壓縮策略關(guān)鍵的組成部分,對于使用的帶寬來說其壓縮比可高達(有時甚至超過)2:1。這會對設(shè)備存儲器的功耗產(chǎn)生實質(zhì)性的影響,通過對我們紋理和幾何壓縮方案的測試,很明顯可以得出PVR3C是全面的帶寬效率方案,能夠從整體上提高系統(tǒng)的效率,從而讓我們能夠?qū)崿F(xiàn)更加全面的低功耗解決方案。
-
gpu
+關(guān)注
關(guān)注
28文章
4759瀏覽量
129123 -
Power
+關(guān)注
關(guān)注
1文章
499瀏覽量
67786
發(fā)布評論請先 登錄
相關(guān)推薦
評論