0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

性能優(yōu)化主要圍繞CPU、GPU和內(nèi)存三大方面進(jìn)行

Dbwd_Imgtec ? 來源:未知 ? 作者:李倩 ? 2018-04-13 16:21 ? 次閱讀

項目的性能優(yōu)化主要圍繞CPU、GPU和內(nèi)存三大方面進(jìn)行。本文和大家分享內(nèi)存方面的優(yōu)化心得。

無論是游戲還是VR應(yīng)用,內(nèi)存管理都是其研發(fā)階段的重中之重。然而,在我們測評過的大量項目中,90%以上的項目都存在不同程度的內(nèi)存使用問題。就目前基于Unity引擎開發(fā)的移動游戲和移動VR游戲而言,內(nèi)存的開銷無外乎以下三大部分:

資源內(nèi)存占用;

引擎模塊自身內(nèi)存占用;

托管堆內(nèi)存占用。

如果您的項目存在內(nèi)存問題,一定逃不出以上三種情況。今天,我們就這三種情況逐一進(jìn)行解釋。

1、資源內(nèi)存占用

在一個較為復(fù)雜的大中型項目中,資源的內(nèi)存占用往往占據(jù)了總體內(nèi)存的70%以上。因此,資源使用是否恰當(dāng)直接決定了項目的內(nèi)存占用情況。一般來說,一款游戲項目的資源主要可分為如下幾種:紋理(Texture)、網(wǎng)格(Mesh)、動畫片段(AnimationClip)、音頻片段(AudioClip)、材質(zhì)(Material)、著色器(Shader)、字體資源(Font)以及文本資源(Text Asset)等等。其中,紋理、網(wǎng)格、動畫片段和音頻片段則是最容易造成較大內(nèi)存開銷的資源。

一、紋理

紋理資源可以說是幾乎所有游戲項目中占據(jù)最大內(nèi)存開銷的資源。一個6萬面片的場景,網(wǎng)格資源最大才不過10MB,但一個2048x2048的紋理,可能直接就達(dá)到16MB。因此,項目中紋理資源的使用是否得當(dāng)會極大地影響項目的內(nèi)存占用。

那么,紋理資源在使用時應(yīng)該注意哪些地方呢?

(1) 紋理格式

紋理格式是研發(fā)團(tuán)隊最需要關(guān)注的紋理屬性。因為它不僅影響著紋理的內(nèi)存占用,同時還決定了紋理的加載效率。一般來說,我們建議開發(fā)團(tuán)隊盡可能根據(jù)硬件的種類選擇硬件支持的紋理格式,比如Android平臺的ETC、iOS平臺的PVRTC、Windows PC上的DXT等等。因此,我們在UWA測評報告中,將紋理格式進(jìn)行詳細(xì)羅列,以便開發(fā)團(tuán)隊進(jìn)行快速查找,一步定位。

在使用硬件支持的紋理格式時,你可能會遇到以下幾個問題:

色階問題

由于ETC、PVRTC等格式均為有損壓縮,因此,當(dāng)紋理色差范圍跨度較大時,均不可避免地造成不同程度的“階梯”狀的色階問題。因此,很多研發(fā)團(tuán)隊使用RGBA32/ARGB32格式來實現(xiàn)更好的效果。但是,這種做法將造成很大的內(nèi)存占用。比如,同樣一張1024x1024的紋理,如果不開啟Mipmap,并且為PVRTC格式,則其內(nèi)存占用為512KB,而如果轉(zhuǎn)換為RGBA32位,則很可能占用達(dá)到4MB。所以,研發(fā)團(tuán)隊在使用RGBA32或ARGB32格式的紋理時,一定要慎重考慮,更為明智的選擇是盡量減少紋理的色差范圍,使其盡可能使用硬件支持的壓縮格式進(jìn)行儲存。

ETC1 不支持透明通道問題

在Android平臺上,對于使用OpenGL ES 2.0的設(shè)備,其紋理格式僅能支持ETC1格式,該格式有個較為嚴(yán)重的問題,即不支持Alpha透明通道,使得透明貼圖無法直接通過ETC1格式來進(jìn)行儲存。對此,我們建議研發(fā)團(tuán)隊將透明貼圖盡可能分拆成兩張,即一張RGB24位紋理記錄原始紋理的顏色部分和一張Alpha8紋理記錄原始紋理的透明通道部分。然后,將這兩張貼圖分別轉(zhuǎn)化為ETC1格式的紋理,并通過特定的Shader來進(jìn)行渲染,從而來達(dá)到支持透明貼圖的效果。該種方法不僅可以極大程度上逼近RGBA透明貼圖的渲染效果,同時還可以降低紋理的內(nèi)存占用,是我們非常推薦的使用方式。

當(dāng)然,目前已經(jīng)有越來越多的設(shè)備支持了OpenGL ES 3.0,這樣Android平臺上你可以進(jìn)一步使用ETC2甚至ASTC,這些紋理格式均為支持透明通道且壓縮比更為理想的紋理格式。如果你的游戲適合人群為中高端設(shè)備用戶,那么不妨直接使用這兩種格式來作為紋理的主要存儲格式。

(2)紋理尺寸

一般來說,紋理尺寸越大,則內(nèi)存占用越大。所以,盡可能降低紋理尺寸,如果512x512的紋理對于顯示效果已經(jīng)夠用,那么就不要使用1024x1024的紋理,因為后者的內(nèi)存占用是前者的四倍。因此,我們在UWA測評報告中,將紋理的尺寸進(jìn)行詳細(xì)展示,以便開發(fā)團(tuán)隊進(jìn)行快速檢測。

(3) Mipmap功能

Mipmap旨在有效降低渲染帶寬的壓力,提升游戲的渲染效率。但是,開啟Mipmap會將紋理內(nèi)存提升1.33倍。對于具有較大縱深感的3D游戲來說,3D場景模型和角色我們一般是建議開啟Mipmap功能的,但是在我們的測評項目中,經(jīng)常會發(fā)現(xiàn)部分UI紋理也開啟了Mipmap功能。這其實就沒有必要的,絕大多數(shù)UI均是渲染在屏幕最上層,開啟Mipmap并不會提升渲染效率,反倒會增加無謂的內(nèi)存占用。因此,建議研發(fā)團(tuán)隊在UWA的測評報告中通過Mipmap一項進(jìn)行排序,詳細(xì)檢測開啟Mipmap功能的資源是否為UI資源。

(4) Read & Write

一般情況下,紋理資源的“Read & Write”功能在Unity引擎中是默認(rèn)關(guān)閉的。但是,我們?nèi)匀辉陧椖可疃葍?yōu)化時發(fā)現(xiàn)了不少項目的紋理資源會開啟該選項。對此,我們建議研發(fā)團(tuán)隊密切關(guān)注紋理資源中該選項的使用,因為開啟該選項將會使紋理內(nèi)存增大一倍。

二、網(wǎng)格

網(wǎng)格資源在較為復(fù)雜的游戲中,往往占據(jù)較高的內(nèi)存。對于網(wǎng)格資源來說,它在使用時應(yīng)該注意哪些方面呢?

Normal、Color和Tangent

在我們深度優(yōu)化過的大量項目中,Mesh資源的數(shù)據(jù)中經(jīng)常會含有大量的Color數(shù)據(jù)、Normal數(shù)據(jù)和Tangent數(shù)據(jù)。這些數(shù)據(jù)的存在將大幅度增加Mesh資源的文件體積和內(nèi)存占用。其中,Color數(shù)據(jù)和Normal數(shù)據(jù)主要為3DMax、Maya等建模軟件導(dǎo)出時設(shè)置所生成,而Tangent一般為導(dǎo)入引擎時生成。

更為麻煩的是,如果項目對Mesh進(jìn)行Draw Call Batching操作的話,那么將很有可能進(jìn)一步增大總體內(nèi)存的占用。比如,100個Mesh進(jìn)行拼合,其中99個Mesh均沒有Color、Tangent等屬性,剩下一個則包含有Color、Normal和Tangent屬性,那么Mesh拼合后,CombinedMesh中將為每個Mesh來添加上此三個頂點屬性,進(jìn)而造成很大的內(nèi)存開銷。正因如此,我們在UWA測評報告中為每個Mesh展示了其Normal、Color和Tangent屬性的具體使用情況,研發(fā)團(tuán)隊可以直接針對每種屬性進(jìn)行排序查看,直接定位出現(xiàn)冗余數(shù)據(jù)的資源。

一般來說這些數(shù)據(jù)主要為Shader所用,來生成較為酷炫的效果。所以,建議研發(fā)團(tuán)隊針對項目中的網(wǎng)格資源進(jìn)行詳細(xì)檢測,查看該模型的渲染Shader中是否需要這些數(shù)據(jù)進(jìn)行渲染。

限于篇幅,我們今天只針對紋理和網(wǎng)格資源進(jìn)行詳細(xì)介紹,對于動畫片段、音頻片段等其他資源,建議您直接通過UWA測評報告中進(jìn)行查看。

2、引擎模塊自身占用

引擎自身中存在內(nèi)存開銷的部分紛繁復(fù)雜,可以說是由巨量的“微小”內(nèi)存所累積起來的,比如GameObject及其各種Component(最大量的Component應(yīng)該算是Transform了)、ParticleSystem、MonoScript以及各種各樣的模塊Manager(SceneManager、CanvasManager、PersistentManager等)...

一般情況下,上面所指出的引擎各組成部分的內(nèi)存開銷均比較小,真正占據(jù)較大內(nèi)存開銷的是這兩處:WebStream 和 SerializedFile。其絕大部分的內(nèi)存分配則是由AssetBundle加載資源所致。簡單言之,當(dāng)您使用new WWW或CreateFromMemory來加載AssetBundle時,Unity引擎會加載原始數(shù)據(jù)到內(nèi)存中并對其進(jìn)行解壓,而WebStream的大小則是AssetBundle原始文件大小 + 解壓后的數(shù)據(jù)大小 + DecompressionBuffer(0.5MB)。同時,由于Unity 5.3版本之前的AssetBundle文件為LZMA壓縮,其壓縮比類似于Zip(20%-25%),所以對于一個1MB的原始AssetBundle文件,其加載后WebStream的大小則可能是5~6MB,因此,當(dāng)項目中存在通過new WWW加載多個AssetBundle文件,且AssetBundle又無法及時釋放時,WebStream的內(nèi)存可能會很大,這是研發(fā)團(tuán)隊需要時刻關(guān)注的。

對于SerializedFile,則是當(dāng)你使用LoadFromCacheOrDownload、CreateFromFile或new WWW本地AssetBundle文件時產(chǎn)生的序列化文件。

對于WebStream和SerializedFile,你需要關(guān)注以下兩點:

是否存在AssetBundle沒有被清理干凈的情況。開發(fā)團(tuán)隊可以通過Unity Profiler直接查看其使用具體的使用情況,并確定Take Sample時AssetBundle的存在是否合理;

對于占用WebStream較大的AssetBundle文件(如UI Atlas相關(guān)的AssetBundle文件等),建議使用LoadFromCacheOrDownLoad或CreateFromFile來進(jìn)行替換,即將解壓后的AssetBundle數(shù)據(jù)存儲于本地Cache中進(jìn)行使用。這種做法非常適合于內(nèi)存特別吃緊的項目,即通過本地的磁盤空間來換取內(nèi)存空間。

3、托管堆內(nèi)存占用

對于目前絕大多數(shù)基于Unity引擎開發(fā)的項目而言,其托管堆內(nèi)存是由Mono分配和管理的?!巴泄堋?的本意是Mono可以自動地改變堆的大小來適應(yīng)你所需要的內(nèi)存,并且適時地調(diào)用垃圾回收(Garbage Collection)操作來釋放已經(jīng)不需要的內(nèi)存,從而降低開發(fā)人員在代碼內(nèi)存管理方面的門檻。

但是這并不意味著研發(fā)團(tuán)隊可以在代碼中肆無忌憚地開辟托管堆內(nèi)存,因為目前Unity所使用的Mono版本存在一個很嚴(yán)重的問題,即:Mono的堆內(nèi)存一旦分配,就不會返還給系統(tǒng)。這意味著Mono的堆內(nèi)存是只升不降的。舉個例子,項目運(yùn)行時,在場景A中開辟了60MB的托管堆內(nèi)存,而到下一場景B時,只需要使用20MB的托管堆內(nèi)存,那么Mono中將會存在40MB空閑的堆內(nèi)存,且不會返還給系統(tǒng)。這是我們非常不愿意看到的現(xiàn)象,因為對于游戲(特別是移動游戲)來說,內(nèi)存的占用可謂是寸土寸金的,讓Mono毫無必要地鎖住大量的內(nèi)存,是一件非常浪費(fèi)的事情。所以,我們在UWA測評報告中,為研發(fā)團(tuán)隊統(tǒng)計了測試過程中累積的函數(shù)堆內(nèi)存分配量,大家只需要通過查看堆內(nèi)存分配Top10的函數(shù),即可快速對其底層代碼實現(xiàn)進(jìn)行查看,定位是否有分配不必要堆內(nèi)存的代碼存在。

讀到這里,你可能會產(chǎn)生這樣的疑問:我知道了哪些函數(shù)的堆內(nèi)存分配大了,但是我該如何去進(jìn)一步定位不必要的堆內(nèi)存呢?

這是我們經(jīng)常遇到的問題,所以在我們的深度項目優(yōu)化服務(wù)中,我們都會直接進(jìn)駐到項目團(tuán)隊,現(xiàn)場查看項目代碼并對問題代碼進(jìn)行定位。在經(jīng)過了大量的深度檢測后,我們發(fā)現(xiàn)用戶不必要的堆內(nèi)存分配主要來自于以下幾個方面:

高頻率地 New Class/Container/Array等。研發(fā)團(tuán)隊切記不要在Update、FixUpdate或較高調(diào)用頻率的函數(shù)中開辟堆內(nèi)存,這會對你的項目內(nèi)存和性能均造成非常大的傷害。做個簡單的計算,假設(shè)你的項目中某一函數(shù)每一幀只分配100B的堆內(nèi)存,幀率是1秒30幀,那么1秒鐘游戲的堆內(nèi)存分配則是3KB,1分鐘的堆內(nèi)存分配就是180KB,10分鐘后就已經(jīng)分配了1.8MB。如果你有10個這樣的函數(shù),那么10分鐘后,堆內(nèi)存的分配就是18MB,這期間,它可能會造成Mono的堆內(nèi)存峰值升高,同時又可能引起了多次GC的調(diào)用。在我們的測評項目中,一個函數(shù)在10分鐘內(nèi)分配上百M(fèi)B的情況比比皆是,有時候甚至?xí)峙渖螱B的堆內(nèi)存。

Log輸出。我們發(fā)現(xiàn)在大量的項目中,仍然存在大量Log輸出的情況。建議研發(fā)團(tuán)隊對自身Log的輸出進(jìn)行嚴(yán)格的控制,僅保留關(guān)鍵Log,以避免不必要的堆內(nèi)存分配。對此,我們在UWA測評報告中對Log的輸出進(jìn)行了詳細(xì)的檢測,不僅提供詳細(xì)的性能開銷,同時占用Log輸出的調(diào)用路徑。這樣,研發(fā)團(tuán)隊可直接通過報告定位和控制Log的輸出。

UIPanel.LateUpdate。這是NGUI中CPU和堆內(nèi)存開銷最大的函數(shù)。它本身只是一個函數(shù),但NGUI的大量使用使它逐漸成為了一個不可忽視規(guī)則。該函數(shù)的堆內(nèi)存分配和自身CPU開銷,其根源上是一致的,即是由UI網(wǎng)格的重建造成。

關(guān)于代碼堆內(nèi)存分配的注意點還有很多,比如String連接、部分引擎API(GetComponent)的使用等等,這些已經(jīng)是老生常談了,鑒于篇幅限制不在此處多作介紹,大家感興趣可以Google自行搜索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10896

    瀏覽量

    212520
  • 內(nèi)存管理
    +關(guān)注

    關(guān)注

    0

    文章

    168

    瀏覽量

    14162
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9641

    瀏覽量

    150574

原文標(biāo)題:游戲性能優(yōu)化技術(shù)干貨分享——內(nèi)存管理

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    CPU內(nèi)存GPU內(nèi)存進(jìn)行分組方式實戰(zhàn)

    CPU+GPU協(xié)同計算中,CPUGPU的計算能力不同,靜態(tài)地給CPUGPU劃分任務(wù)會導(dǎo)致CPU
    的頭像 發(fā)表于 05-03 09:01 ?7194次閱讀
    <b class='flag-5'>CPU</b><b class='flag-5'>內(nèi)存</b>或<b class='flag-5'>GPU</b><b class='flag-5'>內(nèi)存</b><b class='flag-5'>進(jìn)行</b>分組方式實戰(zhàn)

    CPU、GPU內(nèi)存知識科普

    本文內(nèi)容包括CPU、內(nèi)存GPU知識,本期重點更新GPUCPU部分知識。比如:GPU更新包括架
    的頭像 發(fā)表于 11-13 11:47 ?1987次閱讀
    <b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>和<b class='flag-5'>內(nèi)存</b>知識科普

    GPU的作用、原理及與CPU、DSP的區(qū)別

    今天,GPU已經(jīng)不再局限于3D圖形處理了,GPU通用計算技術(shù)發(fā)展已經(jīng)引起業(yè)界不少的關(guān)注,事實也證明在浮點運(yùn)算、并行計算等部分計算方面,GPU可以提供數(shù)十倍乃至于上百倍于
    發(fā)表于 11-04 10:04

    GPU

    ;L之外,還要做內(nèi)存管理、輸入響應(yīng)等非3D圖形處理工作,因此在實際運(yùn)算的時候性能會大打折扣,常常出現(xiàn)顯卡等待CPU數(shù)據(jù)的情況,其運(yùn)算速度遠(yuǎn)跟不上今天復(fù)雜維游戲的要求。即使
    發(fā)表于 01-16 08:59

    如何在vGPU環(huán)境中優(yōu)化GPU性能

    大家好,我收到了關(guān)于如何在vGPU環(huán)境中優(yōu)化GPU性能的兩個請求,并認(rèn)為這將是我們的GRID論壇上的一個很好的線程,每個人都可以在他們?nèi)绾挝⒄{(diào)vGPU環(huán)境方面添加他們的經(jīng)驗。讓我從一些
    發(fā)表于 09-29 14:18

    CPU,GPU,TPU,NPU都是什么

    嵌入式算法移植優(yōu)化學(xué)習(xí)筆記5——CPU,GPU,TPU,NPU都是什么一、什么是CPU?二、什么是GPU?
    發(fā)表于 12-15 06:07

    充分利用Arm NN進(jìn)行GPU推理

    ACL19.05版本中,調(diào)諧器進(jìn)行優(yōu)化,現(xiàn)在我們可以從個級別的調(diào)優(yōu)中進(jìn)行選擇:“窮舉”、“快速”和“正常”。這些級別在調(diào)優(yōu)性能和調(diào)優(yōu)時間
    發(fā)表于 04-11 17:33

    一文帶你詳解芯片--SL8541e-系統(tǒng)性能優(yōu)化

    背景 伙伴反饋,設(shè)備操作卡頓,OH基礎(chǔ)系統(tǒng)版本應(yīng)用操作慢,應(yīng)用人機(jī)交互體驗差。本文為你總結(jié)芯片解決方案–SL8541e-系統(tǒng)性能優(yōu)化。主要內(nèi)容包括: *1. 確定優(yōu)化思路 幀率
    發(fā)表于 08-22 09:12

    什么是GPUGPU主要作用和工作原理以及GPUCPU的區(qū)別

    圖像和特效時主要依賴CPU的處理能力,稱為軟加速。3D顯示芯片是將維圖像和特效處理功能集中在顯示芯片內(nèi),也即所謂的硬件加速功能。顯示芯片通常是顯示卡上最大的芯片(也是引腳最多的)。GPU
    發(fā)表于 09-13 09:43 ?13次下載

    Linux CPU性能應(yīng)該如何優(yōu)化

    在Linux系統(tǒng)中,由于成本的限制,往往會存在資源上的不足,例如 CPU內(nèi)存、網(wǎng)絡(luò)、IO 性能。本文,就對 Linux 進(jìn)程和 CPU 的原理進(jìn)行
    的頭像 發(fā)表于 01-18 08:52 ?3405次閱讀

    Unity 3D優(yōu)化個的注意方面

    Unity優(yōu)化是一個很大的概念,我們優(yōu)化時需要注意方面CPU優(yōu)化
    的頭像 發(fā)表于 03-13 16:47 ?3426次閱讀

    cpu主要性能指標(biāo)是什么 CPUGPU的設(shè)計區(qū)別

    CPUGPU的設(shè)計區(qū)別 CPU需要很強(qiáng)的通用性來處理各種不同的數(shù)據(jù)類型;GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境。
    的頭像 發(fā)表于 08-31 12:03 ?9677次閱讀

    CPUGPU之間的主要區(qū)別

    的任務(wù)。GPU的指令有限,只能執(zhí)行與圖形相關(guān)的任務(wù)。它通??梢詧?zhí)行任何類型的任務(wù),包括圖形,但不是以非常優(yōu)化的方式。雖然GPU的唯一目的是比CPU更快地處理圖像和3
    的頭像 發(fā)表于 12-14 08:28 ?831次閱讀
    <b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>之間的<b class='flag-5'>主要</b>區(qū)別

    為什么GPUCPU更快?

    大規(guī)模數(shù)據(jù)集時比CPU更快的根本原因。內(nèi)存帶寬:GPU內(nèi)存帶寬比CPU高得多。內(nèi)存帶寬是指數(shù)據(jù)
    的頭像 發(fā)表于 01-26 08:30 ?2502次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    Windows管理內(nèi)存主要方式

    Windows操作系統(tǒng)提供了多種方式來管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能優(yōu)化。以下是關(guān)于Windows管理內(nèi)存
    的頭像 發(fā)表于 10-12 17:09 ?1187次閱讀