資料介紹
幾個月前,Imagination在其“Inspire年度技術(shù)大會”上發(fā)布了全新的第十代PowerVR圖形處理架構(gòu)IMG A系列(IMG A-Series)。作為Imagination有史以來性能最強大的圖形處理器(GPU)半導體知識產(chǎn)權(quán)(IP)產(chǎn)品,IMG A系列GPU具有多維度的可擴展性、低功耗圖形處理和計算性能,是一系列垂直應用領域的理想解決方案,可支持手機、平板電腦、游戲、汽車、機頂盒、8K超高清電視、桌面處理器、服務器等應用,因此Imagination稱其為“萬物GPU”(The GPU of Everything)。
IMG A系列是GPU技術(shù)的一次重大飛躍,在每一個維度上都提供了顯著的改進。相比Imagination的第九代PowerVR GPU,比如聯(lián)發(fā)科(MediaTek)的Helio P95 SoC所采用的PowerVR GM9446 GPU,在相同的時鐘和半導體工藝上,IMG A系列的圖形處理性能提高了2.5倍,人工智能(AI)處理速度提高了8倍,同時功耗降低了60%,這些特性著實讓人印象深刻。
與當前其他可用的GPU IP解決方案相比,IMG A系列具有更佳的PPA(性能、功耗、面積)指標,可提供更高的性能、更低的功耗(與采用相同時鐘和半導體工藝的競品相比)和更低的帶寬(與競爭對手使用相同的緩存大小),并且所有產(chǎn)品均占用更小的芯片面積。在所有應用領域中,IMG A系列GPU都能夠在更長的運行時間里以極低的功耗預算提供最佳性能,因此它確實是可應用于一切設備的“萬物GPU”。
IMG A系列的增強性能
相比Imagination現(xiàn)在提供的GPU產(chǎn)品,IMG A系列實現(xiàn)了顯著的性能提升,你可能會好奇他們是如何一步到位做到這一點的,其實這些改進源于各方面的性能增強,下面來具體看看他們通過哪些技術(shù)手段實現(xiàn)了這些性能增強。
超寬的ALU單元
帶來顯著性能加速的原因是ALU單元的變化。ALU單元的全稱是算術(shù)邏輯單元,它是圖形處理單元的基本部分,可以為圖形處理和計算任務提供強大的計算性能。對于IMG A系列而言,Imagination從雙MAD x32寬度的ALU改為了單MAD 128線程寬度的ALU。通過轉(zhuǎn)換為128線程寬的單元,IMG A系列能夠在每個時鐘周期內(nèi)執(zhí)行更多的操作指令,從而為提升功耗效率奠定了基礎。當然,保證ALU單元有足夠的數(shù)據(jù)也很關鍵,Imagination通過幾個機制確保了這一點,其結(jié)果就是性能顯著提升,功耗明顯降低。
HyperLane(超線程)技術(shù)
現(xiàn)代的GPU都需要支持多任務處理,為了能夠高效且安全地實現(xiàn)這一點,Imagination開發(fā)了HyperLane技術(shù),并將其用于IMG A系列。從最低性能到最高性能的每款A系列GPU,都擁有8個獨立的硬件控制通道。這些通道在內(nèi)存中是相互隔離的,意味著可以有8個完全不同的工作負載同時運行。這樣,不同的任務便可以同時交由GPU處理,從而實現(xiàn)了完全安全的GPU多任務處理。這一功能在目前的市場上是獨一無二的。
HyperLane技術(shù)還有一個特性稱為動態(tài)性能控制,它可以確保GPU將性能合理地分配給多個圖形處理或計算任務,以實現(xiàn)GPU利用率的最大化,從而提升實際性能。例如,你可以在使用信息娛樂系統(tǒng)的同時在GPU上運行儀表盤,而不必擔心至關重要的儀表盤性能受到影響。關于動態(tài)性能控制,Imagination在桌面處理器領域也進行了很好的探索,一個物理內(nèi)核作為多個邏輯內(nèi)核出現(xiàn),支持多任務同時處理,從而提升硬件資源利用率和多任務處理性能。
HyperLane技術(shù)也可以在安全方面為諸多應用提供支持,例如數(shù)字電視、安防監(jiān)控等。對于數(shù)字電視的內(nèi)容提供商而言,一個關鍵的問題是通過數(shù)字版權(quán)管理來確保他們的內(nèi)容IP(無論是視頻還是音頻)安全。雖然有些競爭廠商的GPU提供了“TrustZone(信任區(qū))”特性,但這是一種“把所有雞蛋放進一個籃子里”的做法,即所有應用程序都部署在一個安全內(nèi)存中。而HyperLane技術(shù)的內(nèi)存隔離功能是將每個服務或應用程序放在完全獨立的安全內(nèi)存中,因此即使一個應用程序受到黑客攻擊也不會暴露其他應用程序的內(nèi)容。
AI協(xié)同功能
IMG A系列GPU還支持一項新功能——AI協(xié)同(AI Synergy),該功能可支持SoC設計人員利用IMG A系列令人難以置信的計算能力來加速其AI工作負載。通過AI協(xié)同功能,GPU可以在提供圖形處理能力的同時,使用其備用資源支持可編程AI,同時固定功能的AI運算則可以放在專用的神經(jīng)網(wǎng)絡加速器(例如Imagination的PowerVR 3NX NNA)上執(zhí)行,從而實現(xiàn)更高的AI性能。AI 協(xié)同功能可在最小的芯片面積上支持可編程AI,而統(tǒng)一的軟件棧則可實現(xiàn)靈活性和出色的性能。
配置緩存空間
IMG A系列產(chǎn)品的另一項新特性是緩存大小可以根據(jù)自己的需要進行配置,從而支持用戶大幅度降低GPU的帶寬需求。用戶可以減少更多的系統(tǒng)級緩存,以減少使用系統(tǒng)內(nèi)存的需求,或者使用性價比高的外部RAM來降低功耗、發(fā)熱量和系統(tǒng)成本。
“完美像素”特性
“完美像素”特性可以歸結(jié)為在不犧牲圖像質(zhì)量的情況下提供出色性能的一系列技術(shù)。Imagination為了實現(xiàn)“完美像素”,在IMG A系列GPU中應用了許多新技術(shù)和成熟技術(shù)。例如,Imagination獨有的PVRIC4圖像壓縮技術(shù),可以實現(xiàn)無損壓縮或高度優(yōu)化的有損壓縮,從而確保至少減少50%的帶寬并節(jié)省50%的內(nèi)存占用。IMG A系列中還加入了新的細節(jié)等級算法和各向異性濾波算法,這兩種算法都能夠顯著提高圖像質(zhì)量。
IMG A系列支持各類應用場景
之所以將IMG A系列GPU稱為“萬物GPU”,是因為它可以為各類應用場景提供理想解決方案,包括移動設備、游戲、汽車、數(shù)據(jù)中心/服務器、數(shù)字電視/機頂盒、安防監(jiān)控、桌面處理器、人工智能物聯(lián)網(wǎng)(AIoT)等應用。
下面列舉了一些IMG A系列可以提供支持的應用案例。
游戲
由于散熱條件限制,大多數(shù)移動GPU都很難提供持續(xù)一致的游戲體驗,即它們在短時間內(nèi)可快速運行,然后隨著芯片發(fā)熱,性能會下降到不可接受的水平,最后再也無法恢復,從而導致令人失望的用戶體驗。
IMG A系列GPU可以通過提供持續(xù)穩(wěn)定的幀速來消除因芯片過熱導致的時鐘降頻甚至故障等情況,從而為游戲用戶提供最佳的體驗。Imagination通過多種技術(shù)來確保實現(xiàn)這一點:基于分塊延遲渲染(TBDR)技術(shù),IMG A系列GPU只需繪制屏幕上可見的內(nèi)容,這使它具有與生俱來的帶寬和功耗優(yōu)勢;使用了主動動態(tài)電壓與頻率調(diào)節(jié)(DVFS)及時限調(diào)度(Deadline Scheduling)算法的先進功耗控制技術(shù),可提供具有超低響應延遲的快速功耗控制能力;如果GPU的某些部分沒有得到充分利用或沒用于處理工作,它們就會被立即降頻甚至進入睡眠狀態(tài),以確保最佳的功耗效率。
此外,Imagination對“完美像素”的強烈專注也使得IMG A系列GPU可以為游戲用戶提供完美的圖像質(zhì)量。這體現(xiàn)在很多技術(shù)細節(jié)上,包括行業(yè)領先的視覺無損PVRIC壓縮技術(shù)、完全重新設計的各向異性濾波算法,以及其他一些全新設計的算法實現(xiàn)。
汽車
在現(xiàn)代化汽車中,數(shù)字儀表盤顯示的信息對駕駛員至關重要,因此要求GPU為其提供充分的性能支持。同時,諸如信息娛樂系統(tǒng)、衛(wèi)星導航等其他功能也需要GPU的支持。所有這些功能可以由單個高性能IMG A系列GPU來驅(qū)動。通過將Imagination的硬件虛擬化技術(shù)與HyperLane技術(shù)結(jié)合在一起,可以提供優(yōu)先級技術(shù)和完美的內(nèi)存隔離機制,從而使IMG A系列GPU在運行上述所有功能的同時,可以確保主要任務的運行效率并滿足用戶對其他功能的體驗需求。這意味著,其他工作負載的運行不會影響儀表盤的使用,同時當其他工作負載出現(xiàn)問題時也可以保護儀表盤的數(shù)據(jù)不受影響。
數(shù)據(jù)中心
GPU作為高度并行的計算協(xié)處理器,其擁有的能力使其非常適合于加速包括3D圖形在內(nèi)的多種任務。IMG A系列GPU的設計可以滿足云端的圖形處理和計算需求,其將會推動基于云的AI訓練和推理以及未來云游戲體驗的發(fā)展。此外,數(shù)據(jù)中心對于能效是非常敏感的,而IMG A系列的低功耗設計使其非常適合數(shù)據(jù)中心對能效的需求,比如HyperLane技術(shù)可以最大化GPU的資源利用率,從而可有效地提升能效。
IMG A系列IP內(nèi)核
IMG A系列GPU從多個維度實現(xiàn)了性能可擴展性,從面向入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,一直到用于高性能設備的速度高達每秒2萬億次浮點運算(2 TFLOPS)的內(nèi)核,甚至到針對云應用的、速度超越2 TFLOPS的多核解決方案,IMG A系列可以面向各種性能需求提供支持。
Imagination最新發(fā)布的IMG A系列GPU涵蓋AXT、AXM、AXE三類產(chǎn)品,共七款內(nèi)核,其中包括四款高性能內(nèi)核,一款面向中端設備的內(nèi)核,以及兩款可為更低成本的細分市場提供最佳PPA指標的內(nèi)核:
IMG AXT-64-2048旗艦版:擁有2 TFLOPS、64 Gpixels的性能,以及8 TOPS的AI性能。
IMG AXT-48-1536:面向高端手機,性能為1.5 TFLOPS、48 Gpixels和6 TOPS。
IMG AXT-32-1024:面向高性能移動設備和汽車應用,性能為1TFLOPS、32 Gpixels和4TOPS。
IMG AXT-16-512:面向中高性能移動設備和汽車應用,性能為0.5 TFLOPS、16 Gpixels和2 TOPS。
IMG AXM-8-256:面向中端移動設備,性能為 0.25 TFLOPS、8 Gpixels和1 TOPS。
IMG AXE-2-16:面向高端物聯(lián)網(wǎng)、入門級數(shù)字電視/機頂盒(DTV/STB)、顯示和其他需要高填充率的應用,性能為16 GFLOPS和2 Gpixels。
IMG AXE-1-16:面向入門級移動設備和物聯(lián)網(wǎng),為同類產(chǎn)品中速度最快的支持Vulkan功能的GPU,性能為 16 GFLOPS和1 Gpixels。
面向未來
目前,Imagination已經(jīng)將IMG A系列GPU在多個市場中授權(quán)給了客戶,首批搭載該IP的SoC器件將在今年供貨。
本文介紹的只是IMG A系列 GPU的一部分功能特性和應用場景,如果你想了解“萬物GPU”的更多信息,歡迎點擊“此處”訪問Imagination官網(wǎng)頁面。
更重要的是,IMG A系列GPU只是Imagination一個新的起點,他們制定了一個從IMG A系列開始的產(chǎn)品開發(fā)路線圖,在未來幾個月至幾年內(nèi),他們將帶來更多的產(chǎn)品設計。當然,如果你正在為產(chǎn)品設計尋找GPU IP,那么IMG A系列無疑是你當前最好的選擇。
- 大模型發(fā)展下,國產(chǎn)GPU的機會和挑戰(zhàn) 6次下載
- 鴻蒙出世,聯(lián)通萬物.zip
- 支持并發(fā)訪問可動態(tài)更新的GPU無鎖跳步哈希表 26次下載
- 獲得GPU存儲性能的四種方法 28次下載
- 基于GPU的稀疏矩陣存儲格式優(yōu)化綜述 18次下載
- GPU的工作原理分析 19次下載
- IMG A系列GPU的HyperLane(超線程)技術(shù)
- XS GPU系統(tǒng)產(chǎn)品亮相:專注汽車行業(yè)的終極GPU系列
- 獲得GPU存儲性能的方法有哪些 2次下載
- 基于虛擬化的多GPU深度神經(jīng)網(wǎng)絡訓練框架 0次下載
- YUV視頻GPU實時拼接 2次下載
- 基于GPU加速的醫(yī)學圖像配準技術(shù) 1次下載
- 萬物互聯(lián)的android系統(tǒng)開發(fā) 8次下載
- 基于GPU的并行APSP問題的研究 19次下載
- 基于GPU的點模型實時繪制
- gpu是什么和cpu的區(qū)別 1.4w次閱讀
- 為什么GPU比CPU更快? 1733次閱讀
- 超微gpu服務器評測 1038次閱讀
- CPU、GPU和內(nèi)存知識科普 1535次閱讀
- 什么是虛擬GPU?虛擬GPU的優(yōu)勢有哪些? 1542次閱讀
- 選擇GPU服務器需要考慮哪些情況如何才能提升GPU存儲性能 3377次閱讀
- GPU和CPU有什么區(qū)別GPU的詳細介紹 2.3w次閱讀
- GPU的原理和渲染流程詳細說明 8275次閱讀
- GPU服務器的詳細介紹和工作原理說明 6995次閱讀
- 一文知道CPU和GPU的區(qū)別 5277次閱讀
- GPU與CPU間的比較 4534次閱讀
- 如何在AMD的GPU上運行TensorFlow? 2.4w次閱讀
- GPU原理 GPU渲染流程 9300次閱讀
- 將TVM用于移動端常見的ARM GPU,提高移動設備對深度學習的支持能力 1w次閱讀
- 什么是強制gpu渲染_強制渲染gpu有什么用 7712次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1491次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 4次下載 | 免費
- 8基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多