電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>人工智能>深度揭秘:"萬物GPU"(The GPU of Everything)

深度揭秘:"萬物GPU"(The GPU of Everything)

2021-01-24 | pdf | 1.11MB | 次下載 | 2積分

資料介紹

幾個月前,Imagination在其“Inspire年度技術(shù)大會”上發(fā)布了全新的第十代PowerVR圖形處理架構(gòu)IMG A系列(IMG A-Series)。作為Imagination有史以來性能最強大的圖形處理器GPU半導體知識產(chǎn)權(quán)(IP)產(chǎn)品,IMG A系列GPU具有多維度的可擴展性、低功耗圖形處理和計算性能,是一系列垂直應用領域的理想解決方案,可支持手機、平板電腦、游戲、汽車、機頂盒、8K超高清電視、桌面處理器、服務器等應用,因此Imagination稱其為“萬物GPU”(The GPU of Everything)。

IMG A系列是Imagination有史以來性能最強大的GPU

IMG A系列是GPU技術(shù)的一次重大飛躍,在每一個維度上都提供了顯著的改進。相比Imagination的第九代PowerVR GPU,比如聯(lián)發(fā)科(MediaTek)的Helio P95 SoC所采用的PowerVR GM9446 GPU,在相同的時鐘和半導體工藝上,IMG A系列的圖形處理性能提高了2.5倍,人工智能AI)處理速度提高了8倍,同時功耗降低了60%,這些特性著實讓人印象深刻。

與當前其他可用的GPU IP解決方案相比,IMG A系列具有更佳的PPA(性能、功耗、面積)指標,可提供更高的性能、更低的功耗(與采用相同時鐘和半導體工藝的競品相比)和更低的帶寬(與競爭對手使用相同的緩存大小),并且所有產(chǎn)品均占用更小的芯片面積。在所有應用領域中,IMG A系列GPU都能夠在更長的運行時間里以極低的功耗預算提供最佳性能,因此它確實是可應用于一切設備的“萬物GPU”。

IMG A系列在性能、AI處理速度和功耗等方面均實現(xiàn)了顯著改進

IMG A系列的增強性能

相比Imagination現(xiàn)在提供的GPU產(chǎn)品,IMG A系列實現(xiàn)了顯著的性能提升,你可能會好奇他們是如何一步到位做到這一點的,其實這些改進源于各方面的性能增強,下面來具體看看他們通過哪些技術(shù)手段實現(xiàn)了這些性能增強。

超寬的ALU單元

帶來顯著性能加速的原因是ALU單元的變化。ALU單元的全稱是算術(shù)邏輯單元,它是圖形處理單元的基本部分,可以為圖形處理和計算任務提供強大的計算性能。對于IMG A系列而言,Imagination從雙MAD x32寬度的ALU改為了單MAD 128線程寬度的ALU。通過轉(zhuǎn)換為128線程寬的單元,IMG A系列能夠在每個時鐘周期內(nèi)執(zhí)行更多的操作指令,從而為提升功耗效率奠定了基礎。當然,保證ALU單元有足夠的數(shù)據(jù)也很關鍵,Imagination通過幾個機制確保了這一點,其結(jié)果就是性能顯著提升,功耗明顯降低。

IMG A系列采用了128線程寬的ALU單元

HyperLane(超線程)技術(shù)

現(xiàn)代的GPU都需要支持多任務處理,為了能夠高效且安全地實現(xiàn)這一點,Imagination開發(fā)了HyperLane技術(shù),并將其用于IMG A系列。從最低性能到最高性能的每款A系列GPU,都擁有8個獨立的硬件控制通道。這些通道在內(nèi)存中是相互隔離的,意味著可以有8個完全不同的工作負載同時運行。這樣,不同的任務便可以同時交由GPU處理,從而實現(xiàn)了完全安全的GPU多任務處理。這一功能在目前的市場上是獨一無二的。

HyperLane技術(shù)還有一個特性稱為動態(tài)性能控制,它可以確保GPU將性能合理地分配給多個圖形處理或計算任務,以實現(xiàn)GPU利用率的最大化,從而提升實際性能。例如,你可以在使用信息娛樂系統(tǒng)的同時在GPU上運行儀表盤,而不必擔心至關重要的儀表盤性能受到影響。關于動態(tài)性能控制,Imagination在桌面處理器領域也進行了很好的探索,一個物理內(nèi)核作為多個邏輯內(nèi)核出現(xiàn),支持多任務同時處理,從而提升硬件資源利用率和多任務處理性能。

HyperLane技術(shù)也可以在安全方面為諸多應用提供支持,例如數(shù)字電視、安防監(jiān)控等。對于數(shù)字電視的內(nèi)容提供商而言,一個關鍵的問題是通過數(shù)字版權(quán)管理來確保他們的內(nèi)容IP(無論是視頻還是音頻)安全。雖然有些競爭廠商的GPU提供了“TrustZone(信任區(qū))”特性,但這是一種“把所有雞蛋放進一個籃子里”的做法,即所有應用程序都部署在一個安全內(nèi)存中。而HyperLane技術(shù)的內(nèi)存隔離功能是將每個服務或應用程序放在完全獨立的安全內(nèi)存中,因此即使一個應用程序受到黑客攻擊也不會暴露其他應用程序的內(nèi)容。

每款IMG A系列GPU都擁有8個獨立的硬件控制通道

AI協(xié)同功能

IMG A系列GPU還支持一項新功能——AI協(xié)同(AI Synergy),該功能可支持SoC設計人員利用IMG A系列令人難以置信的計算能力來加速其AI工作負載。通過AI協(xié)同功能,GPU可以在提供圖形處理能力的同時,使用其備用資源支持可編程AI,同時固定功能的AI運算則可以放在專用的神經(jīng)網(wǎng)絡加速器(例如Imagination的PowerVR 3NX NNA)上執(zhí)行,從而實現(xiàn)更高的AI性能。AI 協(xié)同功能可在最小的芯片面積上支持可編程AI,而統(tǒng)一的軟件棧則可實現(xiàn)靈活性和出色的性能。

AI協(xié)同功能使IMG A系列GPU可同時支持圖形處理和可編程AI

配置緩存空間

IMG A系列產(chǎn)品的另一項新特性是緩存大小可以根據(jù)自己的需要進行配置,從而支持用戶大幅度降低GPU的帶寬需求。用戶可以減少更多的系統(tǒng)級緩存,以減少使用系統(tǒng)內(nèi)存的需求,或者使用性價比高的外部RAM來降低功耗、發(fā)熱量和系統(tǒng)成本。

“完美像素”特性

“完美像素”特性可以歸結(jié)為在不犧牲圖像質(zhì)量的情況下提供出色性能的一系列技術(shù)。Imagination為了實現(xiàn)“完美像素”,在IMG A系列GPU中應用了許多新技術(shù)和成熟技術(shù)。例如,Imagination獨有的PVRIC4圖像壓縮技術(shù),可以實現(xiàn)無損壓縮或高度優(yōu)化的有損壓縮,從而確保至少減少50%的帶寬并節(jié)省50%的內(nèi)存占用。IMG A系列中還加入了新的細節(jié)等級算法和各向異性濾波算法,這兩種算法都能夠顯著提高圖像質(zhì)量。

IMG A系列支持各類應用場景

之所以將IMG A系列GPU稱為“萬物GPU”,是因為它可以為各類應用場景提供理想解決方案,包括移動設備、游戲、汽車、數(shù)據(jù)中心/服務器、數(shù)字電視/機頂盒、安防監(jiān)控、桌面處理器、人工智能物聯(lián)網(wǎng)(AIoT)等應用。

下面列舉了一些IMG A系列可以提供支持的應用案例。

游戲

由于散熱條件限制,大多數(shù)移動GPU都很難提供持續(xù)一致的游戲體驗,即它們在短時間內(nèi)可快速運行,然后隨著芯片發(fā)熱,性能會下降到不可接受的水平,最后再也無法恢復,從而導致令人失望的用戶體驗。

IMG A系列GPU可以通過提供持續(xù)穩(wěn)定的幀速來消除因芯片過熱導致的時鐘降頻甚至故障等情況,從而為游戲用戶提供最佳的體驗。Imagination通過多種技術(shù)來確保實現(xiàn)這一點:基于分塊延遲渲染(TBDR)技術(shù),IMG A系列GPU只需繪制屏幕上可見的內(nèi)容,這使它具有與生俱來的帶寬和功耗優(yōu)勢;使用了主動動態(tài)電壓與頻率調(diào)節(jié)(DVFS)及時限調(diào)度(Deadline Scheduling)算法的先進功耗控制技術(shù),可提供具有超低響應延遲的快速功耗控制能力;如果GPU的某些部分沒有得到充分利用或沒用于處理工作,它們就會被立即降頻甚至進入睡眠狀態(tài),以確保最佳的功耗效率。

此外,Imagination對“完美像素”的強烈專注也使得IMG A系列GPU可以為游戲用戶提供完美的圖像質(zhì)量。這體現(xiàn)在很多技術(shù)細節(jié)上,包括行業(yè)領先的視覺無損PVRIC壓縮技術(shù)、完全重新設計的各向異性濾波算法,以及其他一些全新設計的算法實現(xiàn)。

IMG A系列GPU可以為游戲用戶提供完美的圖像質(zhì)量

汽車

在現(xiàn)代化汽車中,數(shù)字儀表盤顯示的信息對駕駛員至關重要,因此要求GPU為其提供充分的性能支持。同時,諸如信息娛樂系統(tǒng)、衛(wèi)星導航等其他功能也需要GPU的支持。所有這些功能可以由單個高性能IMG A系列GPU來驅(qū)動。通過將Imagination的硬件虛擬化技術(shù)與HyperLane技術(shù)結(jié)合在一起,可以提供優(yōu)先級技術(shù)和完美的內(nèi)存隔離機制,從而使IMG A系列GPU在運行上述所有功能的同時,可以確保主要任務的運行效率并滿足用戶對其他功能的體驗需求。這意味著,其他工作負載的運行不會影響儀表盤的使用,同時當其他工作負載出現(xiàn)問題時也可以保護儀表盤的數(shù)據(jù)不受影響。

數(shù)據(jù)中心

GPU作為高度并行的計算協(xié)處理器,其擁有的能力使其非常適合于加速包括3D圖形在內(nèi)的多種任務。IMG A系列GPU的設計可以滿足云端的圖形處理和計算需求,其將會推動基于云的AI訓練和推理以及未來云游戲體驗的發(fā)展。此外,數(shù)據(jù)中心對于能效是非常敏感的,而IMG A系列的低功耗設計使其非常適合數(shù)據(jù)中心對能效的需求,比如HyperLane技術(shù)可以最大化GPU的資源利用率,從而可有效地提升能效。

IMG A系列IP內(nèi)核

IMG A系列GPU從多個維度實現(xiàn)了性能可擴展性,從面向入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,一直到用于高性能設備的速度高達每秒2萬億次浮點運算(2 TFLOPS)的內(nèi)核,甚至到針對云應用的、速度超越2 TFLOPS的多核解決方案,IMG A系列可以面向各種性能需求提供支持。

Imagination最新發(fā)布的IMG A系列GPU涵蓋AXT、AXM、AXE三類產(chǎn)品,共七款內(nèi)核,其中包括四款高性能內(nèi)核,一款面向中端設備的內(nèi)核,以及兩款可為更低成本的細分市場提供最佳PPA指標的內(nèi)核:

IMG AXT-64-2048旗艦版:擁有2 TFLOPS、64 Gpixels的性能,以及8 TOPS的AI性能。

IMG AXT-48-1536:面向高端手機,性能為1.5 TFLOPS、48 Gpixels和6 TOPS。

IMG AXT-32-1024:面向高性能移動設備和汽車應用,性能為1TFLOPS、32 Gpixels和4TOPS。

IMG AXT-16-512:面向中高性能移動設備和汽車應用,性能為0.5 TFLOPS、16 Gpixels和2 TOPS。

IMG AXM-8-256:面向中端移動設備,性能為 0.25 TFLOPS、8 Gpixels和1 TOPS。

IMG AXE-2-16:面向高端物聯(lián)網(wǎng)、入門級數(shù)字電視/機頂盒(DTV/STB)、顯示和其他需要高填充率的應用,性能為16 GFLOPS和2 Gpixels。

IMG AXE-1-16:面向入門級移動設備和物聯(lián)網(wǎng),為同類產(chǎn)品中速度最快的支持Vulkan功能的GPU,性能為 16 GFLOPS和1 Gpixels。

IMG A系列實現(xiàn)了2.5倍的性能提升

面向未來

目前,Imagination已經(jīng)將IMG A系列GPU在多個市場中授權(quán)給了客戶,首批搭載該IP的SoC器件將在今年供貨。

本文介紹的只是IMG A系列 GPU的一部分功能特性和應用場景,如果你想了解“萬物GPU”的更多信息,歡迎點擊“此處”訪問Imagination官網(wǎng)頁面。

更重要的是,IMG A系列GPU只是Imagination一個新的起點,他們制定了一個從IMG A系列開始的產(chǎn)品開發(fā)路線圖,在未來幾個月至幾年內(nèi),他們將帶來更多的產(chǎn)品設計。當然,如果你正在為產(chǎn)品設計尋找GPU IP,那么IMG A系列無疑是你當前最好的選擇。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1491次下載  |  免費
  3. 2單片機典型實例介紹
  4. 18.19 MB  |  95次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于單片機和 SG3525的程控開關電源設計
  14. 0.23 MB  |  4次下載  |  免費
  15. 8基于AT89C2051/4051單片機編程器的實驗
  16. 0.11 MB  |  4次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關電源設計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537793次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費