0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型快速發(fā)展,GPU IP有何作用

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-05-29 00:05 ? 次閱讀


電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。

事實上,除此之外還有一些GPU IP公司也為GPU產(chǎn)業(yè)發(fā)展做出很大貢獻,包括Imagination、Arm、芯原科技等。在當前備受關(guān)注的大模型方面,這些公司的產(chǎn)品也起到一定支持作用。

Imagination

Imagination的GPU IP產(chǎn)品包括IMG A系列、IMG CXT、IMG DXT等多個系列,每個系列有不同的特點和應用場景。IMG A系列,是Imagination有史以來性能最強大GPU IP產(chǎn)品,IMG A系列被設(shè)計為可應用于與各種場景的GPU,是多種垂直應用領(lǐng)域的終極解決方案。

該系列產(chǎn)品覆蓋從入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,到高性能設(shè)備的速度高達每秒2萬億次浮點運算(2 TFLOP)的內(nèi)核,以及針對云應用的、速度超越該數(shù)值的多核解決方案。

IMG CXT,搭載首個針對移動端優(yōu)化的PowerVR Photon光線追蹤架構(gòu),為移動端游戲玩家和開發(fā)者提供桌面級光線追蹤功能的體驗。實現(xiàn)了光線追蹤性能的大幅提升,支持在移動設(shè)備中以高幀率實現(xiàn)逼真的光線追蹤陰影、反射、全局照明和環(huán)境遮蔽等效果。

IMG DXT是新一代面向移動端的高性能GPU IP,為移動設(shè)備用戶帶來先進的圖形技術(shù)。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分別針對主流、高端和旗艦移動設(shè)備。旗艦產(chǎn)品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,與上一代產(chǎn)品相比,其最大單核性能提升了50%。

Imagination的GPU IP產(chǎn)品廣泛應用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。通過提供高性能的圖形渲染和數(shù)據(jù)處理能力,為各種應用場景提供了強大的支持。

Imagination的GPU IP高性能、可擴展性和低功耗的特性,使得在支持大模型的應用上具有優(yōu)勢。如IMG DXD,其多核配置提供了強大的計算能力,5 TFLOPS FP32和144 GTexel/s,能夠在大模型的應用上起到支持作用。

Arm

Arm的GPU IP產(chǎn)品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的長期主力產(chǎn)品,擁有從入門級到旗艦級的完整產(chǎn)品線。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多個型號,分別定位于不同性能和價格的市場段。

Mali系列GPU基于Valhall GPU架構(gòu),并持續(xù)優(yōu)化和提升性能。例如,Mali-G710號稱綜合性能提升20%、機器學習性能提升35%、紋理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗艦級GPU IP產(chǎn)品,旨在提供終極的移動3D體驗。Immortalis GPU基于Mali設(shè)計,并引入了硬件光線追蹤功能,這是首款在移動端支持此功能的GPU。

Immortalis GPU采用10-16核設(shè)計,性能比上一代Mali GPU高15%。其光線追蹤單元旨在提高效率,只占用約4%的著色器核心面積,卻能帶來300%的性能提升。

目前,Immortalis系列已經(jīng)推出了Immortalis-G715和Immortalis-G720等型號。Immortalis-G720是Arm目前性能和能效表現(xiàn)最為出色的GPU,與上一代產(chǎn)品相比,其性能和能效分別提高了15%,系統(tǒng)級效率更躍升了40%。

Arm的GPU IP產(chǎn)品廣泛應用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。它們能夠支持各種計算任務,如圖形渲染、物理模擬、圖像處理、機器學習和人工智能等。

Arm的GPU IP高性能計算、能效優(yōu)化和生態(tài)系統(tǒng)支持方面特點,使其在大模型的應用方面具有優(yōu)勢。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功應用于大模型訓練和推理中。

在大模型訓練方面,Arm的GPU IP被廣泛應用于深度學習、自然語言處理等領(lǐng)域。通過與合作伙伴共同開發(fā)定制化的解決方案,Arm GPU IP為這些領(lǐng)域的研究者和開發(fā)者提供了強大的計算能力支持。

在云端推理方面,Arm的GPU IP同樣發(fā)揮了重要作用。通過提供高性能的云端計算資源,Arm GPU IP支持了多種大模型應用的實時推理需求。

芯原股份

芯原股份的GPU IP系列產(chǎn)品,以其高性能、靈活性和廣泛的應用范圍,成為市場上備受矚目的產(chǎn)品。芯原可擴展的Vivante圖形處理器(GPU)IP系列應用廣泛,包括從低功耗的小型物聯(lián)網(wǎng)MCU到面向汽車和計算機應用的功能強大的SoC。設(shè)計可滿足各種芯片尺寸和功耗預算,是具成本效益的優(yōu)質(zhì)圖形處理器解決方案。

芯原科技此前還詳細介紹了其GPGPU-AI IP為核心的AI芯片定制解決方案。其以Tensor Core和GPGPU/GPU為主,提供了一個靈活的架構(gòu)。

芯原GPGPU-AI處理器上有芯原通用的軟件棧,在上層可以支持標準的應用接口,下層可以適配芯原各種各樣的算力IP,算力IP有圖形處理器、并行計算處理器、神經(jīng)網(wǎng)絡(luò)處理器。芯原GPGPU-AI分幾個層次擴展的算力,可以支持異構(gòu)計算,包括矢量計算、標量計算和張量處理單元,還可以支持大模型,高帶寬計算需求,同時基于在AI領(lǐng)域有多年的積累,可對數(shù)據(jù)組織、數(shù)據(jù)搬移和計算有針對性的優(yōu)化,另外還有專門針對大模型的帶寬壓縮技術(shù)。

芯原的GPU IP已被廣泛應用于桌面顯卡、車載信息娛樂、工業(yè)顯示、物聯(lián)網(wǎng)及可穿戴設(shè)備、大規(guī)模并行計算等領(lǐng)域。

寫在最后


可以看到,GPU IP在多個領(lǐng)域都有廣泛應用,包括科學計算、大數(shù)據(jù)分析、深度學習和人工智能、游戲服務器、圖像處理、圖形渲染和動畫制作、視頻處理和圖像識別等。

當然,GPU IP也在不斷發(fā)展和演進中,未來,專用加速IP與通用GPU的融合或許是GPU技術(shù)未來發(fā)展的一個亮點,這種融合將使GPU更具多功能性,更好地處理特定工作負載。高速DRAM和緩存技術(shù)的不斷演進也將推動GPU的性能提升,使其能夠更有效地處理復雜的計算任務,如支持大模型的訓練和部署。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4880

    瀏覽量

    130340
  • IP
    IP
    +關(guān)注

    關(guān)注

    5

    文章

    1762

    瀏覽量

    150953
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2918

    瀏覽量

    3668
收藏 人收藏

    評論

    相關(guān)推薦

    搭建萬卡GPU集群,小米AI大模型即將全力啟動

    董事長雷軍在該團隊扮演重要的領(lǐng)導角色。 ? 高性能計算是大模型發(fā)展的基礎(chǔ),而GPU在其中扮演重要作用。隨著AI在如今社會中發(fā)揮著越來越重要的作用
    的頭像 發(fā)表于 12-29 00:02 ?2623次閱讀
    搭建萬卡<b class='flag-5'>GPU</b>集群,小米AI大<b class='flag-5'>模型</b>即將全力啟動

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    小米加速布局AI大模型,搭建GPU萬卡集群

    近日,消息稱小米正在緊鑼密鼓地搭建自己的GPU萬卡集群,旨在加大對AI大模型的投入力度。據(jù)悉,小米的大模型團隊在成立之初就已經(jīng)擁有了6500張GP
    的頭像 發(fā)表于 12-28 14:25 ?419次閱讀

    GPU是如何訓練AI大模型

    在AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練AI大模型的。
    的頭像 發(fā)表于 12-19 17:54 ?531次閱讀

    IP定位離線庫的特點以及作用

    很多人知道IP定位,但是對離線庫不是很理解。這篇文章會和大家闡述離線庫的概念、特點以及具體什么作用。 IP定位路徑https://www.ipdatacloud.com/?utm-s
    的頭像 發(fā)表于 12-06 09:56 ?408次閱讀

    PyTorch GPU 加速訓練模型方法

    在深度學習領(lǐng)域,GPU加速訓練模型已經(jīng)成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作為一個流行的深度學習框架,提供了豐富的工具和方法來利用GPU進行模型訓練。 1. 了解
    的頭像 發(fā)表于 11-05 17:43 ?1108次閱讀

    GPU市場趨勢與未來發(fā)展

    隨著科技的飛速發(fā)展,圖形處理單元(GPU)已經(jīng)成為現(xiàn)代計算領(lǐng)域不可或缺的一部分。從游戲到專業(yè)圖形設(shè)計,再到人工智能和深度學習,GPU在各個領(lǐng)域都發(fā)揮著重要作用
    的頭像 發(fā)表于 10-27 14:14 ?1059次閱讀

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習的核心應用領(lǐng)域之一,GPU在加速圖像識別模型訓練方面發(fā)揮著關(guān)鍵
    的頭像 發(fā)表于 10-27 11:13 ?859次閱讀

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?724次閱讀

    模型發(fā)展下,國產(chǎn)GPU的機會和挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展下,國產(chǎn)GPU的機會和挑戰(zhàn).pdf》資料免費下載
    發(fā)表于 07-18 15:44 ?11次下載
    大<b class='flag-5'>模型</b><b class='flag-5'>發(fā)展</b>下,國產(chǎn)<b class='flag-5'>GPU</b>的機會和挑戰(zhàn)

    科普:GPU和FPGA,異同

    來源:內(nèi)容由半導體行業(yè)觀察(ID:icbank)編譯自techspot,謝謝。圖形處理單元(GPU)和現(xiàn)場可編程門陣列(FPGA)是用于成像和其他繁重計算的三種主要處理器類型中的兩種。中央處理器
    的頭像 發(fā)表于 06-15 08:27 ?884次閱讀
    科普:<b class='flag-5'>GPU</b>和FPGA,<b class='flag-5'>有</b><b class='flag-5'>何</b>異同

    模型發(fā)展下,國產(chǎn)GPU的機會和挑戰(zhàn)(下)

    洞見分析經(jīng)驗分享模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年06月11日 17:15:23

    模型發(fā)展下,國產(chǎn)GPU的機會和挑戰(zhàn)(上)

    洞見分析經(jīng)驗分享模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年06月11日 16:51:11

    為什么GPU對AI如此重要?

    GPU在人工智能中相當于稀土金屬,甚至黃金,它們在當今生成式人工智能時代中的作用不可或缺。那么,為什么GPU在人工智能發(fā)展中如此重要呢?什么是GPU
    的頭像 發(fā)表于 05-17 08:27 ?1004次閱讀
    為什么<b class='flag-5'>GPU</b>對AI如此重要?

    英偉達、AMD、英特爾GPU產(chǎn)品及優(yōu)勢匯總

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場主要由英偉達、AMD和英特爾等幾家大公司主導。其中,英偉達在AI
    的頭像 發(fā)表于 05-10 00:59 ?6394次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品