0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

gpu加速原理

工程師 ? 來(lái)源:未知 ? 作者:姚遠(yuǎn)香 ? 2018-12-17 16:17 ? 次閱讀

GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過(guò)程中能夠發(fā)揮更大的效能。例如:當(dāng)前最頂級(jí)的CPU只有4核或者6核,模擬出8個(gè)或者12個(gè)處理線程來(lái)進(jìn)行運(yùn)算,但是普通級(jí)別的GPU就包含了成百上千個(gè)處理單元,高端的甚至更多,這對(duì)于多媒體計(jì)算中大量的重復(fù)處理過(guò)程有著天生的優(yōu)勢(shì)。下圖展示了CPU和GPU架構(gòu)的對(duì)比。

從硬件設(shè)計(jì)上來(lái)講,CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成。另一方面,GPU 則由數(shù)以千計(jì)的更小、更高效的核心組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。

通過(guò)上圖我們可以較為容易地理解串行運(yùn)算和并行運(yùn)算之間的區(qū)別。傳統(tǒng)的串行編寫(xiě)軟件具備以下幾個(gè)特點(diǎn):要運(yùn)行在一個(gè)單一的具有單一中央處理器(CPU)的計(jì)算機(jī)上;一個(gè)問(wèn)題分解成一系列離散的指令;指令必須一個(gè)接著一個(gè)執(zhí)行;只有一條指令可以在任何時(shí)刻執(zhí)行。而并行計(jì)算則改進(jìn)了很多重要細(xì)節(jié):要使用多個(gè)處理器運(yùn)行;一個(gè)問(wèn)題可以分解成可同時(shí)解決的離散指令;每個(gè)部分進(jìn)一步細(xì)分為一系列指示;每個(gè)部分的問(wèn)題可以同時(shí)在不同處理器上執(zhí)行。

舉個(gè)生活中的例子來(lái)說(shuō),你要點(diǎn)一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個(gè)人收到外賣的時(shí)間必然很長(zhǎng);而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點(diǎn)餐之后收貨就會(huì)比大貨車快很多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10873

    瀏覽量

    212086
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4744

    瀏覽量

    129018
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,GPU
    的頭像 發(fā)表于 12-26 11:58 ?77次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過(guò)加速對(duì)話框啟用,打開(kāi)求解器對(duì)話框,點(diǎn)擊“加速”按鈕,打
    發(fā)表于 12-16 14:25

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?205次閱讀
    RAPIDS cuDF將pandas提速近150倍

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時(shí)間的重要手段。PyTorch作為一個(gè)流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來(lái)利用GPU進(jìn)行模型訓(xùn)練。 1. 了解GPU
    的頭像 發(fā)表于 11-05 17:43 ?577次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜計(jì)算任務(wù)的軟硬件結(jié)合系統(tǒng)。
    的頭像 發(fā)表于 10-25 09:23 ?258次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?205次閱讀

    英偉達(dá)震撼發(fā)布:全新AI模型參數(shù)規(guī)模躍升至80億量級(jí)

    8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢(shì),適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)境。
    的頭像 發(fā)表于 08-23 16:08 ?751次閱讀

    摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案

    的方案與實(shí)踐,摩爾線程受邀參展。 此次展覽,摩爾線程展示了基于國(guó)產(chǎn)空間智能軟件技術(shù)SuperMap開(kāi)發(fā)的最新成果——“摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案”。方案顯示,在國(guó)產(chǎn)GPU的算力支持下,SuperMap三維G
    的頭像 發(fā)表于 06-27 18:15 ?1020次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺(jué)AI開(kāi)發(fā)

    NVIDIA DeepStream 是一款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺(jué) AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?684次閱讀
    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺(jué)AI開(kāi)發(fā)

    MathWorks 與 NVIDIA 聯(lián)手加速醫(yī)療技術(shù)領(lǐng)域中軟件定義工作流的開(kāi)發(fā)

    GPU?加速的 NVIDIA Holoscan?算子中以進(jìn)行實(shí)時(shí)數(shù)據(jù)處理和推斷,從而加速流數(shù)據(jù)分析和可視化應(yīng)用程序的開(kāi)發(fā)與部署。 醫(yī)療設(shè)備工程師不僅要適應(yīng)復(fù)雜且不斷發(fā)展的全球法規(guī),還要跟上使用尖端材料和電子元件的快速技術(shù)創(chuàng)新
    的頭像 發(fā)表于 05-17 10:36 ?375次閱讀
    MathWorks 與 NVIDIA 聯(lián)手<b class='flag-5'>加速</b>醫(yī)療技術(shù)領(lǐng)域中軟件定義工作流的開(kāi)發(fā)

    瀚博半導(dǎo)體參加中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì),智啟GPU加速行業(yè)解決方案

    4月28日至29日,2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)在蘇州召開(kāi)。作為中國(guó)移動(dòng)合作伙伴,瀚博半導(dǎo)體受邀參與本次大會(huì)并全面展示瀚博產(chǎn)品家族及云電腦、云手機(jī)、云游戲、AI大模型場(chǎng)景下的最新技術(shù)與解決方案,與眾多產(chǎn)業(yè)生態(tài)合作伙伴共話前沿發(fā)展趨勢(shì)與算力未來(lái)。
    的頭像 發(fā)表于 04-30 14:32 ?1770次閱讀
    瀚博半導(dǎo)體參加中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì),智啟<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>行業(yè)解決方案

    搭載英偉達(dá)GPU,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù)

    基于GPU的向量索引和搜索加速能力,性能可提升 50 倍。 Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆?;鶞?zhǔn)測(cè)試顯示,與目前市面上最先進(jìn)的基于 CPU 處理器的索引技術(shù)
    的頭像 發(fā)表于 04-01 14:33 ?489次閱讀
    搭載英偉達(dá)<b class='flag-5'>GPU</b>,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù)

    什么是自動(dòng)語(yǔ)音識(shí)別(ASR)?如何使用深度學(xué)習(xí)和GPU加速ASR

    ASR 是自然語(yǔ)言中一項(xiàng)頗具挑戰(zhàn)性的任務(wù),它由語(yǔ)音分割、聲學(xué)建模和語(yǔ)言建模等一系列子任務(wù)組成,根據(jù)噪聲和未分割的輸入數(shù)據(jù)形成預(yù)測(cè)(標(biāo)簽序列)。
    發(fā)表于 02-28 15:01 ?5739次閱讀
    什么是自動(dòng)語(yǔ)音識(shí)別(ASR)?如何使用深度學(xué)習(xí)和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>ASR

    谷歌暫停Gemini人像生成服務(wù)

    盡管谷歌團(tuán)隊(duì)于今年初就推介了這個(gè)GPU加速的人臉生成項(xiàng)目,但仍有部分用戶反映出生成的歷史名人形象存在著錯(cuò)誤,因此決定實(shí)行技術(shù)停擺,并謀劃對(duì)這一功能進(jìn)行調(diào)整和優(yōu)化。
    的頭像 發(fā)表于 02-27 14:16 ?510次閱讀

    利用GPU加速在Orange Pi?5上跑LLMs:人工智能愛(ài)好者High翻了!

    本期視頻將會(huì)給人工智能愛(ài)好者們帶來(lái)超級(jí)震撼!視頻中,我們將深入了解利用GPU加速在OrangePi5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速,在OrangePi上跑
    的頭像 發(fā)表于 01-22 15:29 ?1012次閱讀
    利用<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>在Orange Pi?5上跑LLMs:人工智能愛(ài)好者High翻了!