與中央處理單元 (CPU) 相比,圖形處理單元 (GPU) 更適合以更高分辨率和更快的幀速率形成圖像,因?yàn)?GPU 具有數(shù)百個(gè)可以并行處理數(shù)千個(gè)數(shù)據(jù)集的計(jì)算單元。并行數(shù)據(jù)結(jié)構(gòu)和高線程數(shù)使 GPU 本質(zhì)上更適合需要大量計(jì)算功能的應(yīng)用,例如醫(yī)學(xué)成像和視頻游戲,例如并發(fā)可視化和交互式分割。
容納 CPU 和 GPU 的多核處理器設(shè)計(jì)已經(jīng)存在多年。事實(shí)上,幾乎每臺(tái)筆記本電腦、智能手機(jī)和平板電腦現(xiàn)在都擁有多核處理器、集成 GPU 和許多其他加速器,用于音頻、網(wǎng)絡(luò)和其他功能。然而,在這些多核處理器設(shè)計(jì)中,GPU 通常不直接訪問(wèn)應(yīng)用程序內(nèi)存,因此充當(dāng) CPU 的從屬設(shè)備。
幾年前,AMD 引入了加速處理器單元 (APU) 的概念,該單元為處理器內(nèi)部的 CPU 和 GPU 結(jié)合了高速緩存一致性?xún)?nèi)存。將兩個(gè)處理單元組合在同一條總線上以提高處理器吞吐量的想法最終導(dǎo)致了2012 年異構(gòu)系統(tǒng)架構(gòu) (HSA) 基金會(huì)的創(chuàng)建。
HSA 中的一組標(biāo)準(zhǔn)和規(guī)范促進(jìn)了 CPU、GPU 和其他加速器的公共總線和共享內(nèi)存,以使這些截然不同的架構(gòu)協(xié)同工作。AMD、ARM、聯(lián)發(fā)科和德州儀器等行業(yè)領(lǐng)導(dǎo)者參與了這項(xiàng)工作,這標(biāo)志著現(xiàn)有多核處理器設(shè)計(jì)方法的重大突破。
1. HSA 將現(xiàn)有的異構(gòu)計(jì)算提升到一個(gè)新的水平。
首先,HSA 1.0 旨在通過(guò)自動(dòng)將計(jì)算從 CPU 卸載到 GPU 來(lái)釋放 GPU 在嵌入式計(jì)算中的潛力,反之亦然。通過(guò)使軟件能夠以更低的延遲和顯著降低的開(kāi)銷(xiāo)有效地將任務(wù)分配給 GPU,HSA 允許 GPU 任務(wù)通過(guò)共享虛擬內(nèi)存功能 (SVM) 直接安全地訪問(wèn)系統(tǒng)內(nèi)存中的數(shù)據(jù),并在應(yīng)用程序進(jìn)程中遍歷數(shù)據(jù)結(jié)構(gòu)內(nèi)存(ptr-is-ptr)?,F(xiàn)在,這一切都可以完成,而無(wú)需像以前在傳統(tǒng) GPU 計(jì)算 API 中所要求的那樣提供數(shù)據(jù)緩沖區(qū)的主機(jī) CPU 配置。
即將發(fā)布的 HSA 標(biāo)準(zhǔn)將數(shù)字信號(hào)處理器 (DSP) 集成到架構(gòu)中,并提高了與系統(tǒng)中非 HSA 啟用的可編程和固定功能加速器的高效互操作性。
接下來(lái),雖然 HSA 是OpenCL等通用 GPU (GPGPU) API 的重要基礎(chǔ),但憑借其細(xì)粒度和粗粒度共享虛擬內(nèi)存功能,許多高級(jí)語(yǔ)言已被移植和優(yōu)化為原生目標(biāo) HSA 平臺(tái),包括 C++ 17、GCC、LLVM/CLANG 和 Python。優(yōu)化 CAFFE、BLAS、CHARM++、FFT、Sparse、FLAME 和 Docker 等軟件框架的工作也在進(jìn)行中,以使開(kāi)發(fā)人員更容易直接高效地編程和使用異構(gòu)并行設(shè)備。
這些異構(gòu)計(jì)算環(huán)境創(chuàng)造的這種新的處理器效率水平正在重振醫(yī)療和打印成像等行業(yè)。直到最近,需要圖像配準(zhǔn)、圖像分割和圖像去噪等計(jì)算密集型工作的醫(yī)學(xué)成像產(chǎn)品在很大程度上以犧牲圖像質(zhì)量為代價(jià)來(lái)犧牲幀速率。
HSA 以其創(chuàng)新的機(jī)制為不同的處理核心分配不同的負(fù)載,從而實(shí)現(xiàn)具有強(qiáng)大可視化和圖像保真度的高效計(jì)算。現(xiàn)在有大量資源可用于幫助開(kāi)發(fā)人員調(diào)整或創(chuàng)建新應(yīng)用程序以利用異構(gòu)架構(gòu)。其中包括 HSA Foundation GitHub 存儲(chǔ)庫(kù)和Radeon 開(kāi)放計(jì)算解決方案 GitHub。后者將 HSA 編程模型擴(kuò)展到高性能離散 GPU,并包括CodeXL 2.0 中提供的強(qiáng)大的開(kāi)源調(diào)試和分析工具。
計(jì)算密集型醫(yī)療領(lǐng)域可以受益于 GPU 加速,以增強(qiáng)特定于 MRI、PET、超聲和顯微鏡等應(yīng)用的算法的執(zhí)行。
2. GPU 加速提供卓越的速度,可有效滿足醫(yī)學(xué)成像獨(dú)特的數(shù)據(jù)吞吐量和后處理需求。
具體來(lái)說(shuō),教程是異構(gòu)系統(tǒng)架構(gòu)——下一代異構(gòu)計(jì)算的基礎(chǔ),以及醫(yī)療和打印成像中的 GPU 計(jì)算,而小組的主題是異構(gòu)系統(tǒng)架構(gòu):未來(lái)的功率、性能和編程。
-
處理器
+關(guān)注
關(guān)注
68文章
19286瀏覽量
229852 -
gpu
+關(guān)注
關(guān)注
28文章
4740瀏覽量
128951 -
API
+關(guān)注
關(guān)注
2文章
1501瀏覽量
62025
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論