NVIDIA CUDA 工具包提供了開發(fā)環(huán)境,可供開發(fā)、優(yōu)化和部署經(jīng) GPU 加速的高性能應(yīng)用。
什么是CUDA工具包
NVIDIACUDA工具包提供了開發(fā)環(huán)境,可供創(chuàng)建經(jīng) GPU 加速的高性能應(yīng)用。借助 CUDA 工具包,您可以在經(jīng) GPU 加速的嵌入式系統(tǒng)、臺式工作站、企業(yè)數(shù)據(jù)中心、基于云的平臺和 HPC 超級計算機中開發(fā)、優(yōu)化和部署應(yīng)用。此工具包中包含多個 GPU 加速庫、多種調(diào)試和優(yōu)化工具、一個 C/C++ 編譯器以及一個用于部署應(yīng)用的運行環(huán)境庫。
借助多 GPU 配置中用于分布式計算的多項內(nèi)置功能,科學(xué)家和研究人員能夠開發(fā)出可從單個 GPU 工作站擴展到配置數(shù)千個 GPU 云端設(shè)施的應(yīng)用。
CUDA 11主要功能
CUDA 11 可為 NVIDIAAmpere 架構(gòu)、ARM 服務(wù)器處理器、性能優(yōu)化庫以及多種開發(fā)者工具新功能提供支持。對 NVIDIA Ampere 架構(gòu)的支持包括新一代 Tensor Core、混合精度模式、多實例 GPU (MIG)、高級內(nèi)存管理以及標(biāo)準(zhǔn) C++/Fortran 并行語言結(jié)構(gòu)。
支持 NVIDIA Ampere GPU 架構(gòu),包括新的 NVIDIA A100 GPU,用于加速 AI 和 HPC 數(shù)據(jù)中心的擴展;采用 NVSwitch 結(jié)構(gòu)的多 GPU 系統(tǒng),如 DGX A100 和 HGX A100。
多實例 GPU(MIG) 分區(qū)功能,對云服務(wù)提供商(csp)提高 GPU 利用率非常有利。
全新第三代 Tensor Cores 加速不同數(shù)據(jù)類型的混合精度,包括 TF32 和 Bfloat16。
用于任務(wù)圖、異步數(shù)據(jù)移動、細粒度同步和二級緩存駐留控制的編程和 API。
CUDA 庫中用于線性代數(shù)、FFT 和矩陣乘法進行性能優(yōu)化。
Nsight 產(chǎn)品系列的更新,用于跟蹤、剖析和調(diào)試 CUDA 應(yīng)用程序。
全面支持所有主要 CPU 體系結(jié)構(gòu),跨 x86 _ 64、Arm64 服務(wù)器和 POWER 結(jié)構(gòu)。
原文標(biāo)題:DevZone | CUDA 工具包
文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4986瀏覽量
103066 -
gpu
+關(guān)注
關(guān)注
28文章
4740瀏覽量
128951 -
CUDA
+關(guān)注
關(guān)注
0文章
121瀏覽量
13628 -
工具包
+關(guān)注
關(guān)注
0文章
46瀏覽量
9537
原文標(biāo)題:DevZone | CUDA 工具包
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論