0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近600個(gè)應(yīng)用程序通過(guò)NVIDIA GPU實(shí)現(xiàn)了提速

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:cc ? 2019-02-14 14:15 ? 次閱讀

十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個(gè)應(yīng)用程序通過(guò)NVIDIA GPU實(shí)現(xiàn)了提速。

這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動(dòng)力學(xué)、化學(xué)和天氣預(yù)報(bào)等各個(gè)領(lǐng)域。其中包括全球最熱門(mén)的15個(gè)高性能計(jì)算應(yīng)用程序,也都是通過(guò)GPU實(shí)現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個(gè)應(yīng)用程序,接下來(lái)還會(huì)有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報(bào)告中收錄了數(shù)據(jù)中心運(yùn)行的各個(gè)關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級(jí)的核心科學(xué)應(yīng)用程序。其中包括:

GROMACS(化學(xué))– 分子動(dòng)力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬(wàn)個(gè)粒子的系統(tǒng)的牛頓運(yùn)動(dòng)方程。

ANSYS(流體動(dòng)力學(xué)分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學(xué))– 預(yù)測(cè)分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動(dòng)頻率。

VASP(化學(xué))– 用于從頭計(jì)算法量子力學(xué)分子動(dòng)力學(xué)模擬。

NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。

Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。

WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報(bào)系統(tǒng),專為大氣研究和操作預(yù)測(cè)應(yīng)用程序而設(shè)計(jì)。

OpenFOAM(流體動(dòng)力學(xué)分析)– 通用型 CFD 軟件的求解器庫(kù)。

ANSYS(結(jié)構(gòu)分析)– 對(duì)高頻和高速電子元件中的 3D 全波電磁場(chǎng)進(jìn)行建模。

LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。

BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。

LAMMPS(化學(xué))– 經(jīng)典分子動(dòng)力學(xué)程序包。

Amber(化學(xué))– 專門(mén)針對(duì)生物分子系統(tǒng)模擬而開(kāi)發(fā)的分子動(dòng)力學(xué)應(yīng)用程序。

Quantum Espresso(化學(xué))– 一套集成的計(jì)算機(jī)代碼,用于電子結(jié)構(gòu)計(jì)算和納米級(jí)材料建模。

GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計(jì)算化學(xué)套件。

這些工具本身無(wú)法實(shí)現(xiàn)性能的遞增性提升。但通過(guò)采用NVIDIA GPU的服務(wù)器,其性能通常可提高10 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟(jì)效益。

預(yù)測(cè)天氣

天氣預(yù)報(bào)是一項(xiàng)遠(yuǎn)比其看起來(lái)更加困難的工作。天氣預(yù)報(bào)是高性能計(jì)算領(lǐng)域的一個(gè)重要分支。準(zhǔn)確可靠的天氣預(yù)報(bào)不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險(xiǎn)、零售和其他行業(yè)做出經(jīng)濟(jì)決策。

天氣預(yù)報(bào)需要大量的計(jì)算資源,包括幾何尺度(尤其是全球天氣預(yù)報(bào)),和大量描述大氣狀態(tài)的變量。

但是,受限于可用的計(jì)算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報(bào)模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細(xì)節(jié),例如云層的影響(云層可以反射太陽(yáng)輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測(cè)效果,但這需要 應(yīng)用程序的性能提升1700倍。

GPU加速可以彌補(bǔ)此差距,提高天氣預(yù)報(bào)的準(zhǔn)確性。

加速空氣動(dòng)力學(xué)模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場(chǎng)。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規(guī)??諝鈩?dòng)力學(xué)模擬,我們可以對(duì)其進(jìn)行改進(jìn),讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開(kāi)發(fā)的FUN3D計(jì)算流體動(dòng)力學(xué)軟件,可用于模擬各種空氣動(dòng)力學(xué)應(yīng)用程序中的流體流動(dòng)。該應(yīng)用程序在NASA Pleiades超級(jí)計(jì)算機(jī)上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個(gè)NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運(yùn)行這些模擬。

總結(jié):GPU具備非常好的性能,從而高效地計(jì)算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級(jí)計(jì)算機(jī)上,僅需運(yùn)行1000臺(tái)GPU服務(wù)器就可以完成100多萬(wàn)個(gè)CPU核心的工作。而且,其能源成本遠(yuǎn)低于CPU。

性能持續(xù)提升

我們?cè)诟鱾€(gè)加速計(jì)算領(lǐng)域都擁有深厚的儲(chǔ)備。結(jié)合由100多萬(wàn)名開(kāi)發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個(gè)不斷改進(jìn)的平臺(tái)。該平臺(tái)可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。

例如,在包含 11 個(gè)高性能計(jì)算應(yīng)用程序的組合中,對(duì)于采用4個(gè)NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運(yùn)行速度比兩年前提高了2倍。如果同時(shí)改進(jìn)軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。

現(xiàn)在,通過(guò)單一平臺(tái),您可以加速各種高性能計(jì)算領(lǐng)域的應(yīng)用程序:科學(xué)計(jì)算、工業(yè)模擬、深度學(xué)習(xí)機(jī)器學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103447
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4764

    瀏覽量

    129173

原文標(biāo)題:GPU已加速的近600個(gè)高性能計(jì)算應(yīng)用程序都有哪些?

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    0xmd公司通過(guò)NVIDIA GPU打造醫(yī)療AI解決方案

    本案例中,0xmd 公司通過(guò) NVIDIA GPU 打造醫(yī)療 AI 解決方案,覆蓋影像分析和文本解讀等領(lǐng)域。
    的頭像 發(fā)表于 01-14 16:23 ?117次閱讀

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?174次閱讀

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開(kāi)發(fā)和設(shè)計(jì)迭代,縮短開(kāi)發(fā)周期,提升產(chǎn)品競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 12-27 16:24 ?200次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問(wèn)題,但會(huì)降低舊GPU硬件性能,可通過(guò)NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    發(fā)表于 12-16 14:25

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高
    的頭像 發(fā)表于 11-20 10:03 ?268次閱讀
    將<b class='flag-5'>NVIDIA</b>加速計(jì)算引入Polars

    RAPIDS cuDF將pandas提速150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?253次閱讀
    RAPIDS cuDF將pandas<b class='flag-5'>提速</b><b class='flag-5'>近</b>150倍

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    Directx是由微軟設(shè)計(jì)和維護(hù)的圖形應(yīng)用程序接口。。DirectX提供個(gè)統(tǒng)的、跨硬件的接口,使得開(kāi)發(fā)者只需針對(duì)一個(gè) API進(jìn)行編程即可。DirectX還定義
    發(fā)表于 11-03 12:55

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    ,NVIDIA的RTX系列顯卡以其強(qiáng)大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場(chǎng)。例如,NVIDIA的RTX 3080在4K分辨率下提供卓越的游戲體驗(yàn),而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近,但在光線追蹤
    的頭像 發(fā)表于 10-27 11:15 ?881次閱讀

    IB Verbs和NVIDIA DOCA GPUNetIO性能測(cè)試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個(gè)庫(kù),專門(mén)為實(shí)時(shí)在線 GPU 數(shù)據(jù)包處理而設(shè)計(jì)。它結(jié)合
    的頭像 發(fā)表于 08-23 17:03 ?677次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測(cè)試

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    NVIDIA全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

    借助 R515 驅(qū)動(dòng)程序,NVIDIA 于 2022 年 5 月發(fā)布一套開(kāi)源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中
    的頭像 發(fā)表于 07-25 09:56 ?486次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開(kāi)源<b class='flag-5'>GPU</b>內(nèi)核模塊

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開(kāi)發(fā)者提供豐富的庫(kù)、驅(qū)動(dòng)和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應(yīng)用程序和服務(wù)。
    的頭像 發(fā)表于 05-29 09:22 ?529次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?780次閱讀

    請(qǐng)問(wèn)使用FreeRTOS與LWIP不算應(yīng)用程序消耗600K Byte RAM是否夠用?

    大家好! 最近新項(xiàng)目中需要使用FreeRTOS + LWIP,選MCU時(shí)候,對(duì)內(nèi)部RAM資源無(wú)法準(zhǔn)確評(píng)估: 請(qǐng)問(wèn)使用FreeRTOS與LWIP 不算應(yīng)用程序消耗 600K Byte RAM 是否夠用
    發(fā)表于 04-18 07:37

    通過(guò)實(shí)時(shí)加速器技術(shù)實(shí)現(xiàn)實(shí)時(shí)應(yīng)用程序的 Windows

    時(shí)功能應(yīng)用程序。這是通過(guò)專門(mén)為實(shí)時(shí)應(yīng)用程序保留一個(gè)或多個(gè)CPU來(lái)實(shí)現(xiàn)的,設(shè)置 Windows 適當(dāng)?shù)膮?shù)化并利用 acontis 內(nèi)核驅(qū)動(dòng)
    的頭像 發(fā)表于 01-29 16:03 ?944次閱讀
    <b class='flag-5'>通過(guò)</b>實(shí)時(shí)加速器技術(shù)<b class='flag-5'>實(shí)現(xiàn)</b>實(shí)時(shí)<b class='flag-5'>應(yīng)用程序</b>的 Windows