0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA GPU并行計算技術(shù)解決AI研究問題

星星科技指導員 ? 來源:NVIDIA ? 作者:Solee Moon ? 2022-04-19 16:44 ? 次閱讀

由于冠狀病毒的存在, 2021 年韓國科學技術(shù)信息研究所( KISTI ) GPU 黑客大賽在 KISTI NVIDIA 和 OpenACC 組織的專家導師指導下舉行。為了激發(fā)科學家加速 AI 研究或 HPC 代碼的可能性, hackathon 提供了利用 NVIDIA GPU并行計算技術(shù)解決研究問題和擴展專業(yè)知識的機會。

以面對面活動而聞名的虛擬黑客大會對與會者和主持人都提出了自己的挑戰(zhàn)。新的模式還需要兼顧由三個 HPC 和 AI 團隊、四個高等教育和研究團隊以及兩個行業(yè)團隊組成的多樣化團隊。

活動團隊發(fā)現(xiàn)以下配方有助于為參與者創(chuàng)造有意義的成功體驗:

指導

基于他們在特定領域或編程語言方面的專業(yè)知識,專門的導師與團隊一起進行指導,以設定目標,并考慮不同的方法。導師們合作解決團隊遇到的問題并排除障礙。每天的導師同步電話讓每個人都集中精力,朝著實現(xiàn)目標的最佳策略努力。

社交

每個人都知道,只工作不玩耍實際上會阻礙團隊的生產(chǎn)力。 hackathon 為參與者和導師提供了 TGIF 社交時間會議。使用 Metaverse Gather 城鎮(zhèn)空間,導師和團隊分享經(jīng)驗,為電池充電,并建立聯(lián)系,幫助他們在活動期間繼續(xù)前進。

資源和現(xiàn)場研討會

成功的另一個重要因素是為與會者提供專門的培訓和資源。例如, NVIDIA 深度學習培訓中心( DLI )的一位大使和導師介紹了一個涵蓋 CUDA C / C ++主題的研討會。其他導師提供了團隊專用的技術(shù)課程,重點是TRT和 NVIDIA Triton 、OpenACC和 NSight 系統(tǒng)的評測、并行計算和優(yōu)化。

努力工作是有回報的

延世大學的帕斯卡團隊正在開發(fā)一種熱流體解算器,該解算器可以有效地計算湍流的熱運動。在這次黑客大會上,團隊通過 OpenACC 和 cuFFT 庫將基于 CPU 的現(xiàn)有代碼轉(zhuǎn)換為多 GPU 環(huán)境。這使得最耗時的子程序之一的計算速度加快了 4 . 84 倍 RHS (右側(cè),分步)。

來自 AmorePacific 化妝品公司的 Amore Opt 團隊致力于 GPU 優(yōu)化 DeepLabV3 +細分模型。通過應用他們對 TensorRT 推理優(yōu)化器和 NVIDIA Triton 推理服務器的了解,他們提高了推理速度,使推理速度提高了 26 倍。他們做到了這一點,同時保持人工智能模型的準確性,以便為未來的大規(guī)模客戶服務檢測皮膚問題。

首爾國立大學的 TFC 團隊參與了一個項目,以加速基于 CPU 的 Fortran 內(nèi)部流體計算代碼。通過在 KISTI 使用 NVIDIA GPU s ,團隊加速了耗時的三對角矩陣算法( TDMA )用于熱解算器和動量解算器,以及快速傅立葉變換( FFT )用于壓力解算器計算。他們在一臺 V100 GPU 上實現(xiàn)了 11.15 倍的速度。

NVIDIA Inception 成員 Nota 和杭陽大學合作,通過利用 NVIDIA GPU s 中的張量核進行 INT4 量化,優(yōu)化了 Nota 模型壓縮引擎。名為 NOTA-HYU 的團隊學會了使用 NVIDIA 分析工具 NSight 系統(tǒng)和 NSight 計算。然后,他們應用 NVIDIA 庫彎刀,通過 CUDA 優(yōu)化,使剩余塊的總體速度提高 1.85 倍。

關(guān)于作者

Solee Moon 是 NVIDIA 高等教育與研究( HER )和 NVIDIA 深度學習培訓中心( DLI )項目的企業(yè)營銷專家,專注于支持 AI 開發(fā)者社區(qū)的發(fā)展。在 NVIDIA 之前, Solee 曾在三星電子 CTR 擔任品牌營銷專家,執(zhí)行各種整合營銷傳播活動。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5021

    瀏覽量

    103257
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5507

    瀏覽量

    121286
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?121次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 -
    發(fā)表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優(yōu)化的思考。 GPU的存儲體系采用了獨特的倒金字塔結(jié)構(gòu),在我看來這是其計算性能的關(guān)鍵。大容量寄存器設計破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機制巧妙解決了內(nèi)存帶寬限制。NVIDIA
    發(fā)表于 11-24 17:12

    PyTorch GPU 加速訓練模型方法

    的基本原理 GPU(圖形處理單元)最初是為圖形渲染設計的,但隨著技術(shù)的發(fā)展,人們發(fā)現(xiàn)GPU并行計算方面有著天然的優(yōu)勢。GPU擁有成千上萬個
    的頭像 發(fā)表于 11-05 17:43 ?584次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    方式可以提高處理器的吞吐量。并行計算模式(而非圖形模式下)GPGPU的流水線是針對線程束進行管理的,也就是NVIDIA所說的 CUDA環(huán)境下的 warp 或者AMD 所說的 OpenCL 環(huán)境下
    發(fā)表于 11-03 12:55

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學計算、數(shù)據(jù)分
    的頭像 發(fā)表于 10-25 09:23 ?260次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?207次閱讀

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計算機視覺技術(shù)變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計算機視覺技術(shù)變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?533次閱讀

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構(gòu):大模型算力中心建設指南

    案例,展示如何針對機器學習應用進行需求分析、設計與實現(xiàn)。 無論是高等院校計算機與人工智能等相關(guān)專業(yè)的本科生或研究生,還是對并行計算技術(shù)、云計算技術(shù)、高性能存儲及高性能網(wǎng)絡
    發(fā)表于 08-16 18:33

    恒訊科技的GPU云解決方案有什么特點和優(yōu)勢?

    GPU云解決方案通常指的是云服務提供商提供的、基于圖形處理單元(GPU)的計算服務。這些服務利用GPU
    的頭像 發(fā)表于 06-12 17:24 ?409次閱讀

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    Blackwell Tensor Core GPU 與1個 NVIDIA Grace CPU 連接,實現(xiàn)高效的計算協(xié)同。GB200 NVL72 同時集成尖端功能和第二代 Transformer 引擎,
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱
    的頭像 發(fā)表于 04-20 09:39 ?759次閱讀

    NVLink技術(shù)GPUGPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會產(chǎn)生較大延時,影響GPU并行計算的效率和性能。
    發(fā)表于 03-27 09:40 ?4015次閱讀
    NVLink<b class='flag-5'>技術(shù)</b>之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    NVIDIA cuPQC幫助開發(fā)適用于量子計算時代的加密技術(shù)

    NVIDIA cuPQC 可為相關(guān)開發(fā)者提供加速計算支持,幫助開發(fā)適用于量子計算時代的加密技術(shù)。cuPQC 庫可利用
    的頭像 發(fā)表于 03-22 09:53 ?434次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算AI 基礎設施

    NVIDIA 軟件實現(xiàn)了跨 ?Blackwell GPU、新交換機和 BlueField-3 SuperNIC 的分布式計算,大幅提升了 AI、數(shù)據(jù)處理、高性能
    發(fā)表于 03-19 10:05 ?363次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> <b class='flag-5'>計算</b>和 <b class='flag-5'>AI</b> 基礎設施