0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fugaku超級計算機程序已實現(xiàn)100倍的速度提升

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2021-12-28 09:26 ? 次閱讀

在不到18個月的時間里,密歇根大學(xué)的一個團隊采用GPU,為一個基于復(fù)雜數(shù)學(xué)的程序?qū)崿F(xiàn)了20倍的提速。該程序為量子科學(xué)奠定了基礎(chǔ)。

Vikram Gavini 的實驗室以創(chuàng)紀錄的速度,跨越了微觀世界的一座重要里程碑。

這支由三人組成的密歇根大學(xué)團隊創(chuàng)建了一個使用復(fù)雜的數(shù)學(xué)來深入觀察原子世界的程序。該程序?qū)⑼苿釉S多科學(xué)領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設(shè)計工作——從更輕的汽車到更高效的藥物。

憑借 GPU ,該團隊開放源碼庫中的代碼在短短18個月內(nèi)實現(xiàn)了20倍速度提升。

通往Summit的旅程

2018年年中,當該團隊正準備發(fā)布一個在 CPU 上運行的代碼版本時,他們收到了橡樹嶺國家實驗室 GPU 黑客馬拉松的邀請。全球最快的超級計算機之一—— Summit 就位于該實驗室。

機械工程和材料科學(xué)教授 Gavini 表示:“我們當時的想法是看看我們能實現(xiàn)什么?!?/p>

該實驗室的博士后 Sambit Das 參加了這場為期五天的活動。他認為:“我們很快意識到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力。”

在活動結(jié)束前, Das 和另一位實驗室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫中,實現(xiàn)了5倍速度提升。這也讓他們意識到,未來能實現(xiàn)的還有更多。

6個月內(nèi)實現(xiàn)從5倍到20倍的速度提升

在接下來的幾個月里,該實驗室繼續(xù)對該程序進行調(diào)優(yōu),使其能夠?qū)?萬個鎂原子中的10萬個電子進行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運行。

隨著 Summit 的節(jié)點數(shù)量不斷增加,該實驗室采用迭代法,在節(jié)點上運行越來越多的代碼。截止4月,該實驗室使用了該系統(tǒng)27,000個 GPU 中的大部分,實現(xiàn)了近 46 petaflops 的性能,達到了之前的20倍。

對于一個基于密度泛函理論(DFT)的程序來說,這是一個前所未有的結(jié)果。密度函數(shù)理論是一項解釋亞原子粒子之間量子相互作用的復(fù)雜數(shù)學(xué)理論。

適用于高難度算法的分布式計算

DFT 算法的復(fù)雜性和基礎(chǔ)性使其目前占用了所有公共研究計算機四分之一的時間。在被引用次數(shù)最多的100篇科學(xué)論文中,有12篇是 DFT 為主題的。該計算還被用來分析從天體物理學(xué)到 DNA 鏈的一切。

最初,根據(jù)該實驗室的報告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個處理器之外,很難實現(xiàn)進一步的擴展,因此就連效率報告都沒有。

Gavini 表示:“能實現(xiàn)這一前所未有的效率令我們感到非常高興。”

聲名鵲起

2019年底,該團隊被提名為戈登貝爾獎的入圍者。這是該實驗室首次參加這一“高性能計算領(lǐng)域諾貝爾獎”的評選。

Gavini 表示:“這為我們的實驗室和大學(xué)帶來了很高的知名度,我認為這次努力還只是一個開始。”

事實上,自評選以來,實驗室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達到38%。并且該實驗室已經(jīng)在探索在其他系統(tǒng)和應(yīng)用上的使用。

尋求更多的應(yīng)用和更高的性能

最初,這項工作被用于分析鎂。這種比當今汽車和飛機使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實驗室與另一團隊合作,研究電子在 DNA 中的移動方式,這項工作可以幫助其他研究者研發(fā)出更有效的藥物。

接下來重要的一步是在 Perlmutter 上運行代碼。這是一臺使用最新 NVIDIA A100 Tensor Core GPU 的超級計算機。根據(jù)Das的報告,基于A100 GPU對TensorFloat-32的支持,與 Summit GPU 相比,這臺計算機目前已經(jīng)實現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實現(xiàn)高精度的混合精度格式。

與其他 DFT 代碼相比,該實驗室程序已實現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級計算機。

他表示:“眼下的收獲總會令人欣喜,但‘路漫漫其修遠兮,吾將上下而求索’。這次的成果也是我們新征程的開始?!?/p>

原文標題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4798

    瀏覽量

    129516
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7555

    瀏覽量

    88812
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4841

    瀏覽量

    69217

原文標題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    加州理工學(xué)院開發(fā)出超100GHz時鐘速度的全光計算機

    加州理工學(xué)院的研究人員取得重大突破,開發(fā)出一款能實現(xiàn)超過100GHz時鐘速度的全光計算機。 長期以來,電子計算機時鐘頻率在近20年停滯于5G
    的頭像 發(fā)表于 01-23 10:32 ?162次閱讀

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?206次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    超越世界上最強大的超級計算機,完成以前不可想象的任務(wù)!這意味著量子計算機可能會徹底改變我們的生活。 在本文中,我們將先了解普通計算機的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?573次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    丹麥推出首臺AI超級計算機Gefion

    超級計算機由1528個英偉達H100 Tensor Core GPU驅(qū)動,并采用了英偉達DGX SuperPOD架構(gòu)設(shè)計。這些高性能計算單元通過英偉達Quantum-2 InfiniB
    的頭像 發(fā)表于 10-29 15:13 ?489次閱讀

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計算機。
    的頭像 發(fā)表于 10-27 09:42 ?538次閱讀

    云端超級計算機怎么用

    云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?240次閱讀

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?600次閱讀

    工業(yè)計算機與普通計算機的區(qū)別

    在信息化和自動化日益發(fā)展的今天,計算機已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡墓ぞ?。然而,?b class='flag-5'>計算機領(lǐng)域中,工業(yè)計算機和普通計算機雖然都具備基本的計算
    的頭像 發(fā)表于 06-06 16:45 ?1673次閱讀

    NVIDIA和Recursion利用AI超級計算機加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅(qū)動,用于加速醫(yī)療領(lǐng)域科學(xué)家的工作。在全球超級計算機 TOP500 榜單中,它的排名上升了 100 多位。
    的頭像 發(fā)表于 05-16 09:46 ?1363次閱讀
    NVIDIA和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>加快新藥研發(fā)

    富士通使用富岳超級計算機訓(xùn)練LLM

    盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?623次閱讀

    日本超算富岳助力構(gòu)建大規(guī)模語言模型Fugaku-LLM

    在昨日公布的新聞稿中,研究團隊表示他們成功發(fā)掘了富岳超級計算機的潛能,使矩陣乘法運算速度提升,通信
    的頭像 發(fā)表于 05-11 17:07 ?968次閱讀

    從原子到超級計算機:NVIDIA與合作伙伴擴展量子計算應(yīng)用

    量子計算領(lǐng)域的最新進展包括分子研究、部署巨型超級計算機,以及通過一項新的學(xué)術(shù)計劃培養(yǎng)量子從業(yè)人員。
    的頭像 發(fā)表于 03-22 10:05 ?495次閱讀

    【量子計算機重構(gòu)未來 | 閱讀體驗】+量子計算機的原理究竟是什么以及有哪些應(yīng)用

    計算方法的區(qū)別傳統(tǒng)方法是,按照不走枚舉所有情況,而量子計算是一次處理所有情況,是一步到位。但是這里又有疑惑了,量子計算如何實現(xiàn)的一步到位呢, 這里引入了量子比特和傳統(tǒng)
    發(fā)表于 03-11 12:50

    【量子計算機重構(gòu)未來 | 閱讀體驗】+ 初識量子計算機

    欣喜收到《量子計算機——重構(gòu)未來》一書,感謝電子發(fā)燒友論壇提供了一個讓我了解量子計算機的機會! 自己對電子計算機有點了解,但對量子計算機真是一無所知,只是聽說過量子糾纏、超快的運算
    發(fā)表于 03-05 17:37

    計算機為什么利用反碼來實現(xiàn)減法?

    計算機為什么利用反碼來實現(xiàn)減法? 計算機實現(xiàn)減法運算時利用反碼的原因可以從歷史背景、計算機設(shè)計優(yōu)勢和運算規(guī)則等方面來分析。 1. 歷史背景
    的頭像 發(fā)表于 02-19 15:10 ?1019次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品