在不到18個月的時間里,密歇根大學(xué)的一個團隊采用GPU,為一個基于復(fù)雜數(shù)學(xué)的程序?qū)崿F(xiàn)了20倍的提速。該程序為量子科學(xué)奠定了基礎(chǔ)。
Vikram Gavini 的實驗室以創(chuàng)紀錄的速度,跨越了微觀世界的一座重要里程碑。
這支由三人組成的密歇根大學(xué)團隊創(chuàng)建了一個使用復(fù)雜的數(shù)學(xué)來深入觀察原子世界的程序。該程序?qū)⑼苿釉S多科學(xué)領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設(shè)計工作——從更輕的汽車到更高效的藥物。
憑借 GPU ,該團隊開放源碼庫中的代碼在短短18個月內(nèi)實現(xiàn)了20倍速度提升。
通往Summit的旅程
2018年年中,當該團隊正準備發(fā)布一個在 CPU 上運行的代碼版本時,他們收到了橡樹嶺國家實驗室 GPU 黑客馬拉松的邀請。全球最快的超級計算機之一—— Summit 就位于該實驗室。
機械工程和材料科學(xué)教授 Gavini 表示:“我們當時的想法是看看我們能實現(xiàn)什么?!?/p>
該實驗室的博士后 Sambit Das 參加了這場為期五天的活動。他認為:“我們很快意識到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力。”
在活動結(jié)束前, Das 和另一位實驗室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫中,實現(xiàn)了5倍速度提升。這也讓他們意識到,未來能實現(xiàn)的還有更多。
6個月內(nèi)實現(xiàn)從5倍到20倍的速度提升
在接下來的幾個月里,該實驗室繼續(xù)對該程序進行調(diào)優(yōu),使其能夠?qū)?萬個鎂原子中的10萬個電子進行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運行。
隨著 Summit 的節(jié)點數(shù)量不斷增加,該實驗室采用迭代法,在節(jié)點上運行越來越多的代碼。截止4月,該實驗室使用了該系統(tǒng)27,000個 GPU 中的大部分,實現(xiàn)了近 46 petaflops 的性能,達到了之前的20倍。
對于一個基于密度泛函理論(DFT)的程序來說,這是一個前所未有的結(jié)果。密度函數(shù)理論是一項解釋亞原子粒子之間量子相互作用的復(fù)雜數(shù)學(xué)理論。
適用于高難度算法的分布式計算
DFT 算法的復(fù)雜性和基礎(chǔ)性使其目前占用了所有公共研究計算機四分之一的時間。在被引用次數(shù)最多的100篇科學(xué)論文中,有12篇是 DFT 為主題的。該計算還被用來分析從天體物理學(xué)到 DNA 鏈的一切。
最初,根據(jù)該實驗室的報告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個處理器之外,很難實現(xiàn)進一步的擴展,因此就連效率報告都沒有。
Gavini 表示:“能實現(xiàn)這一前所未有的效率令我們感到非常高興。”
聲名鵲起
2019年底,該團隊被提名為戈登貝爾獎的入圍者。這是該實驗室首次參加這一“高性能計算領(lǐng)域諾貝爾獎”的評選。
Gavini 表示:“這為我們的實驗室和大學(xué)帶來了很高的知名度,我認為這次努力還只是一個開始。”
事實上,自評選以來,實驗室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達到38%。并且該實驗室已經(jīng)在探索在其他系統(tǒng)和應(yīng)用上的使用。
尋求更多的應(yīng)用和更高的性能
最初,這項工作被用于分析鎂。這種比當今汽車和飛機使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實驗室與另一團隊合作,研究電子在 DNA 中的移動方式,這項工作可以幫助其他研究者研發(fā)出更有效的藥物。
接下來重要的一步是在 Perlmutter 上運行代碼。這是一臺使用最新 NVIDIA A100 Tensor Core GPU 的超級計算機。根據(jù)Das的報告,基于A100 GPU對TensorFloat-32的支持,與 Summit GPU 相比,這臺計算機目前已經(jīng)實現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實現(xiàn)高精度的混合精度格式。
與其他 DFT 代碼相比,該實驗室程序已實現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級計算機。
他表示:“眼下的收獲總會令人欣喜,但‘路漫漫其修遠兮,吾將上下而求索’。這次的成果也是我們新征程的開始?!?/p>
原文標題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼
文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
gpu
+關(guān)注
關(guān)注
28文章
4798瀏覽量
129516 -
計算機
+關(guān)注
關(guān)注
19文章
7555瀏覽量
88812 -
代碼
+關(guān)注
關(guān)注
30文章
4841瀏覽量
69217
原文標題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
加州理工學(xué)院開發(fā)出超100GHz時鐘速度的全光計算機
云端超級計算機使用教程
量子計算機與普通計算機工作原理的區(qū)別
![量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別](https://file1.elecfans.com/web2/M00/0D/2F/wKgaomdClzSABLiiAAAqWRtwqQ4084.png)
丹麥推出首臺AI超級計算機Gefion
NVIDIA助力丹麥發(fā)布首臺AI超級計算機
云端超級計算機怎么用
借助NVIDIA超級計算機加速量子計算發(fā)展
工業(yè)計算機與普通計算機的區(qū)別
NVIDIA和Recursion利用AI超級計算機加快新藥研發(fā)
![NVIDIA和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>加快新藥研發(fā)](https://file1.elecfans.com/web2/M00/E6/CA/wKgaomZFZciAI3NlAABz2OXwBxk365.png)
評論