美國南方衛(wèi)理公會大學(xué)使用 NVIDIA DGX SuperPOD 推動德克薩斯州北部地區(qū)進入 AI 時代;密西西比州立大學(xué)和德克薩斯農(nóng)工大學(xué)準(zhǔn)備使用 NVIDIA Quantum-2 網(wǎng)絡(luò);英國的一所大學(xué)則升級了其 InfiniBand 網(wǎng)絡(luò)。
正如達拉斯/沃斯堡機場已成為全美旅行樞紐一樣,南方衛(wèi)理公會大學(xué)(SMU)將助力德克薩斯州北部地區(qū)在 AI 行業(yè)發(fā)展中處于領(lǐng)先地位。
南方衛(wèi)理公會大學(xué)正在安裝一臺 NVIDIA DGX SuperPOD 超級計算機。該大學(xué)希望這臺超級計算機為這個擁有 12000 多名學(xué)生和 2400 名教職員工的龐大社區(qū)推動機器學(xué)習(xí)項目的發(fā)展。
除了該大學(xué)之外,美國中南部還有兩所大學(xué)也宣布計劃使用 NVIDIA 技術(shù)以推動研究高速發(fā)展。
德克薩斯農(nóng)工大學(xué)和密西西比州立大學(xué)均計劃使用 NVIDIA 的 400 Gbit/s InfiniBand 網(wǎng)絡(luò)平臺,NVIDIA Quantum-2 將作為其最新高性能計算機的主干網(wǎng)。此外,英國的一臺超級計算機剛剛升級了其 InfiniBand 網(wǎng)絡(luò)。
德克薩斯州喜獲 SuperPOD
提到今年早期在佛羅里達大學(xué)安裝的另一個系統(tǒng)時,南方衛(wèi)理公會大學(xué)首席信息官 Michael Hites 表示:“我們是美國第二所獲得 DGX SuperPOD 系統(tǒng)的大學(xué),它將助力本社區(qū)在使用 AI 技術(shù)推動學(xué)位課程,以及校企合作方面,均處于領(lǐng)先地位。”
9 月,一篇報導(dǎo)稱,達拉斯地區(qū)因缺乏主要的 AI 研究而 “步履蹣跚”。巧合的是,報導(dǎo)登上當(dāng)?shù)貓蠹堉畷r,也正是南方衛(wèi)理公會大學(xué)敲定其 DGX SuperPOD 計劃之日。
南方衛(wèi)理公會大學(xué)在 3 月的一份計劃預(yù)覽報告中表示,AI 是 “數(shù)字化轉(zhuǎn)型的核心……沒有任何社會部門能夠不受該技術(shù)的影響。AI 對 K-12 教育行業(yè)和勞動力發(fā)展具有巨大的改善潛力,這將有助于該地區(qū)經(jīng)濟的持續(xù)增長?!?/p>
一項 15 億美元的籌款活動 —— SMU Ignite —— 于 9 月正式啟動。SMU Ignite 將推動 AI 倡議,幫助南方衛(wèi)理公會大學(xué)邁入全國頂級研究型大學(xué)的行列。該大學(xué)正在聘請一位首席創(chuàng)新官來協(xié)助指導(dǎo)此項工作。
打造一個計算煉金爐
南方衛(wèi)理公會大學(xué)研究者 IT 支持團隊主管 Jason Warner 表示,這項工作的核心是人才。因此,他為南方衛(wèi)理公會大學(xué)福特研究與創(chuàng)新中心的一個新中心聘請了一批具有重大影響力的數(shù)據(jù)科學(xué)專家。Warner 將這座新中心稱為南方衛(wèi)理公會大學(xué)的 “計算煉金爐”。
這支團隊由 Eric Godat 領(lǐng)導(dǎo),他在南方衛(wèi)理公會大學(xué)使用大型強子對撞機的數(shù)據(jù)為核結(jié)構(gòu)建模,并因此獲得了粒子物理學(xué)博士學(xué)位。
而今,他正協(xié)助南方衛(wèi)理公會大學(xué)的學(xué)生了解 DGX SuperPOD 所帶來的新機會。第一步,他邀請兩名南方衛(wèi)理公會大學(xué)的學(xué)生使用 NVIDIA Jetson 模塊建造一個 DGX SuperPOD 的微型模型。
Godat 表示:“我們想讓大家感受一下未來的工作會是什么樣子的,尤其是那些沒有做過 AI 方面工作的非技術(shù)領(lǐng)域人員。”
這臺全尺寸超級計算機由建立在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上的 20 個 NVIDIA DGX A100 系統(tǒng)組成。憑借其積木式的模塊化結(jié)構(gòu),這臺超級計算機最早可以在 1 月啟動和運行。它將提供高達 100PFlops 的計算力,足以使其在全球最快超級計算機榜單 TOP500 上位居前列。
德克薩斯農(nóng)工大學(xué)為其 ACES
使用 NVIDIA Quantum-2 InfiniBand 技術(shù)
位于南面約 200 英里的德克薩斯農(nóng)工大學(xué)高性能計算中心,將成為首批接入 NVIDIA Quantum-2 InfiniBand 平臺的機構(gòu)之一。其 ACES 超級計算機由戴爾科技建造,將使用 400G InfiniBand 網(wǎng)絡(luò)為研究者連接來自四家廠商的五個加速器。
NVIDIA Quantum-2 確保 “在 ACES 上單項工作即可以擴展到所有計算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它還具有更低的總擁有成本、更強大的網(wǎng)絡(luò)計算功能和更高的擴展性 ”,ACES 首席研究員兼項目總監(jiān) Honggao Liu 表示。
德克薩斯農(nóng)工大學(xué)已經(jīng)為研究者提供了四套加速計算系統(tǒng),這四套系統(tǒng)包含 600 多個 NVIDIA A100 Tensor Core 和上一代 GPU,其中兩個系統(tǒng)使用了較早版本的 NVIDIA InfiniBand 技術(shù)。
密西西比州立大學(xué)乘上 400G 網(wǎng)速列車
密西西比州立大學(xué)也將使用 NVIDIA Quantum-2 InfiniBand 平臺。它是構(gòu)建 Orion 新系統(tǒng)的首選網(wǎng)絡(luò),Orion 是密西西比州立大學(xué)管理的四個集群中最大的一個集群,這四個集群全部使用較早版本的 InfiniBand 網(wǎng)絡(luò)所構(gòu)建。
Orion 和新系統(tǒng)均由美國國家海洋和大氣管理局 (NOAA) 所資助,由戴爾科技建造。Orion 和新系統(tǒng)將承擔(dān) NOAA 的工作任務(wù),以及密西西比州立大學(xué)的各項研究課題。
Orion 在 2019 年 6 月首次登上 TOP500 榜單,并被列為美國第四大學(xué)術(shù)超級計算機。
密西西比州立大學(xué)高性能計算總監(jiān) Trey Breckenridge 表示:“我們在密西西比州立大學(xué)的四代超級計算機中都使用了 InfiniBand,所以我們知道它既強大又成熟,可以可靠地運行我們需要的大型工作。”
他補充道:“我們正在添加一套使用 NVIDIA Quantum-2 的新系統(tǒng),以保持在高性能計算領(lǐng)域的領(lǐng)先優(yōu)勢。”
Quantum 在英國掀起風(fēng)潮
在大洋彼岸的英國,萊斯特大學(xué)的數(shù)據(jù)密集型超級計算機 —— DIaL 系統(tǒng) —— 已經(jīng)升級到 200G 版本的 NVIDIA Quantum InfiniBand。
萊斯特大學(xué)理論天體物理學(xué)教授兼高性能計算中心總監(jiān) Mark Wilkinson 表示:“ DIaL專為解決復(fù)雜的數(shù)據(jù)密集型問題而設(shè)計,我們需要解決這些問題,才能推進對周圍宇宙的理解?!?/p>
“這些專業(yè)應(yīng)用對帶寬和延遲的要求都是前所未有的,只有 InfiniBand 能夠滿足要求,使研究工作有效開展?!?/p>
DIaL 是英國 DiRAC 設(shè)施中使用 InfiniBand 的四臺超級計算機之一,另外還包括愛丁堡大學(xué)的 Tursa 系統(tǒng)。
InfiniBand 在技術(shù)評估上表現(xiàn)出色
在一次技術(shù)評估中,研究人員發(fā)現(xiàn)與使用另一種互連方式的純 CPU 系統(tǒng) Tesseract 相比,在由 Quantum 網(wǎng)絡(luò)和 NVIDIA GPU 加速器構(gòu)建的 Tursa 系統(tǒng)上運行應(yīng)用性能可達 5 倍提升。
基準(zhǔn)應(yīng)用測試顯示,Tursa 系統(tǒng)上 16 個節(jié)點的性能是 Tesseract 系統(tǒng)上 512 個節(jié)點性能的兩倍。Tursa 系統(tǒng)的每個節(jié)點提供 10 TFlops 計算性能,使用 90% 的網(wǎng)絡(luò)帶寬,每千瓦性能相比 Tesseract 有顯著的提高。
這也說明了為什么世界上大多數(shù) TOP500 系統(tǒng)都在使用 NVIDIA 的技術(shù)。
編輯:jq
-
cpu
+關(guān)注
關(guān)注
68文章
10898瀏覽量
212528 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5065瀏覽量
103452 -
超級計算機
+關(guān)注
關(guān)注
2文章
464瀏覽量
41977 -
AI
+關(guān)注
關(guān)注
87文章
31360瀏覽量
269762
原文標(biāo)題:SC21 | 多所大學(xué)采用 NVIDIA 系統(tǒng)和網(wǎng)絡(luò)拓展研究工作
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論