準確的天氣模型對于企業(yè)正確預測可再生能源的生產和制定自然災害預案至關重要。僅 2022 年,無效和無法預測的天氣就造成了約 7140 億 美元的損失。為了避免這種情況,企業(yè)需要更快、更便宜、更精準的天氣模型。
在 GTC23上,微軟和 TempoQuest 詳細介紹了他們如何與 NVIDIA 合作一起解決這個能源和氣候問題。NVIDIA 初創(chuàng)加速計劃成員 TempoQuest 實現(xiàn)了超本地、低延遲的天氣和環(huán)境預測。該多學科合作團隊涵蓋大氣科學、氣象學、高性能計算(HPC)AI、機器學習(ML)、工程等領域,是將 GPU 引入環(huán)境領域的先鋒,包括:
本文中將介紹 TempoQuest 如何利用微軟 Azure 上的 NVIDIA 加速計算,將傳統(tǒng)的天氣研究和預報(WRF)軟件移植到 GPU 上、提供高于 1 公里的分辨率以及 1 分鐘至 1 小時的時間分辨率并加快對可再生風能和太陽能資源發(fā)電的預測。
公用事業(yè)單位在整合可再生能源過程中所面臨的挑戰(zhàn)
公用事業(yè)單位在他們的電網中使用可再生能源(主要是風能和太陽能)是具有挑戰(zhàn)性的。這些能源因環(huán)境因素而異,比如云層覆蓋和風速等。如果可再生能源的發(fā)電量不足以滿足需求,公用事業(yè)單位必須使用“旋轉備用”,即由發(fā)電機生產的碳基電力來彌補缺口。為了更好地預測可再生能源發(fā)電,需要快速、準確、經濟的天氣預報。
圖 1 標準電網基礎設施示意圖,包括發(fā)電、輸電和配電
能源行業(yè)需要實現(xiàn)三個關鍵功能:發(fā)電、輸電和配電。發(fā)電目前主要使用碳基燃料,但正在向包括風能和太陽能在內的可再生能源過渡,以實現(xiàn)凈零排放。輸電指的是產生的電力通過升壓變壓器后經高壓線傳輸。在遙遠的電網邊緣,電力經變壓器和變電站“降壓”后,輸送給家庭和企業(yè)的用電者(240 V / 120 V)。
如果要在電網中增加更多可再生能源,公用事業(yè)單位不僅要整合新的發(fā)電站,還要建造更多高壓輸電線路和塔架。這就給電網維護帶來了更高的復雜性和成本,包括投資和運營費用。高分辨率的 GPU 加速 WRF 可以通過減少對碳基電力的依賴和優(yōu)化可再生能源的使用幫助實現(xiàn)這一目標。
使用 GPU 加速 WRF
AceCAST 代表“加速預測”,通過運行一個名為“天氣研究和預報”(WRF)的區(qū)域模型可實現(xiàn)加速預測。目前,已有 160 個國家的 5 萬名用戶使用該模型。通過將 WRF 移植到使用專有的 OpenACC 和 CUDA 帶有 NVIDIA GPU 的 x86 系統(tǒng)上運行,并在多 GPU 和多節(jié)點系統(tǒng)上進行擴展。AceCAST 支持所有主要的 WRF 動力學、物理學方案和名詞表選項,可直接取代現(xiàn)有的 WRF 配置。
AceCAST 的眾多優(yōu)點包括更快的求解時間、更高的分辨率和精度、對局部天氣現(xiàn)象更加深入的認識以及更低的計算成本。
測試表明,在天氣預報和可再生能源預測方面,GPU 比 CPU 速度更快、分辨率更高且更具成本效益。這一加速解決方案對于減少碳排放、提升電網可靠性和管理以及降低用電者的用電成本十分重要。
AceCAST 驗證和性能成本分析
為了驗證基準測試結果,首先要保證 CPU WRF 與 GPU WRF 的差異在可接受的范圍內。團隊在幾個時間和空間預測范圍內測試了模型性能,最終驗證了數千個測試案例,以確保 AceCAST 產生與 CPU WRF 相同的結果。在微軟 Azure 上運行性能測試時,團隊發(fā)現(xiàn)兩者在性能和成本上都有很大的差異。
基于 CPU 的 WRF – Standard HB120rs_v3 VMs(HBv3):
-
120 顆 AMD EPYC7V73X 系列(Milan-X)CPU 核
-
450 GB 內存( 350 GB/s 內存帶寬)
-
200 Gb/s HDR InfiniBand
-
2 個1 TB NVMe 固態(tài)硬盤
-
NCAR WRF 4.2.2
-
使用 Parallel net-CDF
-
使用英特爾編譯器和 MPI 進行編譯
GPU 加速 WRF - Standard_ND96amsr_A100_v4(NDmv4):
-
8 個 NVIDIA A100 Tensor Core GPUs (80GB)
-
NVLink 3.0(200 Gb/s HDR InfiniBand)
-
96 顆 AMD EPYC7V12 系列(Rome)CPU 核
-
8 個 1 TB NVMe 固態(tài)硬盤
-
AceCAST 2.1
-
使用 OpenACC 和 CUDA 的專有實現(xiàn)
-
使用 MPI 在多節(jié)點和多 GPU 上進行擴展
Azure 代管式 Lustre 文件系統(tǒng)
-
40 TiB 存儲Azure 代管容量
-
10000 MB/s 最大吞吐量
圖 2 基于 CPU 的 WRF 與 TempoQuest AceCAST 的性能價格比較分析
結果顯示,與一個節(jié)點上基于 CPU 的 WRF 相比,一個節(jié)點上的 GPU 加速 WRF(AceCAST)的速度加快了約 9 倍,而要實現(xiàn)與一個 GPU 節(jié)點類似的性能,需要 18 個 CPU 節(jié)點。這些結果至關重要,因為更快、更低成本的天氣預報使公用事業(yè)單位能夠更加準確地預測可再生能源發(fā)電、提供穩(wěn)定可靠的電力并避免過長時間的停電。
AceCAST 3.0.1 上的進一步測試顯示其可繼續(xù)提升性能。團隊使用了一個嵌套域,外域由 500 萬個網格點(430x331x38v)和 15 公里的網格間距組成,內域由 8000 萬個網格點(1551x1361x38v)和 3 公里的網格間距組成。
圖 3 TempoQuest AceCAST 以最佳配置運行一項作業(yè)的性能成本圖
結果顯示,AceCAST 在 1xNDmA100V4(8 個 GPU)上的內域計算和通信時間比 1xHBv3(64 個CPU)快 16.8 倍。單個作業(yè)的最佳配置是在 16 個 HBv3(CPU)虛擬機上運行 WRF,在 1 個包含 8 個 GPU 的 NDmA100(GPU)虛擬機上運行 AceCAST。在這種情況下,AceCAST 比基于 CPU 的 WRF 運行速度快 7%,成本低 75%。
可再生發(fā)電功率預測
最后一步是將 AceCAST 應用于可再生能源預測。美國的公用事業(yè)單位掌握著所有 7 萬多臺風力發(fā)電機的規(guī)格以及每個風能和太陽能節(jié)點的位置。通過使用專有的天氣-電力算法,AceCAST 可提供更高的預測分辨率,每天對特定可再生能源發(fā)電站點作出小時級的精確功率預測(MW)。
電網脫碳化
隨著發(fā)電資產從集中化的碳基技術過渡到清潔的分布式能源資源,電網面臨著實時管理供需的挑戰(zhàn)。通過預測可再生資產的性能,電力公司能夠提高電網的可靠性和彈性。NVIDIA、微軟和 TempoQuest 正在聯(lián)手幫助解決這一重大的社會及全球挑戰(zhàn)。
憑借 AceCAST 這一 GPU 加速 WRF,TempoQuest 正在以更低的成本加速風能和太陽能可再生資源的發(fā)電功率預測。這有助于優(yōu)化負載和發(fā)電的平衡、減少公用事業(yè)單位的運營成本、管理可再生能源輸出的波動并產生更加可靠的預測,進而減少對碳基電力儲備的依賴。
點擊“閱讀原文”深入了解加速計算,訪問 GPU 加速庫論壇。
掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:微軟和 TempoQuest 利用 AceCast 加速風能預測
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3823瀏覽量
91553
原文標題:微軟和 TempoQuest 利用 AceCast 加速風能預測
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論