2021 年,我們見(jiàn)證了 Covid-19 大流行如何實(shí)時(shí)影響高性能計(jì)算 (HPC) 和數(shù)據(jù)中心行業(yè)。雖然每個(gè)人都學(xué)會(huì)了掌握遠(yuǎn)程工作和學(xué)習(xí)的藝術(shù),但對(duì)更多計(jì)算能力和更少延遲的需求推動(dòng)了 HPC 市場(chǎng)的增長(zhǎng)軌跡,甚至超出了專(zhuān)家在 2020 年初的預(yù)測(cè)。
隨著塵埃落定,我們都已經(jīng)習(xí)慣了“新常態(tài)”,我們已經(jīng)習(xí)慣了新的工作方式、學(xué)習(xí)方法和一般的社交互動(dòng)方式。這種數(shù)據(jù)處理和數(shù)據(jù)共享的整體靈活性和先進(jìn)方法將持續(xù)到明年,使每個(gè)人的工作效率更高,信息更容易訪(fǎng)問(wèn),協(xié)作更加無(wú)縫。因此,我們將繼續(xù)看到 HPC 市場(chǎng)不斷發(fā)展和擴(kuò)大,越來(lái)越多的行業(yè)需要更多互連的硅架構(gòu)以及高速網(wǎng)絡(luò)。
以下是我們對(duì) HPC 今年將進(jìn)入的新市場(chǎng)、安全性日益重要以及支持 HPC 應(yīng)用程序的不斷發(fā)展的架構(gòu)的主要預(yù)測(cè)。
去年,我們看到 HPC 被用于制造預(yù)防 Covid-19 的疫苗。我們將繼續(xù)看到它被用于醫(yī)學(xué)研究和監(jiān)測(cè),但 HPC 也將在 2022 年擴(kuò)展到更新的市場(chǎng)。
斯科特·杜蘭特:我們看到美國(guó)和全世界災(zāi)難性氣候事件的數(shù)量在增加,能夠預(yù)測(cè)這些事件以保護(hù)人們免受這些事件的影響變得越來(lái)越重要。這是一個(gè)應(yīng)用程序,在來(lái)年將成為 HPC 領(lǐng)域的重點(diǎn)。除此之外,在云中 HPC 的可用性的推動(dòng)下,我們將看到 HPC 更多地用于面向消費(fèi)者的應(yīng)用程序。從歷史上看,高性能數(shù)據(jù)中心一直是孤立的,只有研究機(jī)構(gòu)、政府和預(yù)算非常龐大的公司才能使用。我們將開(kāi)始看到虛擬世界或最近開(kāi)始被稱(chēng)為“元宇宙”的發(fā)展,既可用于娛樂(lè),如游戲(增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)),也可用于模擬,如數(shù)字雙胞胎。
Ruben Molina:你可以證明,過(guò)去被認(rèn)為是 HPC 的東西每隔幾年就會(huì)成為主流。我預(yù)測(cè)邊緣的 HPC 將更多地成為規(guī)則而不是例外。工業(yè)部門(mén)將把 HPC 用于機(jī)器人技術(shù)、視覺(jué)系統(tǒng)以及預(yù)防性維護(hù)和監(jiān)控中的應(yīng)用,例如裝配線(xiàn)上的預(yù)定或預(yù)測(cè)性故障——基本上,所有需要計(jì)算能力的工業(yè)領(lǐng)域都在使用設(shè)備的地方為了減少停機(jī)時(shí)間的需要。
Susheel Tadikonda:HPC 市場(chǎng)正在隨著新的工作類(lèi)型而擴(kuò)展,將人工智能 (AI) 和數(shù)據(jù)分析添加到傳統(tǒng)的模擬和建模中。COVID-19 的興起強(qiáng)調(diào)了對(duì)云中靈活且可擴(kuò)展的 HPC 解決方案的需求。再加上各個(gè)垂直行業(yè)(生命科學(xué)、汽車(chē)、金融、游戲、制造、航空航天等)對(duì)更快數(shù)據(jù)處理和更高準(zhǔn)確性的需求日益增加,這將是未來(lái)推動(dòng) HPC 采用增長(zhǎng)的主要因素年。AI、邊緣計(jì)算、5G 和 Wi-Fi 6 等技術(shù)將拓寬 HPC 的能力,催生新的芯片/系統(tǒng)架構(gòu),為各個(gè)領(lǐng)域提供高處理和分析能力。
提高 HPC 安全性對(duì)于新設(shè)計(jì)至關(guān)重要
明年將要處理的數(shù)據(jù)量將呈指數(shù)級(jí)增長(zhǎng),這些數(shù)據(jù)的價(jià)值和敏感性也會(huì)隨之增加。在設(shè)計(jì) HPC 組件時(shí),確保安全性是必不可少的組件(而不是事后考慮),這將是工程師今年和今后每年都將面臨的最大設(shè)計(jì)挑戰(zhàn)之一。
Susheel Tadikonda :HPC 系統(tǒng)包含高度定制的硬件和軟件堆棧,這些堆棧針對(duì)性能優(yōu)化、電源效率和互操作性進(jìn)行了調(diào)整。使用自己的使用模式和獨(dú)特的組件/屬性來(lái)設(shè)計(jì)和保護(hù)此類(lèi)系統(tǒng),使其不同于其他類(lèi)型的通用計(jì)算系統(tǒng)。安全威脅不僅限于網(wǎng)絡(luò)/存儲(chǔ)數(shù)據(jù)泄露,還包括側(cè)信道攻擊,例如從電源狀態(tài)、排放和處理器等待時(shí)間推斷數(shù)據(jù)模式。我們將看到更多圍繞內(nèi)存和存儲(chǔ)技術(shù)、智能互連、支持芯片的安全性和云安全性的創(chuàng)新,以有效管理海量數(shù)據(jù)。安全驗(yàn)證/確認(rèn)將代表安全保障中最關(guān)鍵的部分之一,涵蓋架構(gòu)、設(shè)計(jì)、
Scott Durrant:保護(hù)信息、保護(hù)數(shù)據(jù)的機(jī)密性和完整性以及提供對(duì)數(shù)據(jù)的訪(fǎng)問(wèn)控制的重要性顯著增加。在過(guò)去的一年里,我們已經(jīng)看到了勒索軟件和其他網(wǎng)絡(luò)攻擊可能導(dǎo)致的各種問(wèn)題。隨著基礎(chǔ)設(shè)施中數(shù)據(jù)的價(jià)值越來(lái)越大,攻擊的數(shù)量將會(huì)越來(lái)越多,因此從硬件向上到堆棧的所有級(jí)別提供安全性以保護(hù)這些信息將變得越來(lái)越重要。”
Scott Knowlton:零信任框架也將被更多人采用。這意味著進(jìn)入并想要訪(fǎng)問(wèn)數(shù)據(jù)的人需要驗(yàn)證他們的身份并證明他們有權(quán)訪(fǎng)問(wèn)數(shù)據(jù)。我們預(yù)計(jì)這將在未來(lái)一年左右進(jìn)一步增加。事實(shí)上,我們已經(jīng)看到了一些必要硬件的基礎(chǔ)。此外,我們將在基礎(chǔ)架構(gòu)中的每個(gè)元素中看到嵌入的信任根。它使他們能夠相互驗(yàn)證,并確保在與另一臺(tái)設(shè)備共享數(shù)據(jù)之前,該設(shè)備有權(quán)使用和處理該數(shù)據(jù)?!?/p>
Ruben Molina:許多市場(chǎng)的數(shù)字化程度越高,安全風(fēng)險(xiǎn)的機(jī)會(huì)就越多。由于增加的高性能計(jì)算距離數(shù)據(jù)中心越來(lái)越遠(yuǎn),因此無(wú)法通過(guò)軟件補(bǔ)丁完全緩解的攻擊機(jī)會(huì)將越來(lái)越多。這將給設(shè)計(jì)團(tuán)隊(duì)帶來(lái)很大的壓力,他們急于推出硬件來(lái)解決這些問(wèn)題,這將導(dǎo)致硬件設(shè)計(jì)周期加快。提高設(shè)計(jì)師的生產(chǎn)力以跟上上市時(shí)間的需求將成為一項(xiàng)關(guān)鍵需求。
分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長(zhǎng)
隨著數(shù)據(jù)量的增加,需要考慮的不僅僅是安全性。必須增加存儲(chǔ)基礎(chǔ)設(shè)施以及處理這些數(shù)據(jù)的計(jì)算能力。新架構(gòu),包括 3DIC 和 die-to-die 連接,對(duì)于滿(mǎn)足最新要求是必要的。
Susheel Tadikonda :HPC 架構(gòu)正在經(jīng)歷一場(chǎng)翻天覆地的轉(zhuǎn)變,這種變化的驅(qū)動(dòng)因素是不斷發(fā)展的 (AI) 工作負(fù)載、靈活計(jì)算(CPU、GPU、FPGA、DPU 等)、成本、內(nèi)存和 IO 吞吐量。微架構(gòu)層面的進(jìn)步包括更快的互連、更高的計(jì)算密度、可擴(kuò)展的存儲(chǔ)、更高的基礎(chǔ)設(shè)施效率、生態(tài)友好性、空間管理和更高的安全性。從系統(tǒng)的角度來(lái)看,下一代 HPC 架構(gòu)將出現(xiàn)分解架構(gòu)(將內(nèi)存與處理器和加速器分離)和異構(gòu)系統(tǒng)的爆炸式增長(zhǎng),其中不同的專(zhuān)業(yè)處理架構(gòu)(FPGA、GPU、CPU 等)集成在單個(gè)節(jié)點(diǎn)中允許在細(xì)粒度的模塊之間靈活切換。實(shí)現(xiàn)這種集成系統(tǒng)的一個(gè)關(guān)鍵方法是使用“小芯片”。如此復(fù)雜的系統(tǒng)帶來(lái)了巨大的驗(yàn)證挑戰(zhàn),尤其是系統(tǒng)上下文中的 IP/節(jié)點(diǎn)級(jí)驗(yàn)證、動(dòng)態(tài)硬件-軟件編排、基于工作負(fù)載的性能和功率等。這將需要推動(dòng)新的硬件-軟件驗(yàn)證方法。
Scott Durrant:系統(tǒng)管理員今天面臨的挑戰(zhàn)之一是移動(dòng)數(shù)據(jù)需要大量的電力和時(shí)間(兩者都供應(yīng)有限)。將處理移近數(shù)據(jù)以減少發(fā)生的數(shù)據(jù)移動(dòng)量將是我們將在 2022 年看到加速的趨勢(shì)。隨之而來(lái)的是需要繼續(xù)擴(kuò)展資源。我認(rèn)為我們將在來(lái)年看到真正進(jìn)步的機(jī)制之一是利用先進(jìn)的封裝和裸片到裸片接口來(lái)支持更高性能的設(shè)備,即通過(guò)使用多個(gè)設(shè)備來(lái)擴(kuò)展設(shè)備內(nèi)的處理能力死。
Ruben Molina:除了通過(guò)將數(shù)據(jù)移近處理元件來(lái)減少延遲外,多芯片集成還允許通過(guò)將多個(gè)芯片組合在一個(gè)封裝中來(lái)擴(kuò)展計(jì)算能力,而無(wú)需使用前沿工藝技術(shù)的成本。為實(shí)現(xiàn)這一目標(biāo),設(shè)計(jì)人員需要能夠?qū)Ψ庋b內(nèi)多個(gè)芯片的時(shí)序和功率進(jìn)行布局規(guī)劃、布線(xiàn)和分析。另一種擴(kuò)展計(jì)算能力的方法是為特定任務(wù)定制計(jì)算架構(gòu)。公司已經(jīng)開(kāi)始為網(wǎng)絡(luò)處理器和圖形應(yīng)用程序這樣做,但是需要大量的前期架構(gòu)探索才能在 RTL 中正確使用它,并且將大量精力放在可以在設(shè)計(jì)周期早期實(shí)現(xiàn)這些權(quán)衡的工具上.
Scott Knowlton:我們還看到了架構(gòu)的分解。像 3DIC 這樣的架構(gòu)正在成為使設(shè)計(jì)人員能夠?qū)⒉煌穆闫头庋b放在一起以處理特定計(jì)算路徑的關(guān)鍵。因此,現(xiàn)在他們可以使用 3DIC 和 die-to-die 連接設(shè)計(jì)封裝,然后將其從特定組件外推到我們看到內(nèi)存系統(tǒng)分解的機(jī)器中。這為我們提供了不同類(lèi)型的設(shè)計(jì)和架構(gòu)來(lái)處理特定工作流任務(wù)的獨(dú)特機(jī)會(huì)。
審核編輯 黃昊宇
-
計(jì)算
+關(guān)注
關(guān)注
2文章
451瀏覽量
38841 -
HPC
+關(guān)注
關(guān)注
0文章
319瀏覽量
23819 -
高性能
+關(guān)注
關(guān)注
0文章
157瀏覽量
20418
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論