在邊緣計算、chiplet、人工智能與機器學習、CaaS(計算即服務)以及可持續(xù)性需求等其他趨勢的推動下,HPC(高性能計算)正在變得日益重要。
無論是在嚴格定義方面,還是在更為重要的應用領域和使用方法方面,HPC概念在過去幾年中均得到了發(fā)展。如今,HPC不再局限于大型數(shù)據(jù)中心、研究實驗室和超級計算機,而是被廣泛應用在各種行業(yè)中,如產(chǎn)品設計、財務建模、天氣預報等。它為我們所依賴并樂享的居家、辦公和汽車體驗帶來了更加強大的計算能力,讓各種應用更加貼近我們的日常生活。
HPC得以發(fā)展壯大的根本原因可以歸結(jié)為一個詞:數(shù)據(jù),更具體的來說是因為人們需要比以往更快地處理、分析和傳輸各種數(shù)據(jù)。不管是我們居家時刷短視頻的習慣,還是日益互聯(lián)的汽車,亦或是我們在完成工作、監(jiān)測健康狀況或管理財務時所需的大量信息,這些過程中都會不斷有數(shù)據(jù)產(chǎn)生、提供和消費,而HPC便是為這種無盡的數(shù)據(jù)循環(huán)問題而生。
隨著人們對HPC需求的不斷增加,對更快、更強、更高效的半導體芯片的需求也在同步增長。事實上,盡管芯片業(yè)務總體上有起有伏,但在HPC領域卻表現(xiàn)出一貫的持續(xù)增長。
作為HPC背后關(guān)鍵半導體技術(shù)的推動者,新思科技對HPC不斷變化的需求和新的用途有著全面的了解。那么,2023年HPC的前景如何呢?
01
邊緣(分布式)計算不斷發(fā)展
毫無疑問,邊緣計算是從總體上改變計算環(huán)境的一個關(guān)鍵趨勢,但它似乎與傳統(tǒng)HPC恰恰相反。HPC往往與大型集中式計算和存儲資源相關(guān)聯(lián),而這些資源實際上是遠程云計算的主干。相比之下,邊緣計算則專注于在網(wǎng)絡邊緣或附近處理數(shù)據(jù),而不是將數(shù)據(jù)發(fā)送回中心位置。這樣一來,它便可以提供較低的延遲,并且在許多情況下具有更安全的操作特性。
但是,這兩個領域正在走向融合:邊緣計算常常也是HPC,只是可能位于傳統(tǒng)數(shù)據(jù)中心之外的其他地方。導致出現(xiàn)這種情況的原因是數(shù)據(jù)的大爆炸。在萬物智能需求的推動下,邊緣產(chǎn)生的數(shù)據(jù)量在數(shù)量和復雜性方面呈指數(shù)級增長(這其中還包括大量的物聯(lián)網(wǎng)(IoT)設備)。邊緣計算的重要性主要體現(xiàn)在延遲和內(nèi)容交付上,因為不斷往返于云端/集中化數(shù)據(jù)中心無法滿足所需的響應時間。在某些情況下,文件可能太大,無法發(fā)送到云端進行處理甚至存儲。這其中可能包括城市交通管理和相關(guān)的自動駕駛系統(tǒng)、精準醫(yī)療、欺詐檢測、商業(yè)智能、智慧城市開發(fā)等。
我們認為,邊緣計算將對HPC系統(tǒng)供應商、云服務提供商、網(wǎng)絡供應商和存儲供應商產(chǎn)生重大影響,因為這些組織希望將遠程HPC功能與本地生成和處理的數(shù)據(jù)策略結(jié)合在一起。在此過程中,我們預計還會看到HPC的物理足跡從集中式交付模型擴展到更加分散的分布式模型,其中包含的一些位置靠近那些會生成大量數(shù)據(jù)的邊緣位置。
從芯片設計的角度來看,盡管邊緣計算仍要求具有出色的功耗、性能和面積(PPA),但它還要兼顧另一個關(guān)鍵優(yōu)先事項:減少這些設備在處理和傳輸數(shù)據(jù)時的延遲。設計策略必須優(yōu)先考慮這類芯片中的數(shù)據(jù)傳輸速度和效率,例如下面小芯片架構(gòu)中討論的那些芯片。當然,芯片設計解決方案必須考慮PPA權(quán)衡方案的各個方面,并提供一些高級功能來針對任何給定的應用需求設計和分析優(yōu)化的芯片。這其中包括強大的仿真和驗證工具、功耗和熱分析功能、設計布局的智能實施,以及一系列關(guān)鍵功能和接口的認證IP模塊。未來,從數(shù)據(jù)中心到由電池供電的物聯(lián)網(wǎng)設備,市場對能夠降低功耗的設計解決方案的需求會不斷增加。
02
Chiplets走向成熟
HPC的最新趨勢之一是Multi-Die系統(tǒng)的使用。由于器件的物理特性和制造傳統(tǒng)單體架構(gòu)芯片所面臨的經(jīng)濟挑戰(zhàn),摩爾定律的加倍效應已經(jīng)開始放緩。為了應對這一情況,Multi-Die系統(tǒng)得到了高性能計算領域的青睞。簡單來說,傳統(tǒng)的單個片上系統(tǒng)(SoC)變得太大,生產(chǎn)成本太高,無法進行先進設計,而且收益風險也會隨著設計尺寸而增加。作為擴展摩爾定律PPA優(yōu)勢的一種可行方式,Multi-Die方案非常具有吸引力。該方案可以提供更強大的處理能力,而又無需增加芯片面積或功耗。它還支持異質(zhì)混合和匹配方法,可最大限度實現(xiàn)目標應用優(yōu)化的工藝技術(shù)。將SoC組件分解,分別制造,然后將這些不同的功能匯集到單個封裝中,不僅可以減少浪費,同時還提供一種方法來快速打造具有優(yōu)化系統(tǒng)功耗和性能的新產(chǎn)品型號。
雖然Multi-Die系統(tǒng)已經(jīng)成為HPC發(fā)展的基本推動力,但設計方法必須不斷發(fā)展以應對新的挑戰(zhàn)。例如,支持高帶寬、低延遲、低功耗和無差錯工作的die-to-die接口對于快速、可靠的數(shù)據(jù)傳輸至關(guān)重要。而要處理這種Multi-Die方案中的異構(gòu)集成、互連和封裝問題,就需要增強的工具、方法和IP。另外,為了推動創(chuàng)新和設計效率達到新水平,還必須具備先進封裝和硅光子學等領域的專業(yè)知識和技術(shù)。
03
人工智能與機器學習方興未艾
另一個貫穿HPC各個方面的重要趨勢是人工智能(AI)和機器學習(ML)的興起。該領域與HPC存在著共生關(guān)系。
一方面,高性能計算機需要處理AI工作負載。在當今這個自動化數(shù)據(jù)密集的世界中,AI工作負載可謂無處不在。對于HPC供應商來說,這是一個快速增長的領域,幾乎每個有計算需求的地方都存在新的機遇。但是,為了支持AI工作負載,計算平臺要求底層硬件不斷提高性能,這就給芯片開發(fā)者帶來了持續(xù)創(chuàng)新的壓力。在這里,人工智能本身也發(fā)揮著作用?,F(xiàn)在,借助AI設計工具,開發(fā)者可以優(yōu)化繁瑣或過于詳盡的任務(經(jīng)過訓練的AI算法可以很好地接手這些任務),據(jù)此處理前沿芯片設計中的復雜性和規(guī)模性問題。這不僅提高了整體開發(fā)效率,還讓開發(fā)者可以專注于更加注重創(chuàng)新的工作。
另一方面,HPC依賴人工智能本身來高效、安全地運行數(shù)據(jù)中心。無論是監(jiān)控存儲、服務器和網(wǎng)絡設備的健康狀況與安全性,確保配置正確,預測設備故障,還是篩查數(shù)據(jù)來排查惡意軟件,人工智能為HPC用戶提供了新的洞察力,并將預測性維護提升到新水平。人工智能還可用于通過優(yōu)化供暖和冷卻系統(tǒng)來降低用電量和提高效率,這些是數(shù)據(jù)中心運營商最關(guān)心的關(guān)鍵可持續(xù)性問題(下文會做更深入的介紹)。
04
HPCaaS得以推進
隨著業(yè)務各個方面所需的計算能力大幅增長,各家公司都在積極探索“即服務”模式的價值,以滿足其周期性計算需求?!癏PC即服務”(HPCaaS)便應運而生。除了峰值工作負載效率外,此類模式還為那些內(nèi)部不具備相關(guān)知識、資源或基礎設施來通過云技術(shù)使用HPC的公司提供相關(guān)服務和支持。HPCaaS使得HPC易于部署和擴展,并且從成本的角度更加可預測。
芯片設計領域?qū)υ撃J奖憩F(xiàn)出了極大的興趣,希望能夠通過它來獲取執(zhí)行數(shù)據(jù)密集型芯片設計任務所需的計算資源。由多核架構(gòu)組成的復雜HPC芯片設計便是一個主要例證。這類設計在設計和開發(fā)期間要求具備更高的計算、存儲和處理能力,并且通常需要并行處理大量數(shù)據(jù),以便實現(xiàn)設計與驗證的融合。這種托管模式正在為大型半導體公司和開發(fā)高性能的HPC芯片的初創(chuàng)公司所使用。這是一種有趣的共生關(guān)系:HPC的推動者也依賴于HPC能力。
與其他HPCaaS企業(yè)用例一樣,基于云的EDA在芯片開發(fā)過程中提供了可擴展性、靈活性、效率和安全性。各家公司可以根據(jù)具體的使用需求、高峰設計時間和分布式工作結(jié)構(gòu)來調(diào)整HPC的使用,而無需員工具備專門的資源管理專業(yè)知識。所有這些優(yōu)勢都是建立在性能吞吐量優(yōu)勢的基礎之上,而這正是EDA工具的一個關(guān)鍵需求。
05
可持續(xù)發(fā)展成為焦點
隨著HPC的快速發(fā)展,我們在生活中諸多方面受益匪淺,但與此同時我們也為之付出了一些代價,即這些高能耗系統(tǒng)造成的環(huán)境影響。一些專家預測,到2030年,僅數(shù)據(jù)中心的用電量就將占到全球總用電量的3%至7%。在地方層面上,由于用水和用電量問題,許多數(shù)據(jù)中心都遭到人們強烈抵制,甚至出現(xiàn)難以獲得新施工許可的情況。這些大型計算平臺的供電和冷卻問題已經(jīng)成為可持續(xù)發(fā)展的討論熱點,電源使用效率(PUE)和碳排放等指標已經(jīng)成了大家首要考慮的問題。
通過可再生能源(水力、太陽能、風能)為數(shù)據(jù)中心供電的根本性轉(zhuǎn)變正逐漸成為大家的共識。一些新的方法同樣具有巨大的潛力,例如沉浸冷卻或液冷技術(shù)(包括水下數(shù)據(jù)中心),將數(shù)據(jù)中心消耗的能源和水重新分配并回收用于其他用途(如樓宇供暖),以及在供應鏈生態(tài)系統(tǒng)中使用更環(huán)保的組件、材料和制造方法。前文所述的HPCaaS模式本質(zhì)上也是一種更高效地利用資源的方法。
對于新思科技而言,我們能做的是在芯片級別提高能耗和散熱效率。例如,通過使用先進的低功耗設計方法和功率優(yōu)化的IP核,可以更好地對HPC芯片設計進行功耗優(yōu)化,從而降低芯片和整個系統(tǒng)的總體能耗。
小芯片趨勢為降低功耗提供了另一個重要的潛在途徑。對功耗更為敏感的數(shù)據(jù)傳輸方法(例如高帶寬內(nèi)存(HBM))也可以讓芯片及其支持的系統(tǒng)更加節(jié)能。CXL、UCIe和OCP等標準和開源工作也在助力這些目標的實現(xiàn)。
總之,HPC行業(yè)正在不斷發(fā)展壯大,每天都在為我們的生活帶來新的氣象。但是,這種發(fā)展是一把雙刃劍,因為它在為數(shù)據(jù)創(chuàng)建和消費方面帶來持續(xù)、高效增長的同時,也可能對環(huán)境造成有害的影響。應對這些挑戰(zhàn)的解決方案還在不斷改進中,新思科技期待發(fā)揮自己的作用,讓HPC保持可持續(xù)、可擴展的發(fā)展道路。
? ? ?
? ?
原文標題:2023:五大趨勢引領HPC可持續(xù)發(fā)展
文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
新思科技
+關(guān)注
關(guān)注
5文章
801瀏覽量
50376
原文標題:2023:五大趨勢引領HPC可持續(xù)發(fā)展
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論