RISC-V 不再滿足于顛覆 CPU 行業(yè)。它正在對集成到 SoC 或高級封裝中的每種類型的處理器發(fā)動戰(zhàn)爭,這是一項雄心勃勃的計劃,將面臨來自擁有雄厚研發(fā)業(yè)務(wù)和構(gòu)建良好生態(tài)系統(tǒng)的老牌廠商的激烈競爭。
當(dāng) RISC-V International 首席執(zhí)行官 Calista Redmond 在去年的峰會上表示 RISC-V 將無處不在時,大多數(shù)人可能認(rèn)為她在談?wù)?CPU。很明顯,該組織打算在服務(wù)器和深度嵌入式設(shè)備中使用 RISC-V 內(nèi)核。但該組織的目標(biāo)遠不止于此。Redmond暗示,每個處理核心、GPU、GPGPU、AI 處理器以及尚未構(gòu)思的所有其他類型的處理器都將基于 RISC-V。加州大學(xué)伯克利分校教授兼 RISC-V 國際主席 Krste Asanovi? 在他的國情咨文中展示了下面的幻燈片,這一點變得更加清晰。
如今,隨著最近完成的安全和加密工作,這一愿景開始成形。正在組建小組并審查捐款,以增加對矩陣乘法的支持,矩陣乘法是 GPU 和 AI 處理器的基本功能。
這些大膽聲明的背后是數(shù)據(jù)和計算架構(gòu)的根本性轉(zhuǎn)變。這不再是哪家公司擁有最快的CPU的問題,因為無論設(shè)計得多么好,所有的CPU都有局限性?!霸谝恍┐怪笔袌?,例如 5/6G、推理和視頻處理,它們的計算工作負(fù)載不再適合在傳統(tǒng) CPU 上處理,”西門子 EDA 的 Catapult HLS 團隊項目總監(jiān) Russell Klein表示?!斑@就是我們看到新計算方法被采用的地方。”
幾乎每個應(yīng)用程序都有某種形式的控制結(jié)構(gòu)?!皬膬?nèi)存訪問的角度來看,圖形是一種非常特殊的野獸,具有非常特殊的要求,”Arteris 解決方案和業(yè)務(wù)開發(fā)副總裁 Frank Schirrmeister說道。“如果你看一下最近發(fā)布的一些 AI 和 RISC-V 公告,你會發(fā)現(xiàn)有些公司宣布的處理元素顯然包含 ISA?!?/p>
在某些情況下,這些只需要正確的說明。Bluespec 首席執(zhí)行官 Charlie Hauck 表示:“RISC-V 有一種叫做向量擴展的東西?!?“根據(jù)您如何實現(xiàn)這一點,您可以獲得一些看起來非常像 GPU 的東西,其中有許多并行運行的小型單元,或者以 SIMD 類型的方式運行?!?/p>
然而,這條路并不容易?!巴ㄟ^指令擴展將GPU功能添加到RISC-V架構(gòu)中很有吸引力,因為GPU在AI領(lǐng)域發(fā)揮著重要作用,”Stream Computing研發(fā)總監(jiān)Fujie Fan表示?!叭欢覀円呀?jīng)意識到架構(gòu)和生態(tài)系統(tǒng)中不可避免的問題?!?/p>
懷疑論者比比皆是。處理器的歷史上充斥著失敗的初創(chuàng)公司,它們宣稱他們將用新的計算架構(gòu)粉碎競爭。許多人沒有考慮到競爭并沒有停滯不前,計算領(lǐng)域正在經(jīng)歷持續(xù)且加速的變化,而轉(zhuǎn)向新方法和工具以及培訓(xùn)/再培訓(xùn)工程師的痛苦和費用絕非微不足道。
“RISC-V 為采用者帶來的價值在于控制處理領(lǐng)域,它擁有現(xiàn)成的開源工具、現(xiàn)成的操作系統(tǒng)(Linux 或?qū)崟r)以及提供的長期軟件兼容性/可移植性的承諾通過 ISA 通用性,” Quadric工程副總裁 Dhanendra Jani 說道?!皥D形處理是一個非常不同的挑戰(zhàn)——特定領(lǐng)域的處理挑戰(zhàn)。要將基本 RISC-V 指令集調(diào)整為一種非常適合 GPU 任務(wù)的指令集,需要大量投資來定義自定義 ISA 擴展、構(gòu)建高度復(fù)雜的微架構(gòu)更改,并對開源工具進行重大手術(shù),使它們與原來不同。這樣做時,使用 RISC-V 的幾乎所有固有價值都因廣泛的定制而消失了,您將失去大部分優(yōu)勢,同時可能會受到核心 ISA 功能的束縛,這些功能限制了特定領(lǐng)域 GPU 環(huán)境中的有用性。簡而言之,從 RISC-V 開始而不是從頭開始有什么意義呢?”
那么RISC-V的計劃是什么?“矢量是 SIMD 操作,使您能夠同時對多條數(shù)據(jù)進行操作,并讓芯片找出從內(nèi)存中取出數(shù)據(jù)的最佳方式,處理單個指令,然后將數(shù)據(jù)放回內(nèi)存,或者將它們轉(zhuǎn)移到下一個操作,”RISC-V International 首席技術(shù)官 Mark Himelstein 說道?!叭鄙俚幕緝?nèi)容是矩陣乘法。我們收到了多個提案,其中之一類似于適合 32 位指令的向量擴展。這非常困難并且需要設(shè)置說明。您設(shè)置了stride和masks等內(nèi)容,然后扣動扳機并執(zhí)行操作。但如果您想與其他架構(gòu)上更大的矩陣實現(xiàn)競爭,則必須采用更寬的 64 位指令。這是很多人都在談?wù)摰?a href="http://wenjunhu.com/v/tag/" target="_blank">話題?!?/p>
問題是有多少復(fù)雜性被暴露,有多少仍然隱藏?!癐SA 是一個關(guān)鍵組件,” Arm客戶端業(yè)務(wù)線產(chǎn)品管理高級總監(jiān) Anand Patel 說道?!叭欢珿PU 的復(fù)雜性通常由 Vulkan 或 OpenCL 等標(biāo)準(zhǔn) API 抽象出來。這使得開發(fā)人員可以更輕松地跨多個供應(yīng)商進行定位,同時將較低級別的優(yōu)化留給 GPU 供應(yīng)商。即使在 GPGPU 類型的應(yīng)用中,GPU 的架構(gòu)也在快速發(fā)展,以跟上人工智能處理等新興用例的步伐,因此開發(fā)人員能夠訪問成熟的軟件生態(tài)系統(tǒng)來跟上這些變化至關(guān)重要。標(biāo)準(zhǔn) API 確保開發(fā)人員不必?fù)?dān)心 ISA 更改,而是透明地看到這些底層改進的好處?!?/p>
宏觀架構(gòu)和微架構(gòu)
區(qū)分這兩個問題很重要,因為 RISC-V 僅定義了宏觀架構(gòu),而將所有微架構(gòu)決策留給了實現(xiàn)者。當(dāng)超越 CPU 時,這將成為一個更大的問題?!榜T·諾依曼在某些方面有限制性,但特定實現(xiàn)如何與內(nèi)存交互并不是由 RISC-V 決定的,”RISC-V 的 Himelstein 說?!按蠖鄶?shù) GPU 實現(xiàn)都通過多級管道中的內(nèi)存來優(yōu)化這一點。當(dāng)一些操作正在進行時,一些東西來自內(nèi)存。當(dāng)您開始研究 GPU 時,您會談?wù)摫┞秲?nèi)存交互。我們確實對事情發(fā)生的順序有一些限制,因為你想確保操作被明確定義?!?/p>
看待問題的方法有很多種?!白钕冗M的 GPU 產(chǎn)品可以按照傳統(tǒng)圖形處理和現(xiàn)代人工智能加速來劃分,”Stream 的 Fan 說道?!扒罢吒袷强?a target="_blank">編程ASIC,而不是通用處理器,其核心能力來自于流處理器的實現(xiàn),而不是ISA。指令集通常對程序員來說是不可見的,并且總是處于次要位置。圖形處理器的設(shè)計與微架構(gòu)密切相關(guān),適合用定制指令來實現(xiàn)。對于我們大多數(shù)人來說,人工智能和多媒體功能的標(biāo)準(zhǔn)化更具吸引力。要實現(xiàn)這樣的能力,復(fù)制GPU并不是唯一的方法。對于RISC-V來說,多媒體功能可以通過矢量架構(gòu)來實現(xiàn),AI能力可以通過更高效的異構(gòu)架構(gòu)和矩陣加速器來實現(xiàn)?!?/p>
如果您希望外部程序員為您的設(shè)備編寫軟件,則某些方面會發(fā)生變化?!皵?shù)據(jù)流處理可以通過多種方式完成,”西門子的Klein說?!耙环N是使用小型通用處理器甚至專用處理器的管道,每個處理器都處理問題的一個階段。這比單個大型 CPU 更快、更高效。使用可編程處理器作為計算元件保留了很大的靈活性,但確實放棄了一些性能和效率。這種方法確實可以在任何有能力的多核處理器上構(gòu)建。問題是這種方法已被軟件開發(fā)社區(qū)徹底拒絕,他們不愿意放棄單線程編程模型?!?/p>
這對于很多企業(yè)來說都是一個大問題?!叭绻趯ふ彝ㄓ锰幚砥鳎鶕?jù)應(yīng)用要求,它可以是從單級、兩級或三級微控制器一直到運行多級的多級超標(biāo)量設(shè)計。Bluespec 的 Hauck 說道?!盎蛘?,你會看到人們擁有 4096 個 RISC-V 處理器,每個處理器都是小型、簡化的 RV32I 類型的東西,它們被組合在特定的系統(tǒng)架構(gòu)和互連中,使這些東西能夠按照 GPU 的精神運行。它們由許多較小的整數(shù)單元組成,這些單元共同協(xié)作完成一項艱巨的任務(wù)。挑戰(zhàn)在于如何為此開發(fā)軟件?”
有了更大的靈活性,可能需要新的方法?!霸诖笮?HPC 中,如果您運行的工作負(fù)載更加面向數(shù)據(jù)中心,則它具有一組特定的特征。但如果您的應(yīng)用程序是科學(xué)應(yīng)用程序,也許有一些關(guān)于加載和存儲以及多種數(shù)學(xué)類型運算的功能可以擴展,”西門子 EDA 首席產(chǎn)品營銷經(jīng)理 Andy Meyer 說道?!叭绻藗冞x擇這條路線,生態(tài)系統(tǒng)就會面臨一些挑戰(zhàn)。最大的增長領(lǐng)域是超大規(guī)模應(yīng)用。如果你看看風(fēng)險投資的金額,你就會發(fā)現(xiàn)他們顯然正在解決一個獨特的問題?!?/p>
軟件和生態(tài)系統(tǒng)
硬件/軟件協(xié)同設(shè)計一直是幾十年來的目標(biāo),而 RISC-V 是少數(shù)幾個取得進展的領(lǐng)域之一?!皞鹘y(tǒng)的數(shù)據(jù)處理設(shè)計不遺余力地將硬件和軟件分開,”Klein說。“硬件被創(chuàng)建出來,然后軟件人員就可以在上面自由發(fā)揮。假設(shè)是,如果硬件足夠通用,那么軟件將能夠完成提供系統(tǒng)功能所需的任何操作。如果您的計算能力和功耗有足夠的余量,那么這是可行的。我不會說它效果很好,但它確實有效,盡管相當(dāng)浪費?!?/p>
特定領(lǐng)域的計算開始改變這一點。“要真正發(fā)揮數(shù)據(jù)流處理器的潛力就意味著針對特定應(yīng)用程序進行定制,”Klein 補充道?!斑@意味著硬件和軟件團隊需要共同努力才能取得成功。這讓很多組織和設(shè)計團隊感到非常不舒服?!?/p>
有時協(xié)同設(shè)計是唯一的方法?!凹僭O(shè)您需要在邊緣進行一些處理,”Bluespec 的 Hauck 說。“總會存在外形尺寸、尺寸或功率限制。再多的軟件創(chuàng)新也無濟于事。如果您有一個軟件堆棧,那么該堆棧就是它的本質(zhì)。您將無法對任何具有這些類型的約束的特定解決方案進行軟件優(yōu)化。你必須進入硬件領(lǐng)域。”
創(chuàng)建嵌入式系統(tǒng)時,處理器接觸到廣泛編程受眾的可能性較小,并且可以進行更多優(yōu)化?!翱紤]一下已經(jīng)完成的矢量加密工作,”Himelstein說。“沒有人會在他們的程序中編寫矢量加密。這不是他們所做的。他們所做的是使用庫,例如 libSSL 或其他一些加密庫,并且使用這些指令。有時他們通過匯編語言來使用它們,然后提供 C、C++ 或 Java 接口,以便程序、應(yīng)用程序可以利用它們?!?/p>
當(dāng)需要通用編程時,它就會變得更加困難。“如果你看看 GPU 的生態(tài)系統(tǒng),就會發(fā)現(xiàn)工具鏈?zhǔn)怯?NVIDIA 控制的,”Fan 說?!鞍?a href="http://wenjunhu.com/tags/amd/" target="_blank">AMD在內(nèi)的其他競爭對手曾試圖打破壟斷,但失敗了。通過擴展RISC-V的標(biāo)準(zhǔn)指令集來兼容不斷更新的NVIDIA生態(tài)系統(tǒng)幾乎是不可能的。另一方面,重新開始也很難,因為 NVIDIA 具有先發(fā)優(yōu)勢?!?/p>
成功的時刻
盡管如此,RISC-V 的核心在于實現(xiàn)創(chuàng)新?!拔覀兯吹降年P(guān)于為什么遺留解決方案是目前最佳解決方案的許多觀點都是歷史性的,”Hauck 說?!?a target="_blank">智能架構(gòu)師和智能軟件開發(fā)人員真正發(fā)揮其專業(yè)知識的地方將是 RISC-V 類型的環(huán)境?!?/p>
它始于公共需求?!叭绻行枰?,人們就會聚集在一起進行協(xié)作,而 RISC-V 就是協(xié)作,”西門子的 Meyer 說道?!澳銜吹揭粋€又一個的例子,世界各地正在發(fā)生各種不同的倡議和聯(lián)盟。生態(tài)系統(tǒng)將會發(fā)展,但商業(yè)方面和支持社區(qū)之間需要保持平衡?!?/p>
這可能會帶來一些業(yè)務(wù)挑戰(zhàn),尤其是在收回投資回報時。“RISC-V 還需要一段時間才能趕上并與成熟的產(chǎn)品和生態(tài)系統(tǒng)競爭,”Hauck 說?!暗銜_始發(fā)現(xiàn),對于某些應(yīng)用程序,只要有合適的公司支持,RISC-V 處理器就沒有理由不能成功。那里有很多優(yōu)秀的軟件開發(fā)人員。最終他們會到達那里,因為社區(qū)擁有他們創(chuàng)新所需的所有工具?!?/p>
那么我們還要多久才能看到 RISC-V GPU 和 AI 處理器呢?Himelstein 表示:“如果您想要為非 GPU 類型的世界提供合理的 AI 功能補充,那么今天您已經(jīng)擁有了?!?“但是,經(jīng)過批準(zhǔn)的矩陣以及這些團體一直要求的所有其他內(nèi)容的完整補充可能會在大約一年半的時間內(nèi)出現(xiàn),其中基本內(nèi)容可能會出現(xiàn),然后高級內(nèi)容可能會在三到四年內(nèi)出現(xiàn)”。
增量方法可以使部件的使用速度更快。Fan 表示:“分別標(biāo)準(zhǔn)化每個 GPU 功能比標(biāo)準(zhǔn)化整個 GPU 產(chǎn)品要好得多。” “至于人工智能功能,我們認(rèn)為正在進行的 RISC-V 矩陣擴展對于 IC 設(shè)計人員來說是更好的選擇。”
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
19286瀏覽量
229839 -
SoC芯片
+關(guān)注
關(guān)注
1文章
612瀏覽量
34921 -
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238486 -
RISC-V
+關(guān)注
關(guān)注
45文章
2277瀏覽量
46159 -
GPU芯片
+關(guān)注
關(guān)注
1文章
303瀏覽量
5812
原文標(biāo)題:RISC-V,要顛覆GPU?
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論