有道理的是,我們會發(fā)現(xiàn)很多應(yīng)用程序,我們可以在其中利用人工智能的力量來改進我們的流程并更快地構(gòu)建芯片。
Mentor, a Siemens Business 的高級營銷總監(jiān) Jean-Marie Brunet 擔(dān)任主持人,主持了一場出席人數(shù)眾多且熱鬧非凡的 DVCon 美國小組討論,討論人工智能 (AI) 和機器學(xué)習(xí) (ML) 的熱門話題。
長達(dá)一小時的會議由 Achronix 副總裁兼首席技術(shù)專家 Raymond Nijssen 主持。Arm 研究員兼技術(shù)總監(jiān) Rob Aitken;AMD 高級研究員 Alex Starr;Mythic 硬件工程副總裁 Ty Garibay;英偉達(dá)應(yīng)用深度學(xué)習(xí)研究主管 Saad Godil。
以下是基于小組成績單的四部分迷你系列的第 1 部分。它涵蓋了 Brunet 關(guān)于人工智能如何重塑半導(dǎo)體行業(yè)的第一個問題——特別是芯片設(shè)計驗證和小組成員的印象。
第 2 部分涉及 AI 芯片的設(shè)計和驗證,而第 3 和第 4 部分包括觀眾成員的問題和小組成員的回答。
Raymond Nijssen:如果你看看正在發(fā)生的變化,我們會看到 FPGA 行業(yè)發(fā)生了巨大的轉(zhuǎn)變。我們來自傳統(tǒng)應(yīng)用程序,在這些應(yīng)用程序中,您會看到 DSP 應(yīng)用程序通過嵌入在 FPGA 中的 DSP 處理器向架構(gòu)轉(zhuǎn)變,在數(shù)據(jù)移動和計算性質(zhì)方面更適合機器學(xué)習(xí)應(yīng)用程序。這些計算的根源相當(dāng)簡單。所有這些算法之間有一個共同點,它基本上由許多以各種巧妙方式實現(xiàn)的乘法組成。當(dāng)然,有很多方法可以對問題進行切片和切塊。歸根結(jié)底,從概念的角度來看,它是一個相當(dāng)簡單的芯片,然后你重復(fù)了很多很多很多次。
復(fù)雜性并非來自芯片的多樣性或異質(zhì)性。這些芯片往往是同質(zhì)的,重點是數(shù)據(jù)移動和基本算術(shù)。從這個意義上說,從傳統(tǒng)設(shè)計驗證的角度驗證這些芯片與您所知道和已經(jīng)做過的并沒有什么不同。系統(tǒng)的性能驗證要復(fù)雜得多,因為系統(tǒng)中有太多的軟件。
所有的軟件棧都是碎片化的,不同的人解決同一個問題有不同的方式,這就導(dǎo)致了完全不同的解決方案。你可能會發(fā)現(xiàn)你在一個芯片中放置了大量的乘法器來實現(xiàn)高 TOPS 率。你發(fā)現(xiàn)你不能讓他們忙,因為你的內(nèi)存子系統(tǒng)的某個地方或者數(shù)據(jù)訪問的方式有一些瓶頸,特別是如果你有稀疏的矩陣。這會很復(fù)雜。最后,AI芯片驗證可能比驗證處理器更復(fù)雜。
Rob Aitken:我認(rèn)為這很像驗證處理器,因為機器學(xué)習(xí)單元本身正在執(zhí)行處理。它不是 GPU。它不是 CPU;但它作為程序的一部分進行了大量的乘法和加法。我認(rèn)為有趣的驗證問題正如有人描述的那樣——這些處理單元如何相互交互以及系統(tǒng)在做什么。
您可以看到,當(dāng)您構(gòu)建一個每瓦可實現(xiàn) 20 萬億 TOPS 的加速器時。但是你不知道如何將它連接到任何東西,因為你不知道數(shù)據(jù)是如何從系統(tǒng)內(nèi)存進入盒子的[以及]然后,當(dāng)它完成計算時,結(jié)果是如何報告回來的。
加速度如何適應(yīng)整個控制流程。正如雷蒙德所說,不僅要構(gòu)建解決問題的軟件,還要構(gòu)建硬件,這需要一個完整的練習(xí),以便您可以消除盡可能多的瓶頸。此外,這樣您就可以識別仍然存在的瓶頸并設(shè)計您的系統(tǒng),使其盡可能快地執(zhí)行。已經(jīng)完成了大量工作,但還有很多工作要做。
從機器學(xué)習(xí)驗證的角度來看,我認(rèn)為它通常是 EDA 問題的一個有趣的子集。如果你看看 EDA,在過去的 30 年里,人們建立了大量的啟發(fā)式算法,這些啟發(fā)式算法實際上非常好。
與許多其他問題不同,如果您只是將機器學(xué)習(xí)應(yīng)用到典型的 EDA 問題中,結(jié)果不一定會變得更好;您的解決方案實際上可能更糟。如果你回顧 1990 年代的前一波人工智能,那里有一大堆關(guān)于機器學(xué)習(xí)和你最喜歡的驗證方面和其他 EDA 問題的論文。他們中的大多數(shù)人都無處可去,因為計算能力并不真正存在,并且因為在深度神經(jīng)網(wǎng)絡(luò)與較淺的神經(jīng)網(wǎng)絡(luò)上學(xué)習(xí)的想法并沒有真正站穩(wěn)腳跟。
我們現(xiàn)在發(fā)現(xiàn),查看一些具體問題,您可以找到好的解決方案——例如,Arm 所做的一些工作著眼于選擇哪些測試向量或多或少有可能在驗證套件中增加價值。事實證明,這個問題相對容易表述為機器學(xué)習(xí)問題,特別是圖像識別問題。一組標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)可以計算出這組向量看起來很有希望,而那組看起來不太有希望,我們能夠在整體驗證吞吐量上獲得大約 2 倍的改進。除了顯而易見的解決方案之外,ML 在算法方面肯定有解決方案,我們現(xiàn)在都在以某種形式構(gòu)建 AI 芯片。
Alex Starr:我將從我們開發(fā)的復(fù)雜系統(tǒng)設(shè)計方面的基線開始。我們擁有常見的多芯片和多插槽產(chǎn)品,當(dāng)然對于 AMD 來說也是如此,因此我們已經(jīng)面臨規(guī)模挑戰(zhàn),你肯定會在 AI 方面看到這一挑戰(zhàn)。許多設(shè)計必須處理這個問題。從某種意義上說,我們已經(jīng)通過多種方式解決了這個問題,包括使用基于混合引擎的流程以及在驗證和仿真中更抽象的建模。
如前所述,當(dāng)我看到它時,這些設(shè)計中的計算引擎相對于我們今天在 GPU 和 CPU 中使用的一些現(xiàn)有計算引擎來說相當(dāng)簡單。從 IP 級別的角度來看,它可能相當(dāng)簡單。您如何應(yīng)對大型設(shè)計的縮放?這確實是一個軟件問題——整個系統(tǒng)的性能如何?
所有這些設(shè)計都將根據(jù)它們執(zhí)行這些機器學(xué)習(xí)算法的速度來衡量。那是硬件和軟件/固件問題。我認(rèn)為業(yè)界將不得不了解我們?nèi)绾蝺?yōu)化性能,而不僅僅是設(shè)計本身,而是整個生態(tài)系統(tǒng)。這就是我在 AMD 參與的事情。這是我的熱情之一,也是我們多年來一直致力于真正嘗試和改進整個系統(tǒng)生態(tài)系統(tǒng)并從中獲得性能的工作。我們必須解決巨大的性能優(yōu)化挑戰(zhàn)。關(guān)于“構(gòu)建復(fù)雜設(shè)計”方面的問題,我認(rèn)為,對我們來說,這主要是照常營業(yè),沒有真正的人工智能特定。
從“我如何在驗證過程中使用 AI”這個問題來看,我認(rèn)為這是一個很大的擴展領(lǐng)域。今天,我們可以在混合系統(tǒng)上運行大型設(shè)計并處理大量數(shù)據(jù)。我們?nèi)绾翁幚磉@些數(shù)據(jù)?從歷史上看,我們一直在查看波形以獲得微觀細(xì)節(jié),但這些是運行多個軟件堆棧的大型生態(tài)系統(tǒng)。如何調(diào)試我的軟件?當(dāng)我想優(yōu)化那個系統(tǒng)時,我應(yīng)該把我的工程師放在哪里?獲得高可見性是關(guān)鍵,人工智能可以在如何分析我們從系統(tǒng)中獲取的數(shù)據(jù)方面發(fā)揮作用,并在我們的方法中更有針對性。
Ty Garibay:在我們的芯片上工作的設(shè)計團隊和驗證團隊基本上實現(xiàn)了與人的生成對抗網(wǎng)絡(luò)。你有設(shè)計,你有高效的人試圖攻擊它,隨著設(shè)計人員修復(fù)它,讓它變得更好,并實際創(chuàng)建一個新芯片,設(shè)計會隨著時間的推移而發(fā)展。
挑戰(zhàn)在于這個芯片是獨一無二的,除非你在做衍生產(chǎn)品或下一代 x86 或類似的東西,否則沒有基準(zhǔn)數(shù)據(jù)或從芯片到芯片的基準(zhǔn)數(shù)據(jù)的可見性有限。在當(dāng)前的環(huán)境中,我們正在構(gòu)建機器學(xué)習(xí)芯片,就像我們在狂野西部一樣,每個人都選擇按照自己的方式做事,聲稱自己有一種特殊的醬汁。很難看出我們在哪里可以像 Arm 那樣捕獲大量信息,但他們能夠從用于構(gòu)建 Arm 核心的 Arm 測試流中捕獲信息。
這類似于 Breker Systems 的一個名為 Trek 的系統(tǒng),該系統(tǒng)可以生成內(nèi)存系統(tǒng)目標(biāo)測試。該工具以自己的方式學(xué)習(xí),盡管它是一種有限的學(xué)習(xí)工具。隨著我們對第二代產(chǎn)品的深入研究,顯然有機會。我們了解我們正在尋找什么來使用我們收集的數(shù)據(jù)并利用這些數(shù)據(jù)來提高驗證效率。
Saad Godil:我同意我的同事們所說的很多內(nèi)容。我將在構(gòu)建 AI 芯片時再考慮一個問題。人工智能領(lǐng)域正在快速變化,這將對驗證團隊構(gòu)成有趣的挑戰(zhàn)。今天,我們必須構(gòu)建能夠快速適應(yīng)不斷變化的規(guī)范的驗證環(huán)境。這將變得更加重要。
讓我用一個例子來說明這個概念。我的同事每周都有一個論文閱讀小組。他們每周閱讀不同的人工智能論文。有一個星期,有人說,“讓我們回去讀一篇經(jīng)久不衰的經(jīng)典論文?!?那篇論文發(fā)表于 2017 年,在該領(lǐng)域已經(jīng)過時了!
構(gòu)建芯片需要時間,這意味著您將面對一個移動的目標(biāo)。你應(yīng)該構(gòu)建驗證環(huán)境,讓你在短時間內(nèi)做出反應(yīng),這將為你提供這些 AI 芯片的競爭優(yōu)勢。
在構(gòu)建 AI 芯片的話題上,總的來說,業(yè)界一直在設(shè)計已經(jīng)處理規(guī)?;男酒?。從這個角度來看,我認(rèn)為它不是獨一無二的。我確實認(rèn)為這是這種環(huán)境的屬性,我希望我們能讓更多的人在這個領(lǐng)域工作。我期待人們在這個領(lǐng)域提出一些很酷的解決方案,但我不認(rèn)為有任何獨特之處僅限于人工智能。
另一個問題是,人工智能將如何影響驗證?對此,我很看好。很多人都說人工智能是新的電力,將會有很多行業(yè)受到它的影響。我絕對相信我們的設(shè)計行業(yè)將是其中之一。看看我們擁有的數(shù)據(jù)量,我們所做工作的復(fù)雜性。我們會發(fā)現(xiàn)很多不同的應(yīng)用程序,我們可以利用人工智能的力量來改進我們的流程并更快地構(gòu)建芯片,這很有意義。
在這個由四部分組成的迷你系列的第 2 部分中,小組成員將討論工具供應(yīng)商是否準(zhǔn)備好提供他們在特定領(lǐng)域驗證其芯片所需的東西,以及工具供應(yīng)商是否準(zhǔn)備好提供幫助。
審核編輯 黃昊宇
-
芯片
+關(guān)注
關(guān)注
455文章
50818瀏覽量
423717 -
amd
+關(guān)注
關(guān)注
25文章
5468瀏覽量
134173 -
半導(dǎo)體
+關(guān)注
關(guān)注
334文章
27367瀏覽量
218822 -
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238534 -
Achronix
+關(guān)注
關(guān)注
1文章
76瀏覽量
22544
發(fā)布評論請先 登錄
相關(guān)推薦
評論