0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么數(shù)字芯片設(shè)計適合暴力堆機(jī)器?

sally100 ? 來源:數(shù)字ICer ? 2023-02-07 11:44 ? 次閱讀

芯片設(shè)計五部曲》:模擬IC、數(shù)字IC、存儲芯片、算法仿真和總結(jié)篇(排名不分先后

上一集我們已經(jīng)說了,模擬IC,更像是一種魔法。

我們深度解釋了這種魔法的本質(zhì),以及如何在模擬芯片設(shè)計的不同階段,根據(jù)常見的EDA工具特性和原理,從計算角度幫助模擬工程師更高效地完成吟唱施法。

芯片設(shè)計五部曲之一 | 聲光魔法師——模擬IC

第二集:數(shù)字IC

假如我們想要錄制一段聲音,模擬信號的做法是把所有的聲音信息用一段連續(xù)變化的電磁波或電壓信號原原本本地記錄下來。而按照一定的規(guī)則將其轉(zhuǎn)換為一串二進(jìn)制數(shù)0和1,然后用兩種狀態(tài)的信號來表示它們,這叫數(shù)字信號。

處理數(shù)字信號的芯片就是數(shù)字芯片,比如常見的CPU、GPU

6f0c9086-a49d-11ed-bfe3-dac502259ad0.png

當(dāng)聲音變大或變小了,模擬信號都會跟著變化,所以模擬信號有無數(shù)種狀態(tài)。狀態(tài)之間微妙的差異,需要人的經(jīng)驗判斷,有點玄學(xué)的成分。

而數(shù)字信號永遠(yuǎn)只有0和1兩種狀態(tài),信號的轉(zhuǎn)換嚴(yán)格遵循邏輯關(guān)系,一個輸出對應(yīng)唯一確定的結(jié)果,程序完全依照輸出指令執(zhí)行,這是科學(xué)。

數(shù)字IC設(shè)計工程師的設(shè)計目標(biāo):在PPA(Power、Performance、Area)三個指標(biāo)上追求完美的平衡。

怎么玩轉(zhuǎn)這門科學(xué)?

這,是一種藝術(shù)。

今天,我們就從資源需求、并行特征、數(shù)據(jù)敏感度等角度展開聊聊在數(shù)字芯片設(shè)計各階段,如何利用不同EDA工具的特點,讓數(shù)字芯片的設(shè)計研發(fā)效率獲得顯著提升。

和模擬芯片相呼應(yīng),這篇還是從計算角度出發(fā),至于調(diào)度/管理/數(shù)據(jù)/協(xié)同/CAD等視角,會在后面的文章里體現(xiàn)~(比如第三集

和模擬相比,數(shù)字芯片需要使用EDA工具的場景更多,IC工程師們對于計算機(jī)的使用天然比較親近。但就跟《解密一顆芯片設(shè)計的全生命周期算力需求》一樣,只負(fù)責(zé)某項工作的研發(fā)可能不關(guān)心,或者只了解自己的這部分,IT對業(yè)務(wù)所知有限,也不一定清楚。除非有大佬坐鎮(zhèn),大多數(shù)公司的日常大概是以拍腦袋經(jīng)驗論為主。

我們先來看一下大畫面,數(shù)字芯片設(shè)計全流程分析圖:

6f2955c2-a49d-11ed-bfe3-dac502259ad0.png

01

數(shù)字前端:前端設(shè)計/驗證

這一階段包含了規(guī)格制定、架構(gòu)設(shè)計、RTL編碼等步驟。 數(shù)字前端算法仿真和功能驗證場景有大量中小任務(wù)并行,這一階段,對于資源類型和用量通常無特殊需求。 不過需注意若大量使用現(xiàn)有IP通常沒有算法仿真這一步。而且每家公司業(yè)務(wù)不同,算法仿真需求量差異非常大(下一集主角就是ta)。

02

數(shù)字中端:邏輯綜合與DFT實現(xiàn)

這一階段可分為邏輯綜合、形式驗證、門級仿真、ATPG驗證等業(yè)務(wù)場景。 數(shù)字中端呈現(xiàn)單、多任務(wù)混合的特點,因為計算的輸入數(shù)據(jù)中包含門延遲信息,輸入數(shù)據(jù)變多,對內(nèi)存的需求相比前端有一定增長。ATPG驗證建議內(nèi)存優(yōu)化型,其他三種場景更加偏計算密集型。

03

數(shù)字后端:物理實現(xiàn)

這一階段包括布局布線、形式驗證、版圖驗證、寄生參數(shù)提取、后仿、ATPG驗證、靜態(tài)時序分析和IR分析等業(yè)務(wù)場景。 數(shù)字后端基本都是多任務(wù),由于包含版圖的寄生參數(shù),信息量非常大,普遍需要大內(nèi)存機(jī)器。其中,布局布線、后仿、靜態(tài)時序分析、IR分析的大任務(wù)數(shù)量非常多,對主頻也有要求,需要兼具高主頻和大內(nèi)存的資源。

資源需求

后端>中端>前端,數(shù)字后端·真·資源黑洞

把數(shù)字IC設(shè)計前、中、后端三大階段進(jìn)行資源需求對比。

7028ede8-a49d-11ed-bfe3-dac502259ad0.png

可以看到無論是任務(wù)運算時間、所需計算資源、存儲需求還是IP與輸入數(shù)據(jù)量級上,數(shù)字前中后端形成了非常明顯的階梯結(jié)構(gòu),整體資源需求呈現(xiàn)前端<中端<后端的趨勢。? 這是由三個階段的具體工作內(nèi)容決定的:

數(shù)字前端,用RTL代碼將芯片架構(gòu)師的設(shè)計寫出來,前端驗證也主要是針對RTL的功能進(jìn)行驗證,偏邏輯功能。

數(shù)字中端,需要將RTL代碼綜合成網(wǎng)表并規(guī)劃、插入各種用于芯片測試的邏輯電路,需要加入Foundry廠提供的標(biāo)準(zhǔn)單元庫的工藝參數(shù),驗證也到了邏輯門這一級。

數(shù)字后端負(fù)責(zé)芯片的物理實現(xiàn),先將電路網(wǎng)表通過自動布局布線畫成版圖,再進(jìn)行寄生參數(shù)提取,創(chuàng)建一個可以精確模擬數(shù)字電路響應(yīng)的模型,這一階段會加入版圖的寄生參數(shù)。

從代碼到邏輯門電路再到物理層,隨著階段的演進(jìn),信息量逐級遞增,計算時所需消耗的資源量也隨之增加。

而在28nm以及更先進(jìn)制程下,包含的工藝參數(shù)更多,電路更復(fù)雜,前中后端每一階段的信息量級還會被進(jìn)一步放大。

703c7840-a49d-11ed-bfe3-dac502259ad0.jpg

哪怕前端RTL基本一致,中端和后端因為Foundry廠工藝參數(shù)更多更復(fù)雜,同樣的代碼計算量也是更大的。

換個思路,我們舉個栗子。

通過一個在數(shù)字前中后端都會出場的EDA工具來看看三大階段的資源需求。

VCS的主要作用是將Verilog HDL(一種硬件描述語言)轉(zhuǎn)成C語言,編譯出來并執(zhí)行。作為一個翻譯官,ta的工作量取決于雙方對話的頻率,以及需要翻譯的文本量。

VCS在前端的功能驗證、中端的門級仿真、后端仿真中都有出場,在不同階段對任務(wù)資源的需求完全不同:

704d6a42-a49d-11ed-bfe3-dac502259ad0.png

從前端到中端再到后端,雖然VCS的工作性質(zhì)沒變,但整體來說,消耗的資源越來越多了。

綜上,數(shù)字后端設(shè)計與驗證環(huán)節(jié)相比中端和前端資源需求更高、運算時間更長、數(shù)據(jù)量更大,往往會占據(jù)整個項目周期資源需求量的50%以上。

下圖是我們某客戶全生命周期月度算力實際用量曲線,可以看到后端的波峰相當(dāng)明顯,詳情戳:解密一顆芯片設(shè)計的全生命周期算力需求

70603780-a49d-11ed-bfe3-dac502259ad0.png

這也就意味著,數(shù)字后端對IC設(shè)計公司的壓力相當(dāng)大,能否在這一階段獲取充足的資源,是提升研發(fā)效率、保障項目進(jìn)度的關(guān)鍵。

典型并行場景

靜態(tài)時序驗證&版圖驗證

并行度是我們評估任務(wù)能否通過分布式計算完成,提升效率的標(biāo)準(zhǔn)之一。 這里涉及到兩個重要的判斷標(biāo)準(zhǔn):可拆分,互不干擾??刹鸱种傅氖牵笕蝿?wù)可以分解為小任務(wù),原任務(wù)目標(biāo)不變。

互不干擾指的是,拆分為小任務(wù)之后,任務(wù)之間互相不干擾,可以不同步。

從前端到中端再到后端,任務(wù)數(shù)量越來越多。

任務(wù)的并行度決定了速度提升的空間。

靜態(tài)時序驗證:最常見且并行度較高

靜態(tài)時序驗證是最常見的設(shè)計場景之一,基本原理是檢查各信號通路上經(jīng)過的門電路,然后累加門延遲,求取整個路徑的信號延遲。

沿信號通路求Delay Time的過程,就是沿信號通路不停做簡單加法。

在靜態(tài)時序驗證過程中,有一個PVT的概念。

我們需要驗證邏輯門在不同的工藝(Process)、電壓(Voltage)、溫度(Temperature)條件下的延遲。

首先,列出可能的條件,如:

工藝:TT、FF、SS……

電壓:0.9V、1.0V、1.1V……

溫度:-40°C、0°C、25°C……

隨后,窮舉每一種可能性,如:

PVT1=TT、0.9V、-40°C

PVT2=TT、1.0V、25°C

PVT3=TT、1.0V、0°C

……

最后,驗證邏輯門在每一種PVT條件下的延遲:

7097abc0-a49d-11ed-bfe3-dac502259ad0.png

數(shù)字芯片中有著無數(shù)這樣的邏輯門,每一個PVT下,邏輯門都有對應(yīng)的Delay Time,而P、V、T之間可以有很多種組合,就會有很多個Delay Time的情況需要驗證。

這一場景,天然適合暴力堆機(jī)器。

版圖驗證:最高并行度

模擬芯片和數(shù)字芯片,這一場景的原理一模一樣,使用的EDA工具也完全相同。

版圖驗證屬于檢查類任務(wù),以模塊為單位,本質(zhì)上是數(shù)據(jù)對比工作,重內(nèi)存需求,子任務(wù)間沒有數(shù)據(jù)關(guān)聯(lián),是數(shù)字芯片設(shè)計與驗證中并行度最高的場景。

這一階段很適合利用云上的內(nèi)存優(yōu)化型資源,使用“小F影分身術(shù)”(版圖分割術(shù)),通過暴力堆資源的方式快速完成任務(wù)。

70cb9f5c-a49d-11ed-bfe3-dac502259ad0.jpg

關(guān)于版圖驗證,我們在《芯片設(shè)計五部曲之一 | 聲光魔法師——模擬IC》中有更詳細(xì)的說明。

數(shù)據(jù)敏感度

前端>中端>后端,但是不用擔(dān)心

我們按照數(shù)據(jù)敏感度從高到低的順序給各類設(shè)計數(shù)據(jù)排了個序:RTL數(shù)據(jù) > IP、PDK和版圖> Netlist、Session、過程波形、歸檔數(shù)據(jù)和Report

好了,接下來我們看看這些數(shù)據(jù)都會出現(xiàn)在哪些階段:

70dddffa-a49d-11ed-bfe3-dac502259ad0.png

數(shù)字前端有大量RTL代碼,甚至部分公司在此過程中還自己開發(fā)了IP,屬于數(shù)據(jù)安全等級最高的那一撥。許多公司都會嚴(yán)格管理這部分?jǐn)?shù)據(jù),設(shè)置一定的保密等級,甚至固定放在某幾臺機(jī)器上。

中端則涉及到部分的RTL代碼、IP和PDK數(shù)據(jù),以及一些Netlist、Session和Report。

后端徹底告別了代碼,以IP、PDK、版圖和數(shù)據(jù)敏感度較低的數(shù)據(jù)為主。

如果你要做一款游戲,前端相當(dāng)于游戲的源代碼,中端是詳細(xì)的角色形象設(shè)計稿,后端就是玩家拿到手的游戲光碟了。

710e61fc-a49d-11ed-bfe3-dac502259ad0.jpg

前端泄密,恭喜你的對手達(dá)成“代碼級抄襲”;

中端泄密,別人能照著樣子把仿品做出來,但沒有源代碼參考,知其然不知其所以然;

后端泄密,等對方逆向明白,大半年時間也過去了,你的下一代產(chǎn)品已經(jīng)在路上了。

值得一提的是,如果使用的是先進(jìn)工藝,F(xiàn)oundry廠也會對IP/PDK數(shù)據(jù)有保密要求。

所以在選擇云上業(yè)務(wù)場景的時候,我們一般優(yōu)先推薦數(shù)字后端先來。當(dāng)然,會根據(jù)每家公司的實際情況進(jìn)行具體分析。(以后會寫到,這次一定

那么,前端或者中端是不是就適合用云了呢?

甚至,在某些情況下,IC設(shè)計公司會面臨全部數(shù)據(jù)無論敏感度高低必須存放在本地的情況,比如一些高保密項目(軍工項目或國家重點項目),或者有點微妙的競爭關(guān)系,怎么辦?

我們有針對性的存算分離解決方案,歡迎來對號入座。

存算分離解決方案到底是什么?我們是如何實現(xiàn)的?掃描文末二維碼關(guān)注小F,對暗號“存算分離”搶先了解~

這里還有燧原科技的一手體驗,戳此先睹為快:【案例】燧原科技:芯片設(shè)計“存算分離”混合云實踐

關(guān)于數(shù)字IC設(shè)計,從不同設(shè)計階段的計算任務(wù)視角出發(fā),我們總結(jié)了四點:

1、與模擬芯片相似,數(shù)字芯片三大階段的資源需求同樣呈現(xiàn)前期<中期<后期的趨勢,但數(shù)字芯片需要使用EDA工具的場景更多,整體資源需求更大;2、版圖驗證并行度最高,靜態(tài)時序驗證出場率非常高且并行度很高,都適合用暴力堆機(jī)器的方式提高任務(wù)效率;?3、數(shù)字后端往往會占據(jù)整個項目周期資源需求量的50%以上,兼具資源需求高、計算時間長、數(shù)據(jù)量級大,數(shù)據(jù)敏感度相對低的特征,是提升數(shù)字芯片整體研發(fā)效率的關(guān)鍵;?4、數(shù)據(jù)敏感度高?必須放本地?沒關(guān)系,我們有解決辦法。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模擬IC
    +關(guān)注

    關(guān)注

    8

    文章

    172

    瀏覽量

    29405
  • 數(shù)字IC
    +關(guān)注

    關(guān)注

    1

    文章

    38

    瀏覽量

    12598
  • 數(shù)字芯片
    +關(guān)注

    關(guān)注

    1

    文章

    110

    瀏覽量

    18427

原文標(biāo)題:為什么數(shù)字芯片設(shè)計適合暴力堆機(jī)器?我來給你掰掰明白

文章出處:【微信號:數(shù)字ICer,微信公眾號:數(shù)字ICer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    分享orcad暴力卸載和解決啟動很慢的問題

    分享orcad暴力卸載和解決啟動很慢的問題
    發(fā)表于 07-16 14:04

    LabView密碼破解器暴力模式小程序

    LabView密碼破解器暴力模式小程序,得重新去下載破解密碼的字典
    發(fā)表于 12-18 10:33

    請問怎么運用stm32寫防暴力拆卸破壞

    怎么運用stm32寫防暴力拆卸破壞
    發(fā)表于 08-29 11:59

    何為暴力破解呢

    ps:代碼復(fù)制黏貼即可,有什么問題下方留言,博主會及時回復(fù) !工具:1:筆記本2:USB無線網(wǎng)卡(必備)3:kali系統(tǒng)4:靠譜字典暴力破解法:何為暴力破解呢,其實就是一個一個密碼試,直到正確的密碼
    發(fā)表于 07-15 09:46

    整流,什么是整流

    整流,什么是整流的檢測 1. 全橋的檢測 大多數(shù)的整流全橋上,均標(biāo)注有“+”、“-”、“~”符號(其中“+”為整流后輸出電壓
    發(fā)表于 02-27 10:46 ?2156次閱讀

    AI的暴力檢測是什么?還存在什么問題?

    暴力檢測”成為了當(dāng)下的一個熱門。在人群中實時檢測“暴力行為”成為了現(xiàn)實,如果你想打架,最好先看看AI同不同意。
    的頭像 發(fā)表于 06-20 14:47 ?5058次閱讀

    FPGA是什么?數(shù)字芯片之母

    當(dāng)FPGA 80年代出現(xiàn)后,很快就變成了各家數(shù)字芯片公司開發(fā)的必需品,沒有FPGA之前,數(shù)字芯片開發(fā)出來只能直接在晶圓廠投片,如果設(shè)計時存在一些問題和隱患(這個在
    的頭像 發(fā)表于 08-21 14:51 ?1.2w次閱讀

    如何選擇適合自己的語音機(jī)器

    究其根本原因,則是企業(yè)在語音機(jī)器人的選擇上有些缺漏,那么,如何選擇適合自己公司的語音機(jī)器人呢,看價格?比品牌?論技術(shù)?
    的頭像 發(fā)表于 11-12 10:13 ?2189次閱讀

    順豐公布暴力分揀識別方法專利

    快遞暴力分揀之所以屢禁不止,究其原因還是監(jiān)督、管理不到位。順豐日前公布了一項“暴力分揀識別方法”相關(guān)專利,試圖從技術(shù)上提高暴力分揀識別的準(zhǔn)確率。
    的頭像 發(fā)表于 01-21 11:31 ?2350次閱讀
    順豐公布<b class='flag-5'>暴力</b>分揀識別方法專利

    什么是內(nèi)存?內(nèi)存是如何分配的?

    在一般的編譯系統(tǒng)中,內(nèi)存的分配方向和棧內(nèi)存是相反的。當(dāng)棧內(nèi)存從高地址向低地址增長的時候,內(nèi)存從低地址向高地址分配。
    的頭像 發(fā)表于 07-05 17:58 ?1w次閱讀

    基于機(jī)器視覺技術(shù)的料三維體積測量

    可以在固定料周圍安裝多個激光測距掃描儀,通過采集料各個面的局部高程信息,再結(jié)合掃描儀的安裝位置進(jìn)行料的整體三維估計建模,最終預(yù)估出料坑體積。
    發(fā)表于 11-09 20:58 ?2209次閱讀

    亞馬遜告訴機(jī)器人如何裝貨物

    亞馬遜倉庫在收到一批新貨庫存時,顯然要做的事可能就是召喚一個移動機(jī)器人,用它充足的貨架裝所有物品。這樣,有人訂購一件物品時,剛剛裝貨的移動機(jī)器人就會出現(xiàn),人們可以從貨架上取出相應(yīng)物品。然而,如果
    的頭像 發(fā)表于 05-22 15:23 ?1057次閱讀
    亞馬遜告訴<b class='flag-5'>機(jī)器</b>人如何<b class='flag-5'>堆</b>裝貨物

    暴力猴瀏覽器插件

    暴力猴瀏覽器插件
    發(fā)表于 05-29 11:20 ?6次下載

    Calibre加冕暴力機(jī)器之王!秘密都在這個平臺

    版圖文件很大,需要處理的數(shù)據(jù)量非常大,但本身的邏輯判斷并不復(fù)雜,所以通常不剛需高主頻機(jī)型,但要求多核、大內(nèi)存的機(jī)器。CPU與內(nèi)存的比例通常能達(dá)到1:4或1:8,極端情況下這個比例會更高,2T或4T的超大型內(nèi)存機(jī)器都有可能登場。
    的頭像 發(fā)表于 07-06 11:26 ?623次閱讀
    Calibre加冕<b class='flag-5'>暴力</b><b class='flag-5'>堆</b><b class='flag-5'>機(jī)器</b>之王!秘密都在這個平臺

    實戰(zhàn)演練:Calibre如何成為暴力機(jī)器之王

    版圖文件很大,需要處理的數(shù)據(jù)量非常大,但本身的邏輯判斷并不復(fù)雜,所以通常不剛需高主頻機(jī)型,但要求多核、大內(nèi)存的機(jī)器。CPU與內(nèi)存的比例通常能達(dá)到1:4或1:8,極端情況下這個比例會更高,2T或4T的超大型內(nèi)存機(jī)器都有可能登場。
    的頭像 發(fā)表于 07-17 15:25 ?760次閱讀
    實戰(zhàn)演練:Calibre如何成為<b class='flag-5'>暴力</b><b class='flag-5'>堆</b><b class='flag-5'>機(jī)器</b>之王