這個問題在 AI 加速器中尤為嚴重,修復(fù)這個問題需要一些tradeoff。
據(jù)估計,一些最先進和最復(fù)雜的芯片設(shè)計中總功耗的 20% 到 40% 被浪費了。
glitch功耗并不是一個新現(xiàn)象。在先進節(jié)點上,glitch功耗問題正變得越來越突出,沒有一種解決方案適用于所有芯片或設(shè)計類型。
在組合電路中,時鐘控制不同狀態(tài)寄存器的傳播。但是,在柵極或?qū)Ь€中經(jīng)常存在延遲,因此輸入不會同時到達柵極。
假設(shè)你有一個 AND 或 OR 門,你所有的信號不會同時到達,所以需要有一個允許范圍內(nèi)的穩(wěn)定時間窗口。輸入越多,發(fā)生這種情況的概率就越大,浪費的glitch功耗就越多。
這種現(xiàn)象也被稱為hazards。hazards是電路中可能產(chǎn)生這種glitch的原因。根據(jù)邏輯的類型,如果存在非常寬的扇入邏輯,或者非常長深度的組合邏輯,那么這些glitch發(fā)生的可能性就更高。glitch是非常高頻率的東西,它們toggle,然后幾乎立即關(guān)閉,這種情況可能在任何地方發(fā)生多次。
AI 加速器中的glitch
對于 AI 加速器來說,這個問題尤其麻煩,因為 AI 加速器旨在以最小的功耗實現(xiàn)最大的性能。
在神經(jīng)網(wǎng)絡(luò)處理硬件中,有很多乘法累加計算。事實上,許多神經(jīng)網(wǎng)絡(luò)處理器的評級標準是每秒執(zhí)行數(shù)以百萬計的MAC,這是性能的衡量標準。但是,如果你看一下硬件乘法器和加法器的傳統(tǒng)設(shè)計,并且這些類型的電路串聯(lián)在一起,并采用流水線連接。發(fā)生的情況是,即使在單個時鐘周期內(nèi),也發(fā)生了很多這些信號轉(zhuǎn)換。由于不同電路的不同延遲,最終穩(wěn)定下來,得出最終結(jié)果。
由于電路的設(shè)計方式,這些神經(jīng)網(wǎng)絡(luò)處理器中的乘法器非常容易出現(xiàn)glitch功耗,并且需要多次轉(zhuǎn)換才能穩(wěn)定到最終結(jié)果。
glitch源識別和排序
整體效率
Glitch 也會影響設(shè)計的整體效率。當你切換某些東西時,它使用來自電壓源的能量,一直到引腳,但也使用存儲在網(wǎng)絡(luò)電容中的能量。因此,如果你像這樣打開和關(guān)閉,你就會不必要地充電和放電這些電容器。
由于 RC 延遲增加,先進工藝使情況變得更糟。在先進節(jié)點中,晶體管越來越小,延遲開始由RC部分主導(dǎo)。當進入越來越先進的節(jié)點時,這些小晶體管必須驅(qū)動這些大負載,信號延遲和變化的機會就越多。
如果在線路中存在hazards,就會增加發(fā)生glitch的可能性。由于兩個輸入信號的到達時間不同,因此出現(xiàn)了輸出glitch。
很多時候這個glitch的傳播實際上影響更大,對于芯片設(shè)計師來說,更令人擔(dān)憂的是它的下游影響,因為這種glitch不僅僅停留在那個信號上。這就是事情變得非常復(fù)雜的地方。很多時候它可以向下游傳播,因為組合邏輯是多級的。如今,數(shù)據(jù)路徑更深,時鐘頻率更快。數(shù)據(jù)路徑可以深達 15 或 20 級,該信號的glitch可以一直傳播,并導(dǎo)致它通過的每個柵極的功耗浪費。
過去,對glitch功耗的擔(dān)憂并不多,因為它在總動態(tài)功耗中占比不大。但是,我們開始在7nm左右看到的情況,組合邏輯路徑開始變得如此之深,以至于glitch功耗成為一個大問題。突然之間,在某些設(shè)計中,它占總動態(tài)功耗的 25% 到 40%。
審核編輯:黃飛
-
處理器
+關(guān)注
關(guān)注
68文章
19813瀏覽量
233623 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4809瀏覽量
102836 -
AI加速器
+關(guān)注
關(guān)注
1文章
70瀏覽量
9004
原文標題:glitch功耗的問題在先進節(jié)點上更加突出
文章出處:【微信號:數(shù)字芯片實驗室,微信公眾號:數(shù)字芯片實驗室】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
一文讀懂藍牙網(wǎng)狀網(wǎng)絡(luò)什么是“友鄰節(jié)點”與低功耗
如何減小unbuffered ADC sampling glitch?
如何在低功耗Bluetooth? PEPS系統(tǒng)中添加CAN節(jié)點
用于油管檢漏的WSNs節(jié)點低功耗設(shè)計
在40-nm工藝節(jié)點實現(xiàn)世界上最先進的定制邏輯器件

電機溫度監(jiān)測系統(tǒng)低功耗無線節(jié)點模塊設(shè)計

電機溫度監(jiān)測系統(tǒng)低功耗無線節(jié)點的模塊設(shè)計

詳細介紹一種顯著降低LoRa節(jié)點功耗的方法
先進工藝節(jié)點下的芯片設(shè)計需考慮更多變量
低功耗無線傳感器網(wǎng)絡(luò)節(jié)點設(shè)計與實現(xiàn)
5nm及更先進節(jié)點上FinFET的未來

5nm及更先進節(jié)點上FinFET的未來:使用工藝和電路仿真來預(yù)測
在低功耗 Bluetooth? PEPS 系統(tǒng)中添加 CAN 節(jié)點

評論