這個(gè)問(wèn)題在 AI 加速器中尤為嚴(yán)重,修復(fù)這個(gè)問(wèn)題需要一些tradeoff。
據(jù)估計(jì),一些最先進(jìn)和最復(fù)雜的芯片設(shè)計(jì)中總功耗的 20% 到 40% 被浪費(fèi)了。
glitch功耗并不是一個(gè)新現(xiàn)象。在先進(jìn)節(jié)點(diǎn)上,glitch功耗問(wèn)題正變得越來(lái)越突出,沒(méi)有一種解決方案適用于所有芯片或設(shè)計(jì)類(lèi)型。
在組合電路中,時(shí)鐘控制不同狀態(tài)寄存器的傳播。但是,在柵極或?qū)Ь€(xiàn)中經(jīng)常存在延遲,因此輸入不會(huì)同時(shí)到達(dá)柵極。
假設(shè)你有一個(gè) AND 或 OR 門(mén),你所有的信號(hào)不會(huì)同時(shí)到達(dá),所以需要有一個(gè)允許范圍內(nèi)的穩(wěn)定時(shí)間窗口。輸入越多,發(fā)生這種情況的概率就越大,浪費(fèi)的glitch功耗就越多。
這種現(xiàn)象也被稱(chēng)為hazards。hazards是電路中可能產(chǎn)生這種glitch的原因。根據(jù)邏輯的類(lèi)型,如果存在非常寬的扇入邏輯,或者非常長(zhǎng)深度的組合邏輯,那么這些glitch發(fā)生的可能性就更高。glitch是非常高頻率的東西,它們toggle,然后幾乎立即關(guān)閉,這種情況可能在任何地方發(fā)生多次。
AI 加速器中的glitch
對(duì)于 AI 加速器來(lái)說(shuō),這個(gè)問(wèn)題尤其麻煩,因?yàn)?AI 加速器旨在以最小的功耗實(shí)現(xiàn)最大的性能。
在神經(jīng)網(wǎng)絡(luò)處理硬件中,有很多乘法累加計(jì)算。事實(shí)上,許多神經(jīng)網(wǎng)絡(luò)處理器的評(píng)級(jí)標(biāo)準(zhǔn)是每秒執(zhí)行數(shù)以百萬(wàn)計(jì)的MAC,這是性能的衡量標(biāo)準(zhǔn)。但是,如果你看一下硬件乘法器和加法器的傳統(tǒng)設(shè)計(jì),并且這些類(lèi)型的電路串聯(lián)在一起,并采用流水線(xiàn)連接。發(fā)生的情況是,即使在單個(gè)時(shí)鐘周期內(nèi),也發(fā)生了很多這些信號(hào)轉(zhuǎn)換。由于不同電路的不同延遲,最終穩(wěn)定下來(lái),得出最終結(jié)果。
由于電路的設(shè)計(jì)方式,這些神經(jīng)網(wǎng)絡(luò)處理器中的乘法器非常容易出現(xiàn)glitch功耗,并且需要多次轉(zhuǎn)換才能穩(wěn)定到最終結(jié)果。
glitch源識(shí)別和排序
整體效率
Glitch 也會(huì)影響設(shè)計(jì)的整體效率。當(dāng)你切換某些東西時(shí),它使用來(lái)自電壓源的能量,一直到引腳,但也使用存儲(chǔ)在網(wǎng)絡(luò)電容中的能量。因此,如果你像這樣打開(kāi)和關(guān)閉,你就會(huì)不必要地充電和放電這些電容器。
由于 RC 延遲增加,先進(jìn)工藝使情況變得更糟。在先進(jìn)節(jié)點(diǎn)中,晶體管越來(lái)越小,延遲開(kāi)始由RC部分主導(dǎo)。當(dāng)進(jìn)入越來(lái)越先進(jìn)的節(jié)點(diǎn)時(shí),這些小晶體管必須驅(qū)動(dòng)這些大負(fù)載,信號(hào)延遲和變化的機(jī)會(huì)就越多。
如果在線(xiàn)路中存在hazards,就會(huì)增加發(fā)生glitch的可能性。由于兩個(gè)輸入信號(hào)的到達(dá)時(shí)間不同,因此出現(xiàn)了輸出glitch。
很多時(shí)候這個(gè)glitch的傳播實(shí)際上影響更大,對(duì)于芯片設(shè)計(jì)師來(lái)說(shuō),更令人擔(dān)憂(yōu)的是它的下游影響,因?yàn)檫@種glitch不僅僅停留在那個(gè)信號(hào)上。這就是事情變得非常復(fù)雜的地方。很多時(shí)候它可以向下游傳播,因?yàn)榻M合邏輯是多級(jí)的。如今,數(shù)據(jù)路徑更深,時(shí)鐘頻率更快。數(shù)據(jù)路徑可以深達(dá) 15 或 20 級(jí),該信號(hào)的glitch可以一直傳播,并導(dǎo)致它通過(guò)的每個(gè)柵極的功耗浪費(fèi)。
過(guò)去,對(duì)glitch功耗的擔(dān)憂(yōu)并不多,因?yàn)樗诳倓?dòng)態(tài)功耗中占比不大。但是,我們開(kāi)始在7nm左右看到的情況,組合邏輯路徑開(kāi)始變得如此之深,以至于glitch功耗成為一個(gè)大問(wèn)題。突然之間,在某些設(shè)計(jì)中,它占總動(dòng)態(tài)功耗的 25% 到 40%。
審核編輯:黃飛
-
處理器
+關(guān)注
關(guān)注
68文章
19372瀏覽量
230434 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4776瀏覽量
100938 -
AI加速器
+關(guān)注
關(guān)注
1文章
69瀏覽量
8657
原文標(biāo)題:glitch功耗的問(wèn)題在先進(jìn)節(jié)點(diǎn)上更加突出
文章出處:【微信號(hào):數(shù)字芯片實(shí)驗(yàn)室,微信公眾號(hào):數(shù)字芯片實(shí)驗(yàn)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論