什么是自恢復(fù)設(shè)計(jì)
在芯片設(shè)計(jì)過程中,通常會(huì)針對特殊情況導(dǎo)致芯片無法使用額外添加一些功能,使得芯片具有更好的抗干擾能力。自恢復(fù)設(shè)計(jì)應(yīng)用場景很廣泛,比如、針對芯片溫度過高的處理、針對殘缺數(shù)據(jù)包的處理、針對長時(shí)間無數(shù)據(jù)響應(yīng)的處理、針對各類錯(cuò)誤的處理。
1、高溫保護(hù)設(shè)計(jì)
幾乎每一顆芯片都溫度監(jiān)控模塊,大型芯片甚至有多個(gè)溫度監(jiān)控模塊。以電腦主板為例,在CPU或者顯卡溫度升高時(shí),散熱風(fēng)扇的轉(zhuǎn)速會(huì)隨之增加,一旦芯片溫度過高,會(huì)觸發(fā)關(guān)機(jī)保護(hù)機(jī)制。這種設(shè)計(jì)僅僅是常見的被動(dòng)式自恢復(fù),而不是芯片自己主動(dòng)觸發(fā)。芯片主動(dòng)自恢復(fù)設(shè)計(jì)原理如下:芯片會(huì)主動(dòng)監(jiān)控溫度值,當(dāng)溫度值進(jìn)入高溫區(qū)域時(shí),會(huì)進(jìn)行主動(dòng)告警,比如發(fā)出溫度中斷,從而告知管理軟件等。當(dāng)溫度值進(jìn)入超高溫區(qū)域,可能會(huì)導(dǎo)致芯片燒毀的風(fēng)險(xiǎn)時(shí),會(huì)主動(dòng)進(jìn)行芯片降頻或者復(fù)位等操作。降頻操作是將時(shí)鐘頻率降低,從而降低功耗。
此設(shè)計(jì)在GPU中比較常見。復(fù)位操作是芯片自動(dòng)產(chǎn)生邏輯復(fù)位,關(guān)閉部分或者全部功能,有效降低功耗,從而達(dá)到降低溫度的目的。
2、讀數(shù)據(jù)返回超時(shí)保護(hù)
主機(jī)讀芯片內(nèi)部寄存器時(shí),有時(shí)會(huì)出現(xiàn)長時(shí)間沒有返回的情況,而AXI等讀寫總線必須要有返回?cái)?shù)據(jù),否則會(huì)一直卡住。針對此類情況,需要讀模塊產(chǎn)生讀返回信號與響應(yīng)信號。比如返回32’hdeaddead數(shù)據(jù),并且給響應(yīng)信號rresp賦值相應(yīng)的錯(cuò)誤值。例如PCIe作為Endpoint時(shí),收到host主機(jī)的memrd讀請求時(shí),并且將請求通過接口轉(zhuǎn)發(fā)給內(nèi)部總線,如果長時(shí)間沒有收到讀數(shù)據(jù)rdata,則需要進(jìn)行主動(dòng)超時(shí),自行返回rdata給主機(jī),防止host主機(jī)因收不到rdata而卡住。
3、交互接口超時(shí)響應(yīng)保護(hù)
各類芯片的低速接口通常是握手交互處理機(jī)制,在沒有保護(hù)機(jī)制的情況下,如果slave端口因?yàn)槟承┰蚩ㄗ。瑹o法正確響應(yīng)時(shí),master端口也會(huì)被卡住。添加交互接口超時(shí)響應(yīng)保護(hù)邏輯,如果slave接口超時(shí)沒有響應(yīng),master接口不應(yīng)該被卡住,而應(yīng)該能夠恢復(fù)到初始狀態(tài),能夠發(fā)起下一次請求。特別是一個(gè)master對應(yīng)多個(gè)slave時(shí),master的自恢復(fù)尤為重要。
4、殘缺數(shù)據(jù)過濾
像MAC、PCS等模塊處理數(shù)據(jù)時(shí),完成的數(shù)據(jù)包有包頭和包尾,完整的數(shù)據(jù)包才能進(jìn)行正常的處理,而缺乏包頭或者包尾的殘缺包則會(huì)導(dǎo)致各類錯(cuò)誤,因此需要在模塊入口處理對殘缺包進(jìn)行過濾,選擇補(bǔ)齊或者直接拋棄不完整的數(shù)據(jù)包,保證模塊入口數(shù)據(jù)的完整性。
5、模塊卡死自恢復(fù)
芯片內(nèi)部重要模塊發(fā)生錯(cuò)誤(配置流程不合理等原因)會(huì)導(dǎo)致模塊或者整個(gè)芯片卡死,那么必須要添加自恢復(fù)設(shè)計(jì)。例如鏈表指針錯(cuò)亂,接口復(fù)位長期沒有釋放,此種情況下,盡量保證模塊能夠自行恢復(fù),能夠跳轉(zhuǎn)到初始狀態(tài),如觸發(fā)自動(dòng)初始化。
總結(jié)
芯片的考核指標(biāo)不僅僅是性能達(dá)標(biāo),功能正常,可靠性同樣重要。自恢復(fù)設(shè)計(jì)能夠增強(qiáng)芯片的可靠性,保證芯片一些極端場景中依舊可以長期運(yùn)行,是產(chǎn)品的加分項(xiàng)。一顆高品質(zhì)的芯片肯定實(shí)現(xiàn)了各種自恢復(fù)設(shè)計(jì)。
審核編輯:湯梓紅
-
芯片
+關(guān)注
關(guān)注
456文章
51072瀏覽量
425843 -
cpu
+關(guān)注
關(guān)注
68文章
10898瀏覽量
212528 -
IC設(shè)計(jì)
+關(guān)注
關(guān)注
38文章
1298瀏覽量
104161 -
芯片設(shè)計(jì)
+關(guān)注
關(guān)注
15文章
1026瀏覽量
54951
原文標(biāo)題:IC設(shè)計(jì):5種常見的自恢復(fù)設(shè)計(jì)
文章出處:【微信號:處芯積律,微信公眾號:處芯積律】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論