衛(wèi)星中的高性能計算需要在以前是抗輻射鑄造廠生產(chǎn)的零件領(lǐng)域的環(huán)境中使用先進的商用現(xiàn)貨 (COTS) 技術(shù)。這種環(huán)境的挑戰(zhàn)要求仔細實施硬件和軟件技術(shù),以生產(chǎn)具有作戰(zhàn)人員所需的先進能力和操作可靠性的空間資產(chǎn)。
太空是一個很難做生意的地方。雖然被困在范艾倫帶中的帶電粒子可以為地球上的觀察者產(chǎn)生耀眼的極光效果,但由于自然輻射環(huán)境引起的退化可能是決定商業(yè)和軍事任務(wù)所用設(shè)備使用壽命的關(guān)鍵因素。不幸的是,在太空惡劣的輻射環(huán)境中,對穩(wěn)健技術(shù)的需求往往與對性能的需求相沖突。新技術(shù)可以為巨大的成功和巨大的失敗提供機會。如果設(shè)備中的新功能沒有得到很好的理解,或者設(shè)計工具的自動功能使粗心的人陷入困境,那么最后一點尤其正確。
一般來說,輻射效應(yīng)可分為兩大類。由總電離劑量(TID)引起的磨損在任務(wù)過程中逐漸發(fā)生,因為零件反復(fù)遇到使半導(dǎo)體材料電離的粒子。在存儲器和微處理器等更復(fù)雜的集成電路中,當(dāng)傳播延遲增加、驅(qū)動強度降低或數(shù)字設(shè)備無法切換狀態(tài)導(dǎo)致器件無法工作時,晶體管級的變化會變成功能故障。當(dāng)單個高度電離的粒子與半導(dǎo)體相互作用時,就會發(fā)生單事件效應(yīng)(SEE)。由此產(chǎn)生的電荷重組可以持續(xù)幾納秒到幾微秒,其影響從小的良性瞬變到設(shè)備的災(zāi)難性故障不等。
在地球同步軌道上,SEE通常由銀河宇宙射線引發(fā),這些宇宙射線已經(jīng)傳播了幾光年,導(dǎo)致您的零件出現(xiàn)問題。在地球磁場內(nèi),SEE主要是由質(zhì)子引起的,質(zhì)子與構(gòu)成半導(dǎo)體的硅發(fā)生核反應(yīng),產(chǎn)生離開破壞性電離軌道的子產(chǎn)物。
通常,通過使用抗輻射(RH)部件可以減輕輻射效應(yīng)問題。然而,商用半導(dǎo)體行業(yè)的快速發(fā)展使得RH器件難以跟上商用現(xiàn)貨(COTS)部件中更高的存儲器密度和更高的加工性能。在許多情況下,沒有相對濕度等效物可用。對于要使用的這些COTS部件,必須考慮一定程度的輻射緩解,考慮到部件,環(huán)境和防護將如何相互作用。
高性能計算 = 高容量任務(wù)
各種技術(shù)以及 COTS 和 RH 器件的混合可以實現(xiàn)可靠的計算性能(圖 1)。單板計算機 (SBC) 的核心是三個以三模式冗余架構(gòu) (TMR) 排列的 Power PC 處理器。檢測硬件在每個時鐘周期比較所有三個處理器的每個輸出。定期重新同步(清理)通過清除所有三個處理器的內(nèi)容來清除潛在錯誤。如果發(fā)生錯誤,將禁用令人不安的處理器,直到可以對其進行清理。但是,系統(tǒng)繼續(xù)正常運行,因為投票輸出繼續(xù)有效。通過改變洗滌速率,可以根據(jù)任務(wù)要求定制系統(tǒng)擾動率。
圖1:SCS750 中使用的緩解技術(shù)摘要。
易失性和非易失性存儲器都是受糾錯碼保護的商業(yè)設(shè)備。SDRAM使用配置為64個數(shù)據(jù)位和32個校驗位的Reed-Solomon;此配置可檢測并更正任何雙設(shè)備故障。EEPROM歷來表現(xiàn)出對SEU的抗擾度,因此EEPROM可以在不太穩(wěn)健的ECC下運行,并通過單位糾錯來實現(xiàn)。另一方面,EEPROM具有較低的TID容差,并使用DDC的RadPak技術(shù)進行封裝,以屏蔽芯片并減少封裝內(nèi)的劑量。
少數(shù)抗輻射部件用于選定的功能,其中從商業(yè)部件開發(fā)解決方案的成本太困難或昂貴而不實用。這些功能包括 1553 接口和現(xiàn)場可編程門陣列 (FPGA)。由于其靈活性,F(xiàn)PGA為開發(fā)抗輻射計算解決方案提供了一條快速途徑。在SCS750的情況下,F(xiàn)PGA中的觸發(fā)器受TMR保護,用于支持處理器的投票電路和存儲器(SDRAM和閃存)的糾錯。
閃存革命
閃存無處不在:手機、汽車、工業(yè)機器人等等。將閃存帶入太空任務(wù)的原因相當(dāng)明顯。隨著大批量生產(chǎn),生產(chǎn)高度可靠零件的龐大工業(yè)基地也隨之而來。閃存 NAND 具有極高的密度(高達數(shù)百 Gb),作為任務(wù)推動者很有吸引力。
但是,附加功能并非沒有一些額外的怪癖。與SRAM等舊技術(shù)不同,NAND設(shè)備在正常工作條件下會自然產(chǎn)生壞位。即使在陸地環(huán)境中,也需要ECC來實現(xiàn)良好的耐久性和保持特性。在地球上,由于存儲單元中的電荷泄漏而發(fā)生單個損壞的位;然而,在太空中,翻轉(zhuǎn)機制更加多樣化。需要考慮多位翻轉(zhuǎn)和功能中斷。不過,與往常一樣,解決方案可以根據(jù)任務(wù)量身定制。在較溫和的軌道上,諸如BCH代碼之類的穩(wěn)健ECC可以處理錯誤率,而在更惡劣的環(huán)境中,ECC錯誤代碼可能需要與TMR架構(gòu)(或冗余副本)結(jié)合使用以處理功能中斷。
與許多COTS部件一樣,閃存在遠低于許多任務(wù)所需劑量的劑量下容易受到TID降解的影響。對于多級單元(MLC)設(shè)備,這些影響通常更差,其中多個位存儲在單個數(shù)據(jù)單元中,并且對閾值偏移的容差要小得多。因此,空間設(shè)計師傾向于單層單元(SLC)設(shè)備,這些設(shè)備的操作余量要大得多。TID 容差可能因特征尺寸而異。在許多情況下,可以通過在器件封裝中添加額外的屏蔽來減輕總劑量效應(yīng)。
新的前沿
雖然軍用電子不再在創(chuàng)新方面引領(lǐng)市場,但不同的技術(shù)使得在需要高可靠性的系統(tǒng)中使用商業(yè)部件成為可能。這一新現(xiàn)實的一個意想不到的后果是近年來資格認證流程的變化。過去,所有進入太空的部件都應(yīng)該是防彈的;相比之下,現(xiàn)在設(shè)計師已經(jīng)掌握了使用商業(yè)零件的挑戰(zhàn)。他們通過使用大量冗余的設(shè)計或安裝低成本、短期任務(wù)來彌補這種轉(zhuǎn)變。這種嚴重冗余方法的一個突出例子來自SpaceX,其龍補給船可能會失去發(fā)動機,但仍成功完成其任務(wù)。此外,低成本/短持續(xù)時間類別的典型代表是立方體衛(wèi)星的出現(xiàn)。在這兩種情況下,新方法都為低成本,高性能的任務(wù)打開了大門,這些任務(wù)有望在未來幾年內(nèi)帶來令人興奮的新功能和發(fā)現(xiàn)。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19390瀏覽量
230607 -
存儲器
+關(guān)注
關(guān)注
38文章
7522瀏覽量
164128 -
計算機
+關(guān)注
關(guān)注
19文章
7525瀏覽量
88382
發(fā)布評論請先 登錄
相關(guān)推薦
評論