引言
相信每個人都了解“黑盒子”的用途,用于記錄飛機飛行過程中發(fā)生意外瞬間的數(shù)據(jù)。飛機的“黑盒子”能夠收集大量飛行操作數(shù)據(jù),包括:高度、速度、襟翼和航向位置;記錄飛行員在事故發(fā)生之前進行的操作和對話。這些數(shù)據(jù)對于最終分析事故的根本原因起著重要作用。
“黑盒子”并非名副其實,飛機上的黑盒子從不是黑色的,而是采用橙色,以便容易被發(fā)現(xiàn)。所以,該設備的正確名稱應該是“事件數(shù)據(jù)記錄議”。
當然,在工程師眼里,“黑盒子”代表一個已知輸入、輸出,但內部操作未知的設備。本文并不討論這種設備。
在電子設備(而不是飛機)中增加數(shù)據(jù)記錄功能—“黑盒子”,將為系統(tǒng)提供非常有價值的信息。電子設備中所謂的復雜系統(tǒng)管理器—黑盒子,用于記錄網(wǎng)絡、通訊、工業(yè)、醫(yī)療設備的故障數(shù)據(jù)。記錄故障所帶來的最大好處是快速、有效地進行失效分析。本文介紹了實現(xiàn)這個功能的方案以及利用非易失故障記錄的便利條件。
電源管理機制
從電源管理的角度看,大多數(shù)系統(tǒng)架構看起來非常接近。無論系統(tǒng)是路由器、服務器、基站、光纖交換機、可編程控制器,還是磁共振成像儀,它們都包含開關電源和線性穩(wěn)壓器,而且都需要監(jiān)測電壓、電流、溫度或風扇速度,如圖1所示。
圖1. 典型的電源管理架構
非易失故障記錄
無論是大規(guī)模系統(tǒng),還是一個“比薩”盒子大小的系統(tǒng),其系統(tǒng)管理器的主要功能是控制、監(jiān)測大量的電源和風扇,其中包括:系統(tǒng)故障查詢,例如:過壓/欠壓、過流、溫度是否超出工作范圍,或者是風扇速度是否正常。將故障監(jiān)測轉化成檢測參數(shù)是否超出閥值這類簡單操作。系統(tǒng)運行過程中實時采集數(shù)據(jù),并在發(fā)生故障時將數(shù)據(jù)存儲到非易失存儲器,由此創(chuàng)建事件數(shù)據(jù)記錄器,圖2顯示了一個系統(tǒng)方案。
圖2. 非易失故障記錄系統(tǒng)框圖,監(jiān)測電源和風扇
圖2中,復雜系統(tǒng)管理器連續(xù)收集系統(tǒng)電壓、電流、溫度和風扇速度等數(shù)據(jù)。類似于飛機上的“黑盒子”,記錄儀將滾動收集大量的最新數(shù)據(jù)(比如,500ms到1s的最新數(shù)據(jù))。發(fā)生故障時,系統(tǒng)的瞬間信息將被永久記錄下來。能夠檢查故障發(fā)生前500ms至1s期間的系統(tǒng)操作,為排查系統(tǒng)故障的原因和系統(tǒng)分析非常重要。通過核查數(shù)據(jù),可以重新組織時間段,確定系統(tǒng)的相互依賴關系。理想情況下,復雜系統(tǒng)管理器應記錄多種故障,便于建立系統(tǒng)之間的相互依賴性,發(fā)生一個故障后,可能會引發(fā)更多的后續(xù)故障。為了找到故障的根本原因,需要記錄盡可能完備的數(shù)據(jù)。而且,大容量非易失數(shù)據(jù)存儲允許系統(tǒng)記錄并非關鍵的故障,只是表示系統(tǒng)的某些參數(shù)超出了工作范圍,這對提高整體系統(tǒng)的安全性非常重要。
設計示例
考慮圖3所示系統(tǒng),如果一路電源失效(步驟1),并且連續(xù)監(jiān)測系統(tǒng)電壓、電流和溫度的復雜系統(tǒng)管理器同時檢測到這一故障。這個管理器將立即通知其它管理器,以便立刻采取相應措施(步驟2)。復雜系統(tǒng)管理器會按照要求立即順序關閉電源和風扇(步驟3),所有最新的系統(tǒng)電壓、電流、溫度和風扇速度等信息將記錄到系統(tǒng)的黑盒子內(步驟4)。因為已經(jīng)記錄數(shù)據(jù)并存入非易失存儲器,可以隨時在以后隨時調用、查詢這些數(shù)據(jù) (即使設備從現(xiàn)場返回),便于分析設備失效的原因(步驟5)。
圖3. 黑盒子故障記錄器
非易失故障記錄的優(yōu)勢
非易失故障記錄具有很多優(yōu)點,如果一個設備能夠跟蹤失效記錄,將有助于失效分析人員快速定位失效原因。這種解決問題的能力可提升用戶滿意度,因為用戶迫切需要了解事故原因。得到事故分析報告越快,也可以盡早地糾正錯誤,從而避免潛在危險、避免故障的再此發(fā)生,提高整體系統(tǒng)的可靠性。借助非易失故障記錄器,可以了解用戶操作是否符合常規(guī)要求,是否違反產(chǎn)品可承受的條件限制。因此,通過收集現(xiàn)場失效數(shù)據(jù),可以識別供應商的等級,辨別設計的優(yōu)劣,為未來產(chǎn)品的可靠性提供保障。
復雜系統(tǒng)管理器
Maxim提供大量內置非易失故障記錄器的復雜系統(tǒng)管理器,適用于服務器等大規(guī)模系統(tǒng),也適合網(wǎng)絡交換機等“比薩”盒子大小的小型系統(tǒng),如圖4和圖5所示。
MAX34440控制并監(jiān)測多達6路電源(圖4),具有電源排序和裕量調節(jié)功能,可監(jiān)測電壓、電流和溫度故障,多個MAX34440可以并聯(lián)使用。MAX31785控制、監(jiān)測多達6個風扇,與MAX34440一樣,多個MAX31785也可以并聯(lián)監(jiān)測更多風扇。
圖4. 利用MAX34440和MAX31785構建的大規(guī)模系統(tǒng)
Maxim還提供支持網(wǎng)絡交換機等小型系統(tǒng)的管理器,利用MAX34441可以監(jiān)測5路電源和1個風扇(圖5)。為提高設計靈活性,多個MAX34441可以并聯(lián)起來,也可以和多個MAX34440、MAX31785配合使用。
圖5. 利用MAX34441提供小型系統(tǒng)管理
結論
在網(wǎng)絡、工業(yè)控制、醫(yī)療和通信設備中增加“黑盒子”記錄器,有助于快速分析失效原因。因而也會提升產(chǎn)品的長期穩(wěn)定性,針對客戶問題作出快速響應,最終提高用戶的滿意度。
審核編輯:郭婷
-
控制器
+關注
關注
112文章
16361瀏覽量
178069 -
路由器
+關注
關注
22文章
3732瀏覽量
113788 -
管理器
+關注
關注
0文章
246瀏覽量
18511
發(fā)布評論請先 登錄
相關推薦
評論