前兩天,跟咸肉大神討論一個問題:即,如果客戶提出苛刻的溫度要求,而我們的電路,不能保證每一個器件的都能滿足整機的溫度范圍。那么我們應(yīng)該如何實現(xiàn)寬溫度范圍?或者說,我們即不能去承諾這樣的整機指標?還是我們通過什么手段,用低成本的措施來實現(xiàn)滿足可靠性的交付?
一些軍品標準,會要求每臺設(shè)備都經(jīng)過篩選試驗:也就是說每臺設(shè)備都經(jīng)過嚴格的測試,除了器件做早期的老練篩選。整機也做篩選試驗和環(huán)境試驗。而一些大規(guī)模發(fā)貨的設(shè)備:會在研發(fā)階段做HALT試驗,然后根據(jù)HALT試驗的數(shù)據(jù)設(shè)計HASS試驗,對生產(chǎn)環(huán)節(jié)的設(shè)備進行測試。HASS應(yīng)用于產(chǎn)品的生產(chǎn)階段,以確保所有在HALT中找到的改進措施能夠得已實施。HASS還能夠確保不會由于生產(chǎn)工藝和元器件的改動而引入新的缺陷。
但是一些沒有達到海量發(fā)貨的設(shè)備,在早期是沒有條件去做HASS試驗的,所以其承諾的整機溫度范圍如果超過器件的溫度范圍,又是如何去保證質(zhì)量的呢?
首先,是通過HALT試驗或者環(huán)境試驗的數(shù)據(jù),通過足夠多的樣本數(shù),在大樣本數(shù)能夠達到測試條件的前提下,對實際場景能否滿足要求進行折算和評估。但是這里面有概率性風險:例如,我們一個產(chǎn)品在早期,沒有設(shè)計HASS試驗的前提下,將設(shè)備安裝到西伯利亞的寒冷世界。當時就發(fā)生一塊電路板啟動失敗,反復(fù)重啟的情況。最后采取更換,故障單板返還的措施。甚至一些大廠,經(jīng)過大量測試驗證,0~70℃的DDR可以用于更低的溫度,而認為高溫有風險,需要對高溫規(guī)格進行降額。(不建議小廠這么做,因為沒有足夠的資源進行試驗和驗證;沒有足夠資源進行單板大批量樣本驗證,以及支持返還進行根因分析。)
其次,一些器件規(guī)格不能滿足的場景,可以通過整機方案解決,例如換更高性能的風扇、增加風扇、液冷、加熱器等等措施,可以彌補器件本身溫度范圍不能滿足要求的情況。例如:曾經(jīng)在華為設(shè)計的一款I(lǐng)P Camera,號稱“窮兇極惡”(寬溫度范圍、寬電壓范圍、高規(guī)格防雷),為了實現(xiàn)無故障超低溫啟動,原本設(shè)計的時候,預(yù)留一些加熱器、或者一些加熱電阻,同時修改IPC的啟動策略,由紅外燈先工作一段時間,再啟動CPU工作,保證工作溫度沒沒那么惡劣,是可接受的范圍。
可靠性是一系列方法的整合
可靠性整合是指無縫地、緊密地把不同可靠性方法融合在一起,從而以最小成本得到最佳可靠性。也就是說,可靠性方案是幾種方法協(xié)調(diào)使用的整體,而不是一堆無序的可靠性任務(wù)。
產(chǎn)品由各種部件和組件構(gòu)成。產(chǎn)品的可靠性在設(shè)計生產(chǎn)過程中,涉及到學(xué)科主要有:機械學(xué)、電子學(xué)、軟件、光學(xué)、化學(xué),所有這些學(xué)科組成了產(chǎn)品。因此應(yīng)該重視這些學(xué)科之間的關(guān)系,和總體的效果。我們設(shè)計的過程中也應(yīng)該是考慮更全面,而不僅僅是從某個部件的角度思考,或者僅僅從某個學(xué)科的維度去思考和解決問題。
開發(fā)部門往往都是從自己部門的學(xué)科出發(fā),去思考可靠性設(shè)計;甚至更糟糕的是一些大公司從自己部門的利益和KPI去考慮設(shè)計。但是客戶要的是完整的產(chǎn)品、并希望產(chǎn)品是各個部件在一起能正常運轉(zhuǎn)。因為可靠性主要由客戶和最終用戶進行衡量,產(chǎn)品開發(fā)人員應(yīng)該從產(chǎn)品和部件兩個方面進行綜合考慮,從而開發(fā)出可靠的產(chǎn)品。
但是有些設(shè)計人員,擔心質(zhì)量事故、擔心考評的黑事件,設(shè)計的時候,做可靠性堆砌,不計成本的增加可靠性,過設(shè)計、過冗余、過度降額。這就需要:一方面,公司在可靠性和成本雙方面進行引導(dǎo),同時,需要設(shè)計人員能夠具備全面思考產(chǎn)品,能夠站在公司角度,站在客戶角度去思考和設(shè)計產(chǎn)品。
可靠性VS成本
可靠性設(shè)計可以減少保修成本、使用成本、可以提高客戶滿意度;同時可靠性設(shè)計也會造成開發(fā)成本和生產(chǎn)成本。在生命周期的各個階段使用合適的方法,我們提高可靠性,到底要實現(xiàn)到什么程度呢?
在保證我們達到業(yè)界標準、交付標準、客戶需求等前提下,我們應(yīng)該是運用可靠性設(shè)計實現(xiàn)生命周期的總成本(LCC Life-cycle Costing)的降到最低。
3、軟件幾乎沒有生產(chǎn)成本。因此保修成本和經(jīng)費幾乎全部用于硬件。如果提高軟件可靠性不能節(jié)約成本,那么我們?yōu)槭裁催€要提高軟件可靠性呢?
因為:一、事實正面,軟件故障率有可能是硬件的10倍甚至更多??蛻舨⒉粎^(qū)分是軟件故障還是硬件故障。即支持在線升級,任然會造成使用中斷、業(yè)務(wù)中斷等問題。
二、軟件可靠性方案的好處不在于直接降低成本,而在于減少運作安裝返工率、減小故障維修事件、減輕軟件人員維護工作量。同時提升客戶滿意度。
所以提高軟件可靠性,必定可以帶來成本的節(jié)約。
部分文字翻譯自《提高可靠性的50種方法》
-
電路
+關(guān)注
關(guān)注
172文章
5959瀏覽量
172702 -
可靠性
+關(guān)注
關(guān)注
4文章
266瀏覽量
26774
原文標題:可靠性VS成本
文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論