0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IT技術(shù)廠商說的“5個9”到底有多牛?

工業(yè)互聯(lián)網(wǎng)前線 ? 來源:美國容錯技術(shù)有限公司 ? 作者:美國容錯技術(shù)有限 ? 2021-04-07 11:06 ? 次閱讀

從事信息化產(chǎn)業(yè)研究多年,身邊不乏熟悉的IT技術(shù)廠商。在與他們的技術(shù)專家交流過程中經(jīng)常會聊到產(chǎn)品可用性問題。這時他們會說自己的產(chǎn)品有多好,可用性高達(dá)“5個9”。那么,“5個9”到底有多牛?

按照年度可用性計算:365天x24小時x60分鐘x99.999%=5.256分鐘。換句話講,他們的產(chǎn)品允許一年非計劃停機(jī)時間約為5分鐘,厲害不厲害?當(dāng)然厲害??捎眯詨騿??我看未必。隨著企業(yè)數(shù)字化轉(zhuǎn)型升級,更復(fù)雜的業(yè)務(wù)需求對服務(wù)器可用要求將越來越高,甚至根本不允許任何非計劃停機(jī)。因此,僅僅是高可用性,其實是滿足不了日趨智能化的工業(yè)時代需求。

按照高可用性的定義,本質(zhì)是允許非計劃內(nèi)停機(jī)出現(xiàn)的,只是盡可能通過技術(shù)手段來減少停工時間,保持服務(wù)的高度可用性。

目前高可用性對停機(jī)劃分分為兩種,一是不可修復(fù)系統(tǒng),系統(tǒng)的平均壽命指系統(tǒng)發(fā)生失效前的平均工作(或存儲)時間或工作次數(shù),也稱為系統(tǒng)在失效前的平均時間,記為MTTF(Mean Time To Failure)。二是可修復(fù)系統(tǒng),系統(tǒng)的壽命是指兩次相鄰失效(故障)之間的工作時間,而不是指整個系統(tǒng)的報廢時間。平均壽命即是平均無故障時間,也稱為系統(tǒng)平均失效間隔,記為MTBF(Mean Time Between Failure)。可修復(fù)產(chǎn)品的平均修復(fù)時間,就是從出現(xiàn)故障到修復(fù)中間的這段時間記為MTTR(Mean Time To Repair)平均修復(fù)時間。MTTR越短表示易恢復(fù)性越好。

那么,容錯性和高可用性有什么區(qū)別?容錯性指的是故障容許度(Fault tolerance),是使系統(tǒng)在部分組件(一個或多個)發(fā)生故障時仍能正常運(yùn)作的能力。容錯性能保障即使系統(tǒng)組件出現(xiàn)故障,也能快速的切換到備用系統(tǒng),并保證系統(tǒng)的正常運(yùn)營能力。對比高可用性強(qiáng)調(diào)恢復(fù)能力,容錯性是不允許這種情況發(fā)生,其目標(biāo)是預(yù)防故障,做到即使出現(xiàn)故障也能快速切換,保證業(yè)務(wù)系統(tǒng)正常運(yùn)行。

在傳統(tǒng)信息化時代,服務(wù)器主要承載的是對可用性和可靠性要求不高的業(yè)務(wù)應(yīng)用,如ERP、OA、CRM或MES等。隨著智能制造的推進(jìn),傳統(tǒng)業(yè)務(wù)系統(tǒng)向工業(yè)現(xiàn)場延伸,服務(wù)器正在承擔(dān)起越來越多的場景功能,這些場景不僅智能化程度越來越高,計算需求越來越密集,而且對實時性要求也很高。

比如在工業(yè)智能化控制系統(tǒng)中根本不允許出現(xiàn)任何故障問題,因為這可能帶來一系列重大工業(yè)安全事故。在無人自動化駕駛系統(tǒng)中,時刻需要采集和分析周邊環(huán)境數(shù)據(jù)并進(jìn)行實時分析,及時反饋到中控系統(tǒng)以保障自動駕駛過程的安全。因此,時代對硬件性能的要求不同了。作為服務(wù)器廠商,必須適應(yīng)由故障恢復(fù)到故障預(yù)防的趨勢變化,打造容錯性能更好的服務(wù)器平臺。

在早期計算機(jī)系統(tǒng)不是特別可靠的情況下,為做到故障預(yù)防,企業(yè)通常采用的是雙機(jī)容錯機(jī)制,即購買兩臺配置完全一樣的服務(wù)器冗余級聯(lián),一旦主機(jī)出現(xiàn)故障,就快速切換到從機(jī)上,從而保證業(yè)務(wù)的正常運(yùn)營。但這種部署方式不僅成本高、效率低,而且實施過程十分復(fù)雜,一旦出現(xiàn)斷電等意外情況,就完全無抵抗力。

那么,怎么才能保證在部署成本更低、實施更簡單的前提下,讓系統(tǒng)具備更好的容錯性能?全球容錯技術(shù)領(lǐng)導(dǎo)廠商Stratus是這么做的!

上圖是Stratus公司打造的一種全面集成的持續(xù)可用性平臺——ftServer,為企業(yè)關(guān)鍵應(yīng)用提供更穩(wěn)定可靠的平臺。

為保障平臺的高可靠性和可用性,ftServer通過部署一對冗余節(jié)點(diǎn),兩個相同的客戶可更換單元(CRU)——其中每一個客戶可更換單元均有自己的處理器、內(nèi)存和存儲。所有冗余組件和子系統(tǒng)打包為單一系統(tǒng),從而降低了許可成本并簡化了管理。

Stratus具有獨(dú)特的冗余現(xiàn)場可編程門陣列、數(shù)據(jù)路徑和同步固件,即使硬件組件出現(xiàn)故障,也能夠提供確保持續(xù)可用性所需的處理器同步、數(shù)據(jù)復(fù)制和邏輯,系統(tǒng)會在不同節(jié)點(diǎn)間自動復(fù)制數(shù)據(jù)。一個節(jié)點(diǎn)發(fā)生故障時,運(yùn)行在上面的虛擬機(jī)會自動在另一個節(jié)點(diǎn)上重啟(高可用性模式)或恢復(fù)(容錯模式)。

同時,為增強(qiáng)平臺的兼容性并降低成本,ftServer不僅使用通用化的x86芯片組、DIMM和驅(qū)動器,還使用標(biāo)準(zhǔn)分發(fā)包裝的操作系統(tǒng)和虛擬化軟件,從而簡化了管理并縮短了價值實現(xiàn)時間。ftServer自動化的自監(jiān)控、告警、自診斷和補(bǔ)救功能是通過主動服務(wù)架構(gòu)實現(xiàn)的。通過簡化ftServer監(jiān)控和管理,以及篩選需要釆取行動的問題,Stratus可節(jié)省公司時間以及減少工作量。

為盡可能減少停機(jī)維護(hù)時間,ftServer旨在實現(xiàn)服務(wù)性,它的可熱插拔CRU無需關(guān)閉系統(tǒng)即可拔下,并且無需使用特殊工具即可更換。這一點(diǎn)以及自動數(shù)據(jù)重新同步使ftServer適于在遠(yuǎn)程制造位置或IT資源有限的位置部署。

對IT硬件系統(tǒng)而言,沒有絕對的可靠性,只有相對的可用性。容錯性的目標(biāo)是預(yù)防故障,可用性的目標(biāo)是恢復(fù)故障,目標(biāo)雖然不一致,但是殊途同歸。隨著工業(yè)智能化時代的開啟,就當(dāng)前企業(yè)需求看,“預(yù)防故障”顯然比“故障恢復(fù)”更有吸引力,因為在不確定、復(fù)雜性的時代,企業(yè)更希望能提前掌握不可預(yù)知的風(fēng)險,讓一切可控。

原文標(biāo)題:觀察|漫談高可用性與容錯性

文章出處:【微信公眾號:工業(yè)IoT】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IT
    IT
    +關(guān)注

    關(guān)注

    2

    文章

    866

    瀏覽量

    63549
  • 容錯
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    14937

原文標(biāo)題:觀察|漫談高可用性與容錯性

文章出處:【微信號:IndustryIOT,微信公眾號:工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    差分輸入和和單端輸入在本質(zhì)上到底有什么區(qū)別?

    和和單端輸入在本質(zhì) 上到底有什么區(qū)別? 因為,ADC采集的信號說到底是AINP - AINN,不管單端還是差分,采集的信號都是這兩pad的差值。 2:將單端信號接在ADC的差分輸入接口上可以用
    發(fā)表于 12-23 07:31

    TFP401APZP到底有沒有HSYNC輸出?

    請教下TI的大牛,TFP401APZP這顆IC到底有沒有HSYNC輸出?實測發(fā)現(xiàn)HSYNC無輸出,是要做什么設(shè)置么?!
    發(fā)表于 12-20 07:28

    高鐵站網(wǎng)約車數(shù)智出行到底有智能?

    在當(dāng)今這個科技飛速發(fā)展的時代,智能出行已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?,而高鐵站網(wǎng)約車數(shù)智出行更是將這一理念推向了新的高度。那么,這種數(shù)智出行方式到底有智能呢? 首先,從預(yù)約叫車開始,高鐵站網(wǎng)
    的頭像 發(fā)表于 11-14 14:48 ?227次閱讀

    RTOS與Linux到底有什么區(qū)別

    很多做嵌入式開發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?476次閱讀

    功放和運(yùn)放到底是什么區(qū)別?

    想請問一下功放和運(yùn)放到底是什么區(qū)別,感覺只要接一小負(fù)載,運(yùn)放的輸出電流也可以很大?。?b class='flag-5'>到底有什么區(qū)別啊
    發(fā)表于 09-10 07:00

    CMOS運(yùn)放的輸入阻抗到底有多高呢?

    都說CMOS運(yùn)放輸入阻抗高,到底有多高呢?可有一量化指標(biāo)?
    發(fā)表于 09-06 06:59

    求助,這個電路U1A運(yùn)放同相端的R1電阻到底有什么作用啊?

    想問下這個電路U1A運(yùn)放同相端的R1電阻到底有什么作用???很郁悶。
    發(fā)表于 08-27 07:09

    lm2902做的二階低通濾波器,無論怎么調(diào)試C1的值,電路的波特圖都保持不變,請問一下C1的作用到底有多大?

    這是一lm2902做的二階低通濾波器,但是無論怎么調(diào)試C1的值,該電路的波特圖都保持不變,請問一下C1的作用到底有多大?。扛慕Y(jié)構(gòu)與MFB和sallen-key明顯的區(qū)別,這是
    發(fā)表于 08-21 07:45

    無人機(jī)智能巡檢系統(tǒng)到底有哪些作用

    無人機(jī)智能巡檢系統(tǒng)到底有哪些作用? 隨著科技的不斷發(fā)展,無人機(jī)已經(jīng)在光伏、風(fēng)電、農(nóng)業(yè)、水利、城市管理、地質(zhì)等領(lǐng)域廣泛應(yīng)用,無人機(jī)智能巡檢系統(tǒng)的應(yīng)用,為巡檢工作帶來了革命行的變革,那么無人機(jī)智能巡檢
    的頭像 發(fā)表于 08-19 16:49 ?354次閱讀
    無人機(jī)智能巡檢系統(tǒng)<b class='flag-5'>到底有</b>哪些作用

    EWSTM8-2201 or 3101安裝說明上有的選“是”,有的選“否”,二者到底有什么區(qū)別?對工程什么影響?

    the installation. ......... 安裝說明上有的選“是”,有的選“否”,二者到底有什么區(qū)別?對工程什么影響?
    發(fā)表于 04-28 08:08

    你知道激光鉆孔技術(shù)嗎?看完這篇文章你就明白了

    你知道激光鉆孔技術(shù)嗎?看完這篇文章你就明白了
    的頭像 發(fā)表于 02-29 17:09 ?989次閱讀

    網(wǎng)線到底有多少種連接器

    我們在談?wù)摼W(wǎng)線的時候,聊得最多的,一定是它的連接器,它在連接過程中扮演著極為重要的角色。網(wǎng)線到底有多少種連接器?本期我們將從工業(yè)級使用出發(fā),來看看這根似乎普通的網(wǎng)線,在連接器上有多么努力。
    的頭像 發(fā)表于 01-26 10:06 ?624次閱讀

    NUC123的USB外設(shè)到底有沒有DMA功能?

    下載最新的TRM 1.07: 在最先前的描述以及USB的寄存器章節(jié)都有DMA相關(guān)的內(nèi)容。但是DMA那一章節(jié)里的框圖沒有USB外設(shè)。同時關(guān)于USB外設(shè)DMA的用法也沒具體說明。所以USB外設(shè)到底有沒DMA功能,若是該怎么用?
    發(fā)表于 01-16 08:26

    全固態(tài)電池到底有哪些閃光點(diǎn)?

    全固態(tài)電池到底有哪些閃光點(diǎn)? 全固態(tài)電池是一種新型的電池技術(shù),相比傳統(tǒng)液態(tài)電池,具有許多閃光點(diǎn)。下面我將詳細(xì)介紹這些閃光點(diǎn)。 首先,全固態(tài)電池具有更高的安全性。傳統(tǒng)液態(tài)電池中使用的有機(jī)電解液容易引發(fā)
    的頭像 發(fā)表于 01-09 17:09 ?778次閱讀

    AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區(qū)別?

    替代嗎?在網(wǎng)上找到的兩芯片的相關(guān)數(shù)據(jù)都是一樣的,AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區(qū)別?
    發(fā)表于 01-08 06:36