0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為云服務(wù)治理 | 服務(wù)治理的一般性原則

與時(shí)俱進(jìn)的科技 ? 來(lái)源:與時(shí)俱進(jìn)的科技 ? 作者:與時(shí)俱進(jìn)的科技 ? 2023-01-18 18:19 ? 次閱讀

華為云服務(wù)治理 | ** 服務(wù)治理的一般性原則**

服務(wù)治理通常是指通過(guò)限流、熔斷等手段,保障微服務(wù)的可靠運(yùn)行,即運(yùn)行時(shí)治理。更加寬泛的服務(wù)治理還包括微服務(wù)持續(xù)集成(開(kāi)源軟件管理、自動(dòng)化測(cè)試等),微服務(wù)部署最佳實(shí)踐(滾動(dòng)升級(jí)、灰度發(fā)布等),微服務(wù)可觀測(cè)性能力(日志、監(jiān)控、告警等)構(gòu)建等。

華為云微服務(wù)治理專題主要探討運(yùn)行時(shí)治理。接下來(lái)我們探討故障處理的一般性原則。

故障識(shí)別

在用戶看來(lái),故障場(chǎng)景和正常場(chǎng)景是非常容易區(qū)分的。在服務(wù)治理的角度,識(shí)別故障則非常困難。

以調(diào)用超時(shí)為例,產(chǎn)生調(diào)用超時(shí)的原因非常多,包括:(1)服務(wù)端部分接口處理慢,導(dǎo)致超時(shí),而其他接口處理正常;(2)服務(wù)端故障,網(wǎng)絡(luò)不可達(dá),可能是短暫的,也可能是持續(xù)的;(3)服務(wù)端內(nèi)存、CPU高,導(dǎo)致處理變慢;(4)大量并發(fā)請(qǐng)求在服務(wù)端排隊(duì),當(dāng)請(qǐng)求被處理的時(shí)候,已經(jīng)超過(guò)了很長(zhǎng)的時(shí)間;(5)客戶端并發(fā)建立連接,內(nèi)存、CPU增高,導(dǎo)致請(qǐng)求握手超時(shí)等。這些不同類型的錯(cuò)誤,從調(diào)用者看起來(lái),都體現(xiàn)為一樣的行為。

以錯(cuò)誤碼為例,服務(wù)端返回503錯(cuò)誤,也可能包含很多不一樣的原因。比如系統(tǒng)未就緒,正在啟動(dòng)過(guò)程中,下次重試就可以訪問(wèn);或者服務(wù)出現(xiàn)內(nèi)存泄漏等原因,導(dǎo)致無(wú)法進(jìn)行響應(yīng);當(dāng)服務(wù)內(nèi)部的一些部件不可用的時(shí)候,也可能返回503錯(cuò)誤碼。

基于上述原因,服務(wù)治理能夠識(shí)別少量的故障類型,而無(wú)法識(shí)別更細(xì)維度的故障原因。

故障反饋

高并發(fā)場(chǎng)景下,相對(duì)于單個(gè)請(qǐng)求處理的時(shí)延,故障反饋過(guò)程非常緩慢。比如單個(gè)請(qǐng)求處理只需要幾個(gè)毫秒,但是檢測(cè)到請(qǐng)求超時(shí),至少需要幾秒時(shí)間。如果減少超時(shí)時(shí)間,檢測(cè)就會(huì)變得很不準(zhǔn)確,通常會(huì)由于系統(tǒng)調(diào)度延遲,讓超時(shí)時(shí)間出現(xiàn)大范圍的波動(dòng)。而且請(qǐng)求超時(shí)會(huì)觸發(fā)一些系統(tǒng)資源,比如HTTP連接的關(guān)閉和重建,引起更大范圍的超時(shí)。再比如依賴于CPU、內(nèi)存或者請(qǐng)求TPS的監(jiān)控?cái)?shù)據(jù),一般是通過(guò)異步線程在后臺(tái)周期性進(jìn)行統(tǒng)計(jì)實(shí)現(xiàn)的,當(dāng)統(tǒng)計(jì)數(shù)據(jù)反饋到服務(wù)治理策略的時(shí)候,相比較請(qǐng)求時(shí)延,已經(jīng)過(guò)去很長(zhǎng)時(shí)間了,這個(gè)時(shí)候再去實(shí)施治理策略,得到的反饋數(shù)據(jù)已經(jīng)不足以支持治理策略的實(shí)施。

服務(wù)治理的一般原則

故障識(shí)別困難、故障反饋緩慢導(dǎo)致了在故障場(chǎng)景下,不能像處理正常功能邏輯一樣,通過(guò)復(fù)雜的邏輯,比如轉(zhuǎn)移故障、采集更多歷史數(shù)據(jù)計(jì)算最優(yōu)解等保障本次請(qǐng)求盡可能成功。也不能假設(shè)一個(gè)實(shí)際無(wú)法模擬驗(yàn)證的故障,然后針對(duì)這個(gè)故障進(jìn)行保護(hù)。

服務(wù)治理策略需要結(jié)合大量的實(shí)踐來(lái)進(jìn)行驗(yàn)證,總結(jié)起來(lái)有幾個(gè)非常核心的原則:

· 快速失敗優(yōu)先于保障本次請(qǐng)求成功。通過(guò)快速失敗降低故障的影響時(shí)間,減少故障對(duì)于系統(tǒng)資源的占用,讓系統(tǒng)能夠快速恢復(fù)到正常的處理水平。

· 治理策略的邏輯應(yīng)該采用無(wú)狀態(tài)算法,不依賴于其他微服務(wù)或者中間件,只依賴于本服務(wù)的內(nèi)部狀態(tài)就能夠?qū)嵤?,避免依賴于?fù)雜的錯(cuò)誤檢測(cè)機(jī)制。這個(gè)原則使得服務(wù)治理的策略依賴于相對(duì)實(shí)時(shí)的故障數(shù)據(jù),減少治理策略本身的處理時(shí)間,讓治理策略的前提和結(jié)果變得更好預(yù)測(cè)。

· 治理策略的實(shí)施條件和結(jié)果必須可以通過(guò)模擬的方式進(jìn)行驗(yàn)證。雖然故障識(shí)別是非常困難的,但是任何治理策略都需要假設(shè)他出現(xiàn)的場(chǎng)景是什么,這個(gè)場(chǎng)景發(fā)生的時(shí)候,故障表現(xiàn)是什么,依賴于故障場(chǎng)景、故障表現(xiàn)來(lái)執(zhí)行治理策略,并且可以評(píng)估不同治理策略對(duì)同樣的故障場(chǎng)景和故障表現(xiàn)得出的保護(hù)效果。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    34440

    瀏覽量

    251769
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于華為 Flexus 服務(wù)器 X 實(shí)例部搭建 Halo 博客平臺(tái)

    署 Halo 博客平臺(tái),充分發(fā)揮其穩(wěn)定可靠的服務(wù)優(yōu)勢(shì)。通過(guò)這實(shí)踐,我們將展示如何利用華為的強(qiáng)大支持,實(shí)現(xiàn)博客平臺(tái)的高效搭建與管理。依托
    的頭像 發(fā)表于 12-26 09:40 ?111次閱讀
    基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>器 X 實(shí)例部搭建 Halo 博客平臺(tái)

    華為 Flexus 服務(wù)器 X 實(shí)例 使用流程

    感謝華為大哥的優(yōu)惠券 用優(yōu)惠券之后 0 元,再次感謝!歡迎大家購(gòu)買個(gè),動(dòng)手跟我起試試 購(gòu)買 Flexus 服務(wù)器 X 實(shí)例后,第
    的頭像 發(fā)表于 12-24 17:28 ?131次閱讀
    <b class='flag-5'>華為</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>器 X 實(shí)例 使用流程

    華為 Flexus 服務(wù)器 X 實(shí)例的購(gòu)買及使用體驗(yàn)

    前言 隨著計(jì)算的不斷發(fā)展,服務(wù)的使用變得越來(lái)越方便。它不僅提高了我們的工作效率,還幫助我們提升了技術(shù)能力,增強(qiáng)了在職場(chǎng)中的競(jìng)爭(zhēng)力。華為
    的頭像 發(fā)表于 12-24 17:26 ?137次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>器 X 實(shí)例的購(gòu)買及使用體驗(yàn)

    租用GPU服務(wù)一般多少錢

    租用GPU服務(wù)器的費(fèi)用受到多種因素的影響,包括服務(wù)器配置、租用時(shí)長(zhǎng)、服務(wù)提供商以及市場(chǎng)供需狀況等。下面,AI部落小編帶您了解租用GPU服務(wù)器的一般
    的頭像 發(fā)表于 11-25 10:28 ?193次閱讀

    租用容器服務(wù)費(fèi)用高嗎?

    租用容器服務(wù)費(fèi)用高嗎?租用容器服務(wù)的費(fèi)用并不是特別高,其費(fèi)用通常包括基礎(chǔ)資源費(fèi)用、附加服務(wù)費(fèi)用以及其他可能的費(fèi)用?;A(chǔ)資源費(fèi)用每月
    的頭像 發(fā)表于 10-10 10:54 ?155次閱讀

    服務(wù)網(wǎng)格DPU卸載解決方案

    服務(wù)網(wǎng)格(Service Mesh)是微服務(wù)架構(gòu)中的種重要技術(shù),它主要處理服務(wù)之間的通信,為服務(wù)間的信息交換提供更安全、更快速且更可靠的基
    的頭像 發(fā)表于 09-20 16:25 ?316次閱讀
    <b class='flag-5'>服務(wù)</b>網(wǎng)格DPU卸載解決方案

    容器服務(wù)價(jià)格高嗎?容器服務(wù)價(jià)格表

    一般來(lái)說(shuō),其價(jià)格并不是特別高。容器服務(wù)的費(fèi)用價(jià)格高低取決于多種因素,包括服務(wù)提供商、所選服務(wù)的類型、資源配置、地理位置等。對(duì)于
    的頭像 發(fā)表于 09-12 10:05 ?227次閱讀

    Proxyless的多活流量和微服務(wù)治理

    服務(wù)間通信的復(fù)雜 :不同服務(wù)之間需要進(jìn)行可靠的通信,處理失敗重試、負(fù)載均衡等問(wèn)題。 故障的容錯(cuò)處理 :系統(tǒng)的復(fù)雜給與運(yùn)維及故障處理帶來(lái)更大的挑戰(zhàn),如何快速處理故障解決線上問(wèn)題,
    的頭像 發(fā)表于 08-28 16:54 ?1589次閱讀
    Proxyless的多活流量和微<b class='flag-5'>服務(wù)</b><b class='flag-5'>治理</b>

    無(wú)縫升級(jí)服務(wù),華為 Flexus X 實(shí)例帶來(lái)零門(mén)檻極致體驗(yàn)

    隨著數(shù)字化轉(zhuǎn)型的加速,計(jì)算已成為企業(yè)運(yùn)營(yíng)的重要基礎(chǔ)設(shè)施。企業(yè)在選擇服務(wù)時(shí),會(huì)綜合考慮成本效益、性能穩(wěn)定性,以及服務(wù)的靈活性和可擴(kuò)展性。特別是中小企業(yè)需要
    的頭像 發(fā)表于 08-21 18:03 ?657次閱讀
    無(wú)縫升級(jí)<b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>,<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實(shí)例帶來(lái)零門(mén)檻極致體驗(yàn)

    日本服務(wù)器多少錢個(gè)月?

    一般來(lái)說(shuō),日本服務(wù)器的月租費(fèi)用在幾十元至數(shù)百元不等,具體取決于所選的配置和服務(wù)。例如,些基礎(chǔ)配置的日本
    的頭像 發(fā)表于 08-16 11:22 ?329次閱讀

    重塑服務(wù),華為 Flexus X 實(shí)例破解服務(wù)傳統(tǒng)難題

    服務(wù)的局限性也逐步顯現(xiàn),成為阻礙企業(yè)發(fā)展的障礙。華為深刻洞察中小企業(yè)和開(kāi)發(fā)者在服務(wù)應(yīng)用中遇到的挑戰(zhàn),推出了創(chuàng)新的
    的頭像 發(fā)表于 08-12 09:54 ?580次閱讀
    重塑<b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>,<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實(shí)例破解<b class='flag-5'>云</b><b class='flag-5'>服務(wù)</b>傳統(tǒng)難題

    如何預(yù)防服務(wù)器被攻擊?

    服務(wù)器被攻擊的應(yīng)急措施 當(dāng)然,預(yù)防總是勝于治理。調(diào)查表明,如果遵循網(wǎng)絡(luò)安全建議,最近頻發(fā)的WannaCry勒索軟件對(duì)英國(guó)國(guó)家醫(yī)療服務(wù)體系(NHS)的攻擊可能得到有效的阻止。 為了避免未來(lái)的黑客行為,保持警惕
    的頭像 發(fā)表于 07-05 11:16 ?284次閱讀

    計(jì)算與企業(yè)IT成本治理

    時(shí)至今日,計(jì)算已逐步替代傳統(tǒng)IT中服務(wù)器、存儲(chǔ)、虛擬化等單體軟硬件的IT架構(gòu),成為企業(yè)IT能力中最重要的組成部分。企業(yè)在利用計(jì)算帶來(lái)的便利、敏捷的同時(shí),也越來(lái)越多依靠計(jì)算提供的持
    的頭像 發(fā)表于 06-19 09:40 ?554次閱讀
    <b class='flag-5'>云</b>計(jì)算與企業(yè)IT成本<b class='flag-5'>治理</b>

    電能治理篇章:諧波治理產(chǎn)生的源頭和治理方法

    安科瑞 在電力系統(tǒng)中,諧波治理直是項(xiàng)重要而復(fù)雜的任務(wù)。隨著電力電子技術(shù)的廣泛應(yīng)用和非線性負(fù)載的不斷增加,諧波問(wèn)題日益突出,對(duì)電網(wǎng)的安全穩(wěn)定運(yùn)行和用電設(shè)備的正常使用構(gòu)成了嚴(yán)重威脅。本文將深入探討
    的頭像 發(fā)表于 05-16 14:09 ?743次閱讀

    軟通動(dòng)力成為華為聯(lián)合基線解決方案TOP1服務(wù)

    近日,軟通動(dòng)力與華為長(zhǎng)期以來(lái)的深入合作、深度協(xié)作再結(jié)碩果,雙方共同設(shè)計(jì)的企業(yè)上服務(wù)解決方案、數(shù)據(jù)中臺(tái)及數(shù)據(jù)治理
    的頭像 發(fā)表于 01-09 10:59 ?818次閱讀
    軟通動(dòng)力成為<b class='flag-5'>華為</b><b class='flag-5'>云</b>聯(lián)合基線解決方案TOP1<b class='flag-5'>服務(wù)</b>商