0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你走近華為云SRE

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-01-16 19:40 ? 次閱讀

文藝復(fù)興三杰之一的米開朗基羅,被稱為“天才建筑師”。其實他一生留下的建筑并不多,僅僅有美第奇禮拜堂、卡比多廣場、圣彼得大教堂穹頂?shù)攘攘葞鬃5组_朗基羅卻憑借對建筑層次與結(jié)構(gòu)的精妙把握,影響了此后數(shù)百年的建筑風(fēng)格。很多人認(rèn)為,米氏特別擅長在立體的空間與繁雜的結(jié)構(gòu)中,尋求建筑的最大確定性。得益于此,像圣彼得大教堂穹頂這樣原本被認(rèn)為不可能的作品才最終問世——探尋確定性,也就此成為建筑設(shè)計師的目標(biāo)之一。

在今天,數(shù)字化和云化正在容納一切。每天,不計其數(shù)的硬件連接云端,軟件完成云上開發(fā)、迭代。這讓云端變成了一個空前復(fù)雜的賽博空間,同時也產(chǎn)生了海量的不確定性。但是,這種不確定性又是必須被治愈和解決的。根據(jù)GIV預(yù)測,至2025年,全球企業(yè)云技術(shù)使用率將達(dá)到100%。全面云化的不可逆趨勢下,企業(yè)必須確保自身數(shù)字化、智能化過程中的安全、穩(wěn)定與可靠。

誰來再為全球企業(yè)尋得云時代的確定性呢?答案是運(yùn)維團(tuán)隊。

過去,我們普遍認(rèn)為運(yùn)維應(yīng)該是消防員,哪里著火撲滅哪里;但在云時代的浩瀚業(yè)務(wù)與海量數(shù)據(jù)面前,這種模式顯然杯水車薪。于是,SRE應(yīng)運(yùn)而生,云服務(wù)商和企業(yè)用戶開始追尋確定性的運(yùn)維價值。運(yùn)維人需要成為“云上的建筑師”,去設(shè)計可靠的建筑結(jié)構(gòu),去預(yù)知建筑可能面臨的種種風(fēng)險,去構(gòu)建安全與穩(wěn)定的結(jié)構(gòu)閉環(huán)。

在這樣的背景下,華為云SRE團(tuán)隊,是國內(nèi)成長最快、發(fā)展最好的SRE團(tuán)隊之一。他們不僅肩負(fù)起了華為云業(yè)務(wù)體系的運(yùn)維確定性,同時還為行業(yè)帶來了充沛的溢出價值。

今天,我們走進(jìn)華為云SRE,去了解一個運(yùn)維人從消防員變成建筑師的故事,一個如何成為“云上的米開朗基羅”的故事。

圖紙之下:不確定性疊加的云紀(jì)元

SRE,即Site Reliability Engineering,站點可用性工程師。這個概念起源于2003年,主要針對傳統(tǒng)IT運(yùn)維中人工為主的操作模式,希望以整體設(shè)計、自動化工具取而代之。簡單來說,SRE的核心就是用軟件而非人工,來解決運(yùn)維與安全問題。

當(dāng)時代的鐘擺悄悄回蕩,SRE的價值愈發(fā)凸顯了出來。因為在不經(jīng)然中,我們已經(jīng)來到了一個不確定性疊加的云紀(jì)元。

一個全云化的業(yè)務(wù)與服務(wù)系統(tǒng),究竟會面臨多少安全問題?可能誰也無法給出精準(zhǔn)答案。網(wǎng)絡(luò)異常、軟件故障、流量洪峰、硬件老化、機(jī)房斷電,都可能帶來一次運(yùn)維問題。甚至一次技術(shù)人員的崗位調(diào)換,都可能造成意想不到的考驗。

而伴隨著云原生的落地,云上承載的軟件開發(fā)與業(yè)務(wù)上新更加頻繁。增加新的業(yè)務(wù)模塊,也將考驗現(xiàn)網(wǎng)的穩(wěn)定性與可靠性。隨著云上軟件開發(fā)與業(yè)務(wù)迭代成為常態(tài),運(yùn)維效率會成為考驗運(yùn)維團(tuán)隊與運(yùn)維能力的最大難題。

另一個云時代的不確定性,來自云計算網(wǎng)絡(luò)急速發(fā)展。隨著現(xiàn)網(wǎng)規(guī)模的不斷壯大,云服務(wù)體系連接的計算節(jié)點、用戶節(jié)點都在不斷增多,同時參加運(yùn)維的人員規(guī)模也在不斷增加。這種網(wǎng)絡(luò)規(guī)模擴(kuò)張,讓運(yùn)維不確定性呈現(xiàn)出幾何級增長。傳統(tǒng)意義上“頭疼醫(yī)頭,腳疼醫(yī)腳”的運(yùn)維模式,將難以抵御網(wǎng)絡(luò)規(guī)模的海量沖擊。

這種情況下,就需要有一種工程性的方法,可以在承認(rèn)這種不確定性的前提下,依舊能夠保障云服務(wù)體系的穩(wěn)定可靠。比如說,讓運(yùn)維能力參與到前端設(shè)計中來;強(qiáng)化運(yùn)行中的動態(tài)風(fēng)險治理;建設(shè)高可用,可用容納故障與風(fēng)險的業(yè)務(wù)架構(gòu)——這些方法的統(tǒng)合,就是SRE。

或許可以這樣理解,SRE就像是在充滿不確定性的云時代,畫上一張確定性的建筑圖紙。它不是具體解決哪個運(yùn)維安全問題,而是帶來宏觀的安全與可靠。

華為云SRE,就是看到了這種必然趨勢,同時積極進(jìn)行了嘗試與探索。

建筑師的眼與手:先一步成長的華為云SRE

未來,云計算將會像水、電一樣觸手可及,隨取隨得。這個結(jié)論可以推導(dǎo)出一個必然:云計算體系,必須像電網(wǎng)、水網(wǎng)一樣安全可靠。如今,我們再也不會常備蠟燭,預(yù)防停電。這背后的努力,是電網(wǎng)進(jìn)行了大量運(yùn)維工作來保障高可用——云計算也將如此。

在華為云的眼中,這個結(jié)論清晰可見。于是華為云自成立的那一天起,就成立了SRE團(tuán)隊。SRE負(fù)責(zé)維護(hù)華為云的整體質(zhì)量,看護(hù)整個云計算網(wǎng)絡(luò)的安全與穩(wěn)定運(yùn)行。

16bb1b23b7bc4673ab8025e770df2896~tplv-tt-shrink:640:0.image

(在新華社智庫《中國云計算創(chuàng)新活力報告》中,華為云斬獲安全可靠能力排名第一)

如今,華為云SRE這位建筑師,已經(jīng)用雙手畫出了一張宏偉的“確定性”建筑圖紙。在全球范圍內(nèi),支撐著華為云在全球170多個國家和地區(qū),超過240個云服務(wù)、370萬開發(fā)者和海量企業(yè)業(yè)務(wù),以及百萬級別的節(jié)點實例。這樣龐大的業(yè)務(wù)藍(lán)圖,都需要SRE團(tuán)隊統(tǒng)一參與開發(fā)與部署規(guī)范,確保上線運(yùn)維安全。

在這個過程中,華為云SRE的“看家法寶”,就是構(gòu)筑了華為云的高可用架構(gòu),讓云服務(wù)在產(chǎn)品開發(fā)的前端就具備高可靠、高可用特性。整體而言,高可用結(jié)構(gòu)在應(yīng)對故障時可分為三個維度考量:首先是軟件具有確定性的失效率,確保不會頻繁發(fā)生故障,將軟件問題控制在一定范圍之內(nèi);其次是給出確定性的恢復(fù)時長,明確可以在怎樣的時間之內(nèi)進(jìn)行業(yè)務(wù)恢復(fù);接下來是構(gòu)筑確定性的爆炸半徑,確保單點的故障擴(kuò)散范圍有限,只影響到很小的范圍,而不影響整體業(yè)務(wù)。

在這樣的架構(gòu)下,最終華為云SRE實現(xiàn)了將可靠性、可恢復(fù)性、影響范圍控制的特性全面融入,真正面向萬千企業(yè)提供安全、可靠、高質(zhì)量的服務(wù)承諾。從實際結(jié)果來看,在近幾年華為云業(yè)務(wù)高速發(fā)展的同時,其出現(xiàn)的故障概率與故障烈度顯著低于全球主流云廠商?;蛟S可以說,華為云SRE的運(yùn)維能力做到了與公司業(yè)務(wù)規(guī)模一同成長,甚至先一步成長。

米開朗基羅的“溢出”效應(yīng):讓千萬企業(yè)從SRE中受益

我們知道,數(shù)字化技術(shù)會在發(fā)展到一定程度時,出現(xiàn)明顯的“溢出”效應(yīng)。比如說數(shù)字化價值賦能,就從虛擬經(jīng)濟(jì)溢出到實體經(jīng)濟(jì),帶來了“數(shù)實融合”的發(fā)展契機(jī)。

對于華為云SRE“建筑師”們而言,其也在云上運(yùn)維的探索上展現(xiàn)出了明顯的“溢出”效應(yīng)。

華為云SRE的基礎(chǔ)價值,就是通過確保華為云服務(wù)與網(wǎng)絡(luò)的穩(wěn)定,帶給客戶更好、更優(yōu)質(zhì)的云體驗,尤其是在Devops 的場景下,保障了華為云用戶敏捷創(chuàng)新、快速迭代的開發(fā)模式。讓用戶不僅能夠上云,還可以有質(zhì)量地用云、有保障地用好云。

再向前走一步,華為云SRE通過服務(wù)客戶與無數(shù)應(yīng)用的經(jīng)驗總結(jié),提出了“確定性運(yùn)維”的發(fā)展方向與方法論,繼而梳理出適用于云上業(yè)務(wù)的“確定性運(yùn)維”能力體系和成熟度模型,供千行百業(yè)的企業(yè)進(jìn)行參考。

這一業(yè)界獨有“確定性運(yùn)維”能力體系成熟度模型包含:第一級基本運(yùn)維,即基礎(chǔ)運(yùn)維的能力構(gòu)建,以此確保業(yè)務(wù)基本生存;第二級標(biāo)準(zhǔn)化運(yùn)維,其能夠?qū)⑦\(yùn)維帶到更加規(guī)律、規(guī)范的發(fā)展階段,確保業(yè)務(wù)的穩(wěn)定可靠;第三級SRE轉(zhuǎn)型,意味著運(yùn)維團(tuán)隊開始從“消防員”轉(zhuǎn)型為“建筑師”,開始勾勒整體的確定性運(yùn)維藍(lán)圖;在第四級,企業(yè)獲得SRE帶來的初步確定性,而到第五級企業(yè)將獲得高度確定性。

a9f46cf67d934e22a7e13c2f9dd12a0a~tplv-tt-shrink:640:0.image

在可見的未來,大部分企業(yè)都會上云,每一家企業(yè)都需要開發(fā)、運(yùn)營軟件的時代里,確定性運(yùn)維可以說是一種剛性需求。即使每家企業(yè)的業(yè)務(wù)訴求與業(yè)務(wù)種類不同,但對穩(wěn)定可靠的追求其實是高度統(tǒng)一的。

面向這一趨勢,華為云SRE的一系列自我成長,都可以變成賦能萬千企業(yè)的成熟價值。比如,通過智能運(yùn)維工具提升組織的效率和可靠性;通過全質(zhì)量管理的流程理念,形成組織人員管理的可控性;運(yùn)維團(tuán)隊變成設(shè)計師,參與前端標(biāo)準(zhǔn)設(shè)計,構(gòu)筑高可用架構(gòu)。

這些由華為云SRE綜合和探索出的技術(shù)與方法,或許是每一家企業(yè)的決策者、管理者,都應(yīng)該看到的現(xiàn)實價值。

在全云化紀(jì)元,每家企業(yè)都需要運(yùn)維能力的提升,那或許每家企業(yè)也都可以成為“云上的米開朗基羅”。SRE的核心文化,依舊需要各界攜手去探索和發(fā)揚(yáng)。但就像運(yùn)維所需的確定性那樣,SRE探索對每家企業(yè)的未來價值來說,也是充滿確定性的。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)字化
    +關(guān)注

    關(guān)注

    8

    文章

    8799

    瀏覽量

    61950
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2653

    瀏覽量

    17496
收藏 人收藏

    評論

    相關(guān)推薦

    華為 Flexus 服務(wù)器 X 實例的快速入門與配置指南

    讀者介紹 Flexus 服務(wù)器 X 實例的快速入門和配置指南,幫助他們更好地利用華為的強(qiáng)大功能。 華為
    的頭像 發(fā)表于 01-13 11:11 ?75次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X 實例的快速入門與配置指南

    華為 Flexus 服務(wù)器 X 實例的使用教程

    引言 選擇款性價比高、性能強(qiáng)勁的服務(wù)器是 IT 技術(shù)人員常面臨的問題。華為的 Flexus 服務(wù)器 X 實例是
    的頭像 發(fā)表于 12-30 09:16 ?222次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X 實例的使用教程

    技術(shù)升級:探索華為 EulerOS 與 Flexus X 實例如何完美融合快速部署 Django

    ,我們將目光聚焦于華為 EulerOS 操作系統(tǒng)與 Flexus X 實例的深度融合,探討如何在這強(qiáng)大組合下實現(xiàn) Django 服務(wù)的快速部署。本文將帶你領(lǐng)略
    的頭像 發(fā)表于 12-25 17:50 ?199次閱讀
    技術(shù)升級:探索<b class='flag-5'>華為</b><b class='flag-5'>云</b> EulerOS 與 Flexus X 實例如何完美融合快速部署 Django

    華為 Flexus 服務(wù)器 X 實例的購買及使用體驗

    前言 隨著計算的不斷發(fā)展,服務(wù)的使用變得越來越方便。它不僅提高了我們的工作效率,還幫助我們提升了技術(shù)能力,增強(qiáng)了在職場中的競爭力。華為 Flexus 是
    的頭像 發(fā)表于 12-24 17:26 ?179次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X 實例的購買及使用體驗

    鼎科技與華為簽約化工工藝優(yōu)化合作

    近日,華為城市大會·青島暨華為華東(青島)數(shù)據(jù)中心開服活動盛大舉行。作為華為公司的全面戰(zhàn)略伙伴,
    的頭像 發(fā)表于 12-09 13:55 ?399次閱讀

    亞洲唯!華為入選 Gartner?應(yīng)用平臺魔力象限

    近日,Gartner?發(fā)布了首份《Magic Quadrant?for Cloud Application Platforms》報告,華為憑借應(yīng)用運(yùn)行平臺入選該魔力象限,也是亞洲唯入選廠商
    的頭像 發(fā)表于 12-01 16:13 ?451次閱讀

    智慧公交是什么?帶你詳解智慧公交的解決方案!

    智慧公交是什么?帶你詳解智慧公交的解決方案!
    的頭像 發(fā)表于 11-05 12:26 ?335次閱讀
    智慧公交是什么?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b>詳解智慧公交的解決方案!

    請問ESP是否支持LiteOS+華為IOT+AT的方式?

    我們想使用ESP32 AT模式連接華為IOT平臺,并且ESP32要運(yùn)行LiteOS,請問現(xiàn)在ESP32支持這個功能嗎
    發(fā)表于 07-19 07:32

    華為 618 營銷季進(jìn)行中,實測華為協(xié)同辦公產(chǎn)品有多值!

    ,起詳細(xì)看看它們能為中小企業(yè)帶來哪些數(shù)字辦公新體驗吧。 華為云云桌面,輕松開啟上辦公 作為家領(lǐng)先的計算服務(wù)提供商,
    的頭像 發(fā)表于 07-01 14:43 ?324次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> 618 營銷季進(jìn)行中,實測<b class='flag-5'>華為</b><b class='flag-5'>云</b>協(xié)同辦公產(chǎn)品有多值!

    軟通動力攜手華為共創(chuàng)智能新產(chǎn)業(yè)

    華為開發(fā)者大會2024期間,華為召開“紅火生態(tài),華為攜手伙伴贏領(lǐng)智能新產(chǎn)業(yè)”高峰論壇,重磅
    的頭像 發(fā)表于 06-27 09:56 ?629次閱讀

    華為昇騰AI服務(wù)可適配100多個大模型

    在近日舉辦的華為開發(fā)者大會2024上,華為常務(wù)董事、華為CEO張平安向全球開發(fā)者們宣布了項重大進(jìn)展——
    的頭像 發(fā)表于 06-24 10:49 ?778次閱讀

    華為HDC 2024看點 華為盤古大模型5.0正式發(fā)布

    華為開發(fā)者大會2024(HDC 2024)上,華為常務(wù)董事、華為CEO張平安正式發(fā)布盤古大模型5.0,在全系列、多模態(tài)、強(qiáng)思維三個方面全新升級;張平安還分享了盤古大模型在自動駕駛、
    的頭像 發(fā)表于 06-23 11:41 ?1379次閱讀
    <b class='flag-5'>華為</b>HDC 2024看點  <b class='flag-5'>華為</b><b class='flag-5'>云</b>盤古大模型5.0正式發(fā)布

    簡單上步!華為 Flexus 應(yīng)用服務(wù)器 L 實例亮相華為 618 營銷季

    數(shù)智時代,越來越多的中小企業(yè)選擇擁抱云端以面對更復(fù)雜多變的業(yè)務(wù)場景,同時企業(yè)的業(yè)務(wù)運(yùn)營、創(chuàng)新開發(fā)對服務(wù)器等轉(zhuǎn)型工具也提出了更高要求。作為款為中小企業(yè)和開發(fā)者群體“量身打造”的服務(wù)產(chǎn)品,
    的頭像 發(fā)表于 06-13 23:30 ?2459次閱讀
    簡單上<b class='flag-5'>云</b>第<b class='flag-5'>一</b>步!<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus 應(yīng)用服務(wù)器 L 實例亮相<b class='flag-5'>華為</b><b class='flag-5'>云</b> 618 營銷季

    甲骨與谷歌建立合作伙伴

    近日,全球領(lǐng)先的數(shù)據(jù)庫和技術(shù)提供商甲骨(Oracle)與谷歌(Google Cloud)共同宣布建立了項意義深遠(yuǎn)的合作伙伴關(guān)系。這
    的頭像 發(fā)表于 06-12 17:22 ?935次閱讀

    簡單上步!華為耀服務(wù)器 L 實例亮相華為開年采購季

    數(shù)智時代,越來越多的中小企業(yè)選擇擁抱云端以面對更復(fù)雜多變的業(yè)務(wù)場景,同時企業(yè)的業(yè)務(wù)運(yùn)營、創(chuàng)新開發(fā)對服務(wù)器等轉(zhuǎn)型工具也提出了更高要求。作為款為中小企業(yè)和開發(fā)者群體“量身打造”的服務(wù)產(chǎn)品,
    的頭像 發(fā)表于 03-16 15:07 ?386次閱讀
    簡單上<b class='flag-5'>云</b>第<b class='flag-5'>一</b>步!<b class='flag-5'>華為</b><b class='flag-5'>云</b>耀<b class='flag-5'>云</b>服務(wù)器 L 實例亮相<b class='flag-5'>華為</b><b class='flag-5'>云</b>開年采購季