近期,招商銀行和歐拉開(kāi)源社區(qū)聯(lián)創(chuàng)了A-Ops智能運(yùn)維項(xiàng)目,并在招行coremail郵件系統(tǒng)中完成測(cè)試。測(cè)試結(jié)果顯示,A-Ops極大地提升了網(wǎng)絡(luò)連接丟包、錯(cuò)包、重傳以及時(shí)延增大等系統(tǒng)網(wǎng)絡(luò)問(wèn)題的界定效率。
背景隨著業(yè)務(wù)系統(tǒng)規(guī)模的增長(zhǎng),對(duì)于配置和架構(gòu)的管理,難度也指數(shù)級(jí)上升。對(duì)于配置管理,個(gè)體對(duì)配置的修改無(wú)法主動(dòng)發(fā)現(xiàn),不合規(guī)項(xiàng)掃描不全,為系統(tǒng)運(yùn)行帶來(lái)隱患;對(duì)于架構(gòu)管理,自身及三方軟件間的關(guān)系主要依賴(lài)管理員的經(jīng)驗(yàn),變更影響難以評(píng)估,排障困難。我們希望有一套機(jī)制,能夠自動(dòng)溯源配置,識(shí)別配置管理的不合規(guī)項(xiàng)以及非預(yù)期修改;同時(shí)自動(dòng)感知架構(gòu),識(shí)別完整的架構(gòu)圖,包括組件、實(shí)例、訪問(wèn)關(guān)系等,在系統(tǒng)異常時(shí)及時(shí)發(fā)現(xiàn)并定界,快速消除風(fēng)險(xiǎn)。
團(tuán)隊(duì)介紹參與本次聯(lián)創(chuàng)的團(tuán)隊(duì)來(lái)自招商銀行信息技術(shù)部數(shù)據(jù)中心,招商銀行為A-Ops智能運(yùn)維項(xiàng)目提供了真實(shí)的業(yè)務(wù)場(chǎng)景進(jìn)行原型驗(yàn)證,團(tuán)隊(duì)和openEuler A-Ops SIG組成員共同完成了包括前期的需求調(diào)研、功能確認(rèn),以及之后的問(wèn)題解決、聯(lián)調(diào)測(cè)試等過(guò)程。
聯(lián)創(chuàng)成果檢查配置差異
在coremail郵件系統(tǒng)集群環(huán)境中修改某些主機(jī)的配置文件,A-Ops能夠獲取實(shí)際配置和預(yù)期配置的差異,并獲取差異內(nèi)容;幫助運(yùn)維人員快速判斷問(wèn)題邊界是否由配置引起,如果是則下發(fā)正確配置到指定主機(jī)上,快速解決配置異常導(dǎo)致的系統(tǒng)問(wèn)題。
某主機(jī)配置與預(yù)期配置差異圖
實(shí)時(shí)繪制系統(tǒng)拓?fù)洌?/p>
在coremail郵件系統(tǒng)測(cè)試系統(tǒng)登錄、發(fā)信、收信等流程,通過(guò)A-Ops能夠?qū)崟r(shí)捕獲系統(tǒng)連接情況并繪制郵件系統(tǒng)業(yè)務(wù)流拓?fù)鋱D(已和相關(guān)人確認(rèn)符合預(yù)期);運(yùn)維人員能夠快速識(shí)別系統(tǒng)中的實(shí)例以及依賴(lài)關(guān)系等。
登錄系統(tǒng)的實(shí)時(shí)拓?fù)鋱D
快速問(wèn)題界定:
我們?cè)卩]件系統(tǒng)注入了時(shí)延增大、丟包等故障,由實(shí)時(shí)拓?fù)鋱D可以看出可能的問(wèn)題鏈路已經(jīng)被標(biāo)紅;運(yùn)維人員因而能夠快速界定問(wèn)題節(jié)點(diǎn),并根據(jù)異常信息進(jìn)一步進(jìn)行問(wèn)題定位解決。
注入故障后的實(shí)時(shí)拓?fù)鋱D
現(xiàn)在的異常檢測(cè)是基于閾值(專(zhuān)家經(jīng)驗(yàn))的,后續(xù)會(huì)增加基于AI算法的的異常檢測(cè)功能,并支持算法擴(kuò)展。后續(xù)招商銀行將和A-Ops項(xiàng)目組一起,在現(xiàn)有基礎(chǔ)上完善異常檢測(cè)能力、增加根因定位功能,實(shí)現(xiàn)自動(dòng)問(wèn)題根因定位;并在招行其他系統(tǒng)推廣運(yùn)行,實(shí)現(xiàn)系統(tǒng)問(wèn)題快速定位定界。
A-Ops簡(jiǎn)介A-Ops智能運(yùn)維平臺(tái)專(zhuān)為企業(yè)簡(jiǎn)化云系統(tǒng)治理復(fù)雜度,加速企業(yè)數(shù)字化改造過(guò)程。主要特征包括:
智能觀測(cè),能夠基于AI精準(zhǔn)觀測(cè)基礎(chǔ)設(shè)施;
平臺(tái)化,能夠?qū)崿F(xiàn)系統(tǒng)全棧的智能觀測(cè)與分析;
覆蓋廣泛,能夠覆蓋openEuler系任意類(lèi)型的基礎(chǔ)設(shè)施。
A-OPS智能運(yùn)維平臺(tái)包括:智能探針、架構(gòu)感知、異常感知、異常森林、配置溯源等特性,并提供SaaS服務(wù)。通過(guò)對(duì)基礎(chǔ)設(shè)施的精準(zhǔn)觀測(cè),實(shí)現(xiàn)對(duì)軟件系統(tǒng)架構(gòu)的實(shí)時(shí)全息感知,實(shí)現(xiàn)云環(huán)境下OS因素引起的業(yè)務(wù)性能問(wèn)題1分鐘定界、3分鐘定位。
原文標(biāo)題:招商銀行基于A-Ops智能運(yùn)維構(gòu)建快速定位定界能力
文章出處:【微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269217 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8754瀏覽量
61828 -
openEuler
+關(guān)注
關(guān)注
2文章
316瀏覽量
5897
原文標(biāo)題:招商銀行基于A-Ops智能運(yùn)維構(gòu)建快速定位定界能力
文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論