日前,Atlassian中國合作伙伴企業(yè)日活動在上海成功舉辦?;顒右浴?a href="http://www.wenjunhu.com/tags/ai/" target="_blank">AI協(xié)同 創(chuàng)未來——如何利用人工智能提升團(tuán)隊協(xié)作,加速產(chǎn)品交付”為主題,深入探討了AI技術(shù)在團(tuán)隊協(xié)作與產(chǎn)品交付中的創(chuàng)新應(yīng)用與實踐,吸引了眾多業(yè)內(nèi)專家、企業(yè)客戶及技術(shù)開發(fā)者的積極參與。
活動現(xiàn)場,小米集團(tuán)高級SRE孟凡胤帶來《Jira常見問題處理及如何利用AI智能客服提升效率》的精彩演講。演講從小米Jira系統(tǒng)的使用現(xiàn)狀出發(fā),探討分享了API請求及數(shù)據(jù)治理、項目管理中的個性化設(shè)置等運維過程中的挑戰(zhàn)與突破,以及如何利用AI工具,深化AI智能客服應(yīng)用,提高運營效率。
以下為演講回顧(內(nèi)容有精簡優(yōu)化):
大家好,作為Jira的使用方,今天我們主要從運維和運營兩個層面來介紹小米是如何使用Jira系統(tǒng)的。
小米Jira系統(tǒng)的使用現(xiàn)狀
首先,一起來了解下小米Jira系統(tǒng)的使用現(xiàn)狀。
Jira系統(tǒng)承擔(dān)了我們集團(tuán)的手機(jī)、汽車、電視、筆記本和生態(tài)鏈各個產(chǎn)品的bug缺陷管理,以及米粉問題反饋的官方渠道,作為與米粉溝通的橋梁,它在小米內(nèi)部扮演著至關(guān)重要的角色。
當(dāng)前,我們系統(tǒng)的Issue數(shù)量已達(dá)到千萬級別,數(shù)據(jù)量處于業(yè)界頂端,同時項目數(shù)量也達(dá)到了1000+,項目配置復(fù)雜,個性化需求也非常多,這些都對我們的運營團(tuán)隊提出了專業(yè)且嚴(yán)格的要求。隨著業(yè)務(wù)的不斷增長和復(fù)雜性的提高,我們的系統(tǒng)體量已經(jīng)遠(yuǎn)超官方標(biāo)準(zhǔn)產(chǎn)品所建議的體量,這也導(dǎo)致了一系列無法預(yù)知的問題。作為技術(shù)出身的系統(tǒng)SRE,我們致力于保證系統(tǒng)的SLA,確保系統(tǒng)的可用性,提升用戶體驗和員工的工作效率。
在龍智的協(xié)助下,我們?nèi)ツ昊艘荒陼r間,收集了影響系統(tǒng)的三十多個問題,并提出了解決方案。目前,這些方案已經(jīng)落地并產(chǎn)生了顯著效果。
API請求及數(shù)據(jù)治理
我們遇到的第一個問題是API請求和數(shù)據(jù)治理。
隨著數(shù)據(jù)量和用戶開發(fā)請求的持續(xù)增長,我們的Search接口受到大量不規(guī)范的分析請求沖擊。這些請求中的JQL非常不規(guī)范,加上Labels數(shù)量達(dá)到了千萬級別,直接在引擎中搜索的話,很可能導(dǎo)致系統(tǒng)崩潰或嚴(yán)重的OOM問題。
▍應(yīng)對措施1:代理層API限流
對于這一問題,我們首先想讓它有節(jié)制,不讓它惡意請求。我們在nginx上使用lua腳本語言對請求的QPS和IP兩種維度按照時間進(jìn)行封禁。QPS達(dá)到50做一次封禁,右邊是按IP封禁,一秒請求5次,我們會封禁60秒。這樣,我們成功攔截了30%的不規(guī)范請求,緩解了部分API帶來的系統(tǒng)壓力。
▍應(yīng)對措施2:API與web服務(wù)剝離
然而,即便進(jìn)行了限流,大數(shù)據(jù)量的請求仍可能導(dǎo)致集群中的某個節(jié)點OOM,影響用戶訪問。那么假想一下,有沒有可能在集群當(dāng)中將API和Web兩個服務(wù)分開?
在龍智的專業(yè)指導(dǎo)下,我們在7層代理上成功剝離了API和Web服務(wù),確保API請求導(dǎo)致的系統(tǒng)夯住及oom不再影響到前端用戶的訪問和使用。
此外,我們還在集群上增加了狀態(tài)監(jiān)控,如遇到cluster_rmi_connect_fail等異常,會觸發(fā)告警,使我們能夠?qū)崟r掌握集群的狀態(tài)。
▍應(yīng)對措施3:大數(shù)據(jù)治理
盡管采取了上述措施,我們?nèi)晕茨芡耆鉀QAPI請求給系統(tǒng)帶來的壓力,那么就在根源上找,大家最終的訴求就是想要獲取數(shù)據(jù),那是否可以直接給用戶提供數(shù)據(jù)呢?
大家都知道,現(xiàn)在是大數(shù)據(jù)時代,依托集團(tuán)的數(shù)據(jù)工場,我們可以綁定mysql數(shù)據(jù)源,使用Flink SQL實時開發(fā)作業(yè),根據(jù)不同的需求給大家提供實時數(shù)據(jù),這樣,用戶無需再通過Search接口請求數(shù)據(jù),極大地減輕了系統(tǒng)壓力。
這時候有人會問,數(shù)據(jù)推送后,我們怎樣在大數(shù)據(jù)平臺做權(quán)限管控?
對此,我們設(shè)立了專業(yè)的團(tuán)隊和權(quán)限審核平臺,按照project維度開放權(quán)限。這確實需要人工操作,包括創(chuàng)建權(quán)限表、與需求方對接等,以確保數(shù)據(jù)的安全。雖然初期工作量較大,但隨著對工作流程的熟悉和標(biāo)準(zhǔn)化,我們已能復(fù)制和重用部分工作,從而顯著減輕后期的工作量。
▍應(yīng)對措施4:統(tǒng)一webhook推送
在數(shù)據(jù)治理過程中,我們還注意到一個問題:當(dāng)issue被更新或創(chuàng)建時,webhook會推送過多不規(guī)范的消息。為解決這一問題,我們統(tǒng)一了webhook的推送,將其統(tǒng)一到RocketMQ上,用戶可以直接在RocketMQ上進(jìn)行消費。這一舉措不僅規(guī)范了消息推送,還允許用戶基于這些數(shù)據(jù)進(jìn)行二次開發(fā),如消息推送、看板展示和實時數(shù)據(jù)分析等。
這項工作還在持續(xù)實施當(dāng)中,目前,我們已對接了大約三四十個需求,所有數(shù)據(jù)均通過統(tǒng)一的出口進(jìn)行傳輸,同時減少了API請求,大大提高了系統(tǒng)的穩(wěn)定性。這正是我們在運維層面所追求的:確保系統(tǒng)在一個更加規(guī)范、健康的環(huán)境中穩(wěn)定運行。
項目管理中個性化設(shè)置
在系統(tǒng)運維方面,我們?nèi)〉昧撕艽蟮耐黄?。其實Jira最核心的工作還是在系統(tǒng)配置上,Jira系統(tǒng)運營的工作非常的繁瑣且復(fù)雜。接下來,我將介紹一下我們?nèi)绾螌ira運營的工作做精細(xì)化及規(guī)范化管理。
▍統(tǒng)一項目配置,一鍵創(chuàng)建項目
在Jira的運營方面,運營團(tuán)隊大部分都是在配置項目個性化需求,創(chuàng)建項目,導(dǎo)入權(quán)限,導(dǎo)入模版等相關(guān)工作,同產(chǎn)品的project需求也不統(tǒng)一,這些重復(fù)性工作占用了運營團(tuán)隊大量的時間。
面對這一情況,我們拉通了各個項目負(fù)責(zé)人,把同產(chǎn)品(例如手機(jī),筆記本,電視等產(chǎn)品)SPM的需求責(zé)任到一位同學(xué)身上,把項目的配置對齊,進(jìn)行統(tǒng)一規(guī)劃。每個產(chǎn)品對應(yīng)了一個項目模版,由負(fù)責(zé)人在輔助系統(tǒng)平臺長實現(xiàn)一鍵創(chuàng)建項目、模版自動導(dǎo)入、權(quán)限自動導(dǎo)入。最終實現(xiàn)了統(tǒng)一需求、統(tǒng)一項目模版、統(tǒng)一權(quán)限,大大減少了運營工作量,提高了工作效率。
▍跨服務(wù)器Clone插件
集團(tuán)中有多套Jira系統(tǒng),但是系統(tǒng)之間的數(shù)據(jù)無法做到互通。為此,龍智為小米定制了跨服務(wù)器Clone插件。該插件通過混合使用Jira的JavaAPI、標(biāo)準(zhǔn)RestAPI和自定義RestAPI,實現(xiàn)了多個Jira服務(wù)器之間的Issue克隆及信息同步。
其主要功能有:
靈活的配置模式:支持多個Jira服務(wù)器之間的連接配置
支持統(tǒng)一認(rèn)證:支持多個Jira服務(wù)器之間的SSO認(rèn)證,保障各服務(wù)器之間的數(shù)據(jù)交互安全
全方位的業(yè)務(wù)映射:支持項目、問題類型、字段及字段默認(rèn)值等多個維度的映射,保證不同部門之間的無縫協(xié)作
克隆信息展示:在Issue界面中展示對端服務(wù)器的克隆Issue信息,支持一鍵免登錄跳轉(zhuǎn)至對端服務(wù)器對應(yīng)Issue界面,極大提升了工作效率
實時數(shù)據(jù)同步:克隆Issue有任何一方信息發(fā)生變更都會實時同步至對方,保證數(shù)據(jù)同步的時效性
AI智能客服提高運營效率
最后,為大家介紹一下我們的AI智能客服。在日常的Jira運營中,我們面臨著大量高重復(fù)性的用戶咨詢問題,Jira運營的同學(xué)逐一回答是需要付出很多的時間成本。小米一直非常重視知識庫的建設(shè),截至目前,我們的運營相關(guān)文檔已達(dá)百余篇。
那么,如何將這這么多的文章快速、準(zhǔn)確地傳遞給用戶?這是一個難題。傳統(tǒng)的機(jī)器人客服雖然可以推送相關(guān)知識,但往往無法提供精確、滿意的回答,導(dǎo)致用戶仍然需要花時間去篩選和尋找答案。
我們做的是讓機(jī)器人代替運營人員回答用戶的問題。
我們的AI客服解決方案利用大模型技術(shù),將知識庫和用戶問題轉(zhuǎn)化為語義向量,通過向量匹配快速給出準(zhǔn)確回答,實現(xiàn)智能客服功能?,F(xiàn)在,我們用戶問題回答的準(zhǔn)確率高達(dá)80%,大大釋放了運營的工作量,并且我們還在不斷收集用戶反饋,優(yōu)化和更新我們的知識庫。
最后,我想說的是,Jira是一個非常有意思的產(chǎn)品,值得我們?nèi)ド钊胪诰?。Jira也是一項需要長期維護(hù)的工程,依靠個人的力量是遠(yuǎn)遠(yuǎn)不夠的,我們也需要與更專業(yè)、更精細(xì)、更系統(tǒng)的團(tuán)隊共同進(jìn)步。也非常感謝龍智提供這次分享的機(jī)會,期待未來我們能夠有更緊密、更專注的合作。
審核編輯 黃宇
-
API
+關(guān)注
關(guān)注
2文章
1507瀏覽量
62219 -
AI
+關(guān)注
關(guān)注
87文章
31294瀏覽量
269654 -
jira
+關(guān)注
關(guān)注
0文章
13瀏覽量
2200
發(fā)布評論請先 登錄
相關(guān)推薦
評論