0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【AIOps】一種全新的日志異常檢測評(píng)估框架:LightAD,相關(guān)成果已被軟工頂會(huì)ICSE 2024錄用

華為DevCloud ? 來源:未知 ? 2023-11-29 17:40 ? 次閱讀
深度學(xué)習(xí)(DL)雖然在日志異常檢測中得到了不少應(yīng)用,但在實(shí)際輕量級(jí)運(yùn)維模型選擇中,必須仔細(xì)考慮異常檢測方法與計(jì)算成本的關(guān)系。具體來說,盡管深度學(xué)習(xí)方法在日志異常檢測方面取得了出色的性能,但它們通常需要更長的時(shí)間來進(jìn)行日志預(yù)處理、模型訓(xùn)練和模型推斷,從而阻礙了它們在需要快速部署日志異常檢測服務(wù)的在線分布式云系統(tǒng)中的采用。


本文對(duì)現(xiàn)有的基于經(jīng)典機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的日志異常檢測方法進(jìn)行了實(shí)證研究,并提出了一種自動(dòng)化日志異常檢測評(píng)估框架LightAD。


1. 日志異常檢測介紹

日志是AIOps領(lǐng)域需要處理的常見數(shù)據(jù),是程序運(yùn)行過程中由代碼打印出的一些非結(jié)構(gòu)化的文本信息,日志通常由時(shí)間戳和文本信息組成。日志實(shí)時(shí)記錄了系統(tǒng)的運(yùn)行狀態(tài),包括正常運(yùn)行狀態(tài)和故障發(fā)生時(shí)的狀態(tài)。因此通過收集和分析日志,可以快速檢測和定位出系統(tǒng)中存在的異常。


本文研究了深度學(xué)習(xí)方法在日志異常檢測中與更簡單技術(shù)相比的優(yōu)越性,在五個(gè)公共的日志異常檢測數(shù)據(jù)集上對(duì)輕量級(jí)傳統(tǒng)機(jī)器學(xué)習(xí)方法(如KNN、SLFN)和深度學(xué)習(xí)方法(如CNN、NeuralLog)進(jìn)行了全面的評(píng)估。


本文的研究結(jié)果表明,通過合適的數(shù)據(jù)處理方式,輕量級(jí)機(jī)器學(xué)習(xí)方法能夠在時(shí)間效率和準(zhǔn)確性方面都優(yōu)于深度學(xué)習(xí)方法。為了評(píng)估深度學(xué)習(xí)方法的必要性,本文提出了一種自動(dòng)化的日志異常檢測模型評(píng)估框架LightAD。LightAD是一種基于貝葉斯優(yōu)化器的優(yōu)化訓(xùn)練時(shí)間、推斷時(shí)間和性能得分的評(píng)估框架。通過自動(dòng)化超參數(shù)調(diào)優(yōu),LightAD可以實(shí)現(xiàn)在日志異常檢測模型之間進(jìn)行公正的比較,使運(yùn)維工程師能夠針對(duì)不同的在線異常檢測目標(biāo)來選擇合適的異常檢測模型。


2. 對(duì)現(xiàn)有方法的全面評(píng)估

深度學(xué)習(xí)方法除了本身擁有更多的參數(shù)量外,其使用的數(shù)據(jù)處理方式通常也比較耗時(shí)。例如,CNN方法需要使用日志解析工具對(duì)日志進(jìn)行解析,NeuralLog需要用深度語言模型BERT來對(duì)日志進(jìn)行處理。本文對(duì)輕量級(jí)傳統(tǒng)機(jī)器學(xué)習(xí)方法采用了更高效的日志處理方式。


具體而言,本文在處理以日志塊來聚合的數(shù)據(jù)集(如HDFS)時(shí),從每個(gè)文本日志消息中提取標(biāo)記,以空格分隔,并刪除包含數(shù)字的標(biāo)記。本文使用每個(gè)塊的ID將日志消息分組成日志序列,并用事件頻率對(duì)其進(jìn)行編碼。整個(gè)預(yù)處理工作流程如下圖所示。


3. 全新的日志異常檢測評(píng)估框架:LightAD

為全面綜合評(píng)估日志異常檢測算法,本文提出了基于貝葉斯優(yōu)化起的自動(dòng)化算法優(yōu)化和評(píng)估框架LightAD,LightAD結(jié)構(gòu)如下圖所示。本文首先準(zhǔn)備了一組簡單的基準(zhǔn)模型及其初始的超參數(shù)空間,對(duì)于每個(gè)模型,本文會(huì)自動(dòng)化的優(yōu)化模型的超參數(shù)。通過綜合考慮三個(gè)維度的模型收益打分:

(1)準(zhǔn)確性

(2)每個(gè)日志序列的訓(xùn)練時(shí)間

(3)每個(gè)日志序列的推斷時(shí)間

最終抉擇出模型收益分?jǐn)?shù)最高的異常檢測算法。

模型收益的多目標(biāo)優(yōu)化公式如下:

下圖是在去除重復(fù)數(shù)據(jù)的HDFS數(shù)據(jù)集上使用LightAD進(jìn)行異常檢測方法優(yōu)化和評(píng)估的結(jié)果,最高模型收益的分?jǐn)?shù)由黑色加粗標(biāo)識(shí)。從圖中可以看出,LightAD挑選出的模型都是輕量級(jí)的機(jī)器學(xué)習(xí)方法。

4.總結(jié)

本文來自華為云PaaS技術(shù)創(chuàng)新Lab和香港中文大學(xué)(深圳)賀品嘉助理教授團(tuán)隊(duì)合作項(xiàng)目成果產(chǎn)出,相關(guān)研究成果已被軟件工程領(lǐng)域頂會(huì)ICSE 2024(CCF A類)正式錄用,文章詳細(xì)內(nèi)容即將公開,敬請關(guān)注。


文章來自 PaaS技術(shù)創(chuàng)新Lab,PaaS技術(shù)創(chuàng)新Lab隸屬于華為云,致力于綜合利用軟件分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù),為軟件研發(fā)人員提供下一代智能研發(fā)工具服務(wù)的核心引擎和智慧大腦。我們將聚焦軟件工程領(lǐng)域硬核能力,不斷構(gòu)筑研發(fā)利器,持續(xù)交付高價(jià)值商業(yè)特性!加入我們,一起開創(chuàng)研發(fā)新“境界”!


詳情歡迎聯(lián)系:

mayuchi1@huawei.com;bianpan@huawei.com



?戳“閱讀原文”,直達(dá)PaaS技術(shù)創(chuàng)新Lab!


原文標(biāo)題:【AIOps】一種全新的日志異常檢測評(píng)估框架:LightAD,相關(guān)成果已被軟工頂會(huì)ICSE 2024錄用

文章出處:【微信公眾號(hào):華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    35034

    瀏覽量

    255087

原文標(biāo)題:【AIOps】一種全新的日志異常檢測評(píng)估框架:LightAD,相關(guān)成果已被軟工頂會(huì)ICSE 2024錄用

文章出處:【微信號(hào):華為DevCloud,微信公眾號(hào):華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DevEcoStudio 中使用模擬器時(shí)如何過濾日志

    的使用統(tǒng)計(jì)等。這些信息有助于開發(fā)者了解模擬器的整體運(yùn)行狀況,判斷是否存在資源瓶頸或系統(tǒng)異常。 應(yīng)用相關(guān)日志:當(dāng)在模擬器中運(yùn)行應(yīng)用程序時(shí),會(huì)記錄應(yīng)用的啟動(dòng)、暫停、恢復(fù)、銷毀等生命周期事
    發(fā)表于 05-23 10:46

    提高IT運(yùn)維效率,深度解讀京東云AIOps落地實(shí)踐(異常檢測篇)

    一種無閾值方法:基于 LSTM 網(wǎng)絡(luò)的基線(個(gè) LSTM 框架輔助幾個(gè)優(yōu)化步驟)和無監(jiān)督檢測(神經(jīng)網(wǎng)絡(luò)和多種機(jī)器學(xué)習(xí)算法的組合)協(xié)同綜合分析時(shí)間序列。當(dāng)時(shí)間序列顯示出清晰的周期性形
    的頭像 發(fā)表于 05-22 16:38 ?308次閱讀
    提高IT運(yùn)維效率,深度解讀京東云<b class='flag-5'>AIOps</b>落地實(shí)踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>篇)

    一種實(shí)時(shí)多線程VSLAM框架vS-Graphs介紹

    針對(duì)現(xiàn)有VSLAM系統(tǒng)語義表達(dá)不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實(shí)時(shí)多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實(shí)驗(yàn)表明
    的頭像 發(fā)表于 04-19 14:07 ?273次閱讀
    <b class='flag-5'>一種</b>實(shí)時(shí)多線程VSLAM<b class='flag-5'>框架</b>vS-Graphs介紹

    DLPCRC900EVM評(píng)估板USB接口J7工作異常的原因?

    ,但是評(píng)估板本身應(yīng)該是可以正常工作的(電源燈常亮、狀態(tài)燈直閃爍)。分析USB部分電路圖后,結(jié)論如下: 0、評(píng)估板之前是可以正常工作的,不清楚是否是反復(fù)插拔USB線纜的原因,造成了該部分電路
    發(fā)表于 02-17 06:35

    科技2024年業(yè)績大幅增長

    近日,匯科技發(fā)布了2024年年度業(yè)績預(yù)告,數(shù)據(jù)表明,公司歸屬于母公司所有者的凈利潤預(yù)計(jì)將達(dá)到55000萬元至64000萬元區(qū)間,與上年度相比,實(shí)現(xiàn)了233.22%到287.75%的驚人增長幅度
    的頭像 發(fā)表于 02-08 15:29 ?747次閱讀

    OpenHarmony程序分析框架論文入選ICSE 2025

      近日,ICSE 2025軟件工程實(shí)踐Track放榜,面向OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)的ArkTS程序分析基礎(chǔ)框架--方舟程序分析器(論文題目為
    的頭像 發(fā)表于 01-02 13:41 ?973次閱讀
    OpenHarmony程序分析<b class='flag-5'>框架</b>論文入選<b class='flag-5'>ICSE</b> 2025

    睿馳生態(tài)伙伴出席2024睿馳新品發(fā)布會(huì),共同探討AIDV時(shí)代下的融合創(chuàng)新與生態(tài)共贏

    2024年12月8日,以“AI驅(qū)動(dòng)智領(lǐng)未來”為主題的2024睿馳新品發(fā)布會(huì)在上海成功舉辦,匯聚了眾多來自全球車企以及生態(tài)合作伙伴的相關(guān)負(fù)責(zé)人,共同探討AI定義汽車時(shí)代下的技術(shù)創(chuàng)新與
    的頭像 發(fā)表于 12-16 14:29 ?487次閱讀
    東<b class='flag-5'>軟</b>睿馳生態(tài)伙伴出席<b class='flag-5'>2024</b>東<b class='flag-5'>軟</b>睿馳新品發(fā)布<b class='flag-5'>會(huì)</b>,共同探討AIDV時(shí)代下的融合創(chuàng)新與生態(tài)共贏

    通動(dòng)力入選新華社年度智能零碳成果

    近日,通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(簡稱:通動(dòng)力,301236.SZ)憑借領(lǐng)先的ESG和雙碳科技創(chuàng)新實(shí)踐成果硬核實(shí)力,成功登榜新華社“2023-2024智能·零碳
    的頭像 發(fā)表于 12-11 14:08 ?459次閱讀

    BlackBerry QNX亮相東睿馳2024新品發(fā)布會(huì)

    作為基礎(chǔ)軟件操作系統(tǒng)合作伙伴,黑莓QNX受邀參加Neusoft Reach(東睿馳)在上海舉辦的“AI驅(qū)動(dòng) 智領(lǐng)未來”2024新品發(fā)布會(huì)。黑莓QNX助力東睿馳發(fā)布面向AIDV時(shí)代的
    的頭像 發(fā)表于 12-11 14:04 ?771次閱讀

    2024睿馳新品發(fā)布會(huì)圓滿結(jié)束

    近日,以“AI驅(qū)動(dòng) 智領(lǐng)未來”為主題的2024睿馳新品發(fā)布會(huì)在上海成功舉辦,本次大會(huì)聚集了政府相關(guān)部門、行業(yè)組織的領(lǐng)導(dǎo)和專家、頭部車企領(lǐng)袖及產(chǎn)業(yè)鏈重要合作伙伴相關(guān)負(fù)責(zé)人共200余人
    的頭像 發(fā)表于 12-10 11:01 ?658次閱讀

    一種讓你的MCU日志可無線查看和實(shí)時(shí)記錄跟蹤的方法

    想象下你是位批量設(shè)備的管理員,這些設(shè)備分布在市面上的各個(gè)環(huán)境下,如在屋頂上的光照設(shè)備,在充電樁的充電設(shè)備,在火車站汽車站的共享設(shè)備等等;當(dāng)這些設(shè)備有異常的時(shí)候你是如何查看設(shè)備日志
    的頭像 發(fā)表于 11-17 01:01 ?785次閱讀
    <b class='flag-5'>一種</b>讓你的MCU<b class='flag-5'>日志</b>可無線查看和實(shí)時(shí)記錄跟蹤的方法

    通動(dòng)力榮獲2024鯤鵬應(yīng)用創(chuàng)新大賽金獎(jiǎng)

    近日,在2024智能發(fā)展會(huì)議暨華為數(shù)字中國行西安雁塔新質(zhì)生產(chǎn)力大會(huì)上,鯤鵬應(yīng)用創(chuàng)新大賽2024陜西賽區(qū)決賽結(jié)果正式揭曉,通動(dòng)力榮獲鯤鵬原生開發(fā)賽道金獎(jiǎng)。這也是繼在華為全聯(lián)接大會(huì)
    的頭像 發(fā)表于 11-08 17:39 ?793次閱讀

    日志框架簡介-Slf4j+Logback入門實(shí)踐

    結(jié)果不受日志的有無影響,但沒有日志的應(yīng)用程序是不完整的,甚至可以說是有缺陷的。優(yōu)秀的日志系統(tǒng)可以 記錄操作軌跡 、 監(jiān)控系統(tǒng)運(yùn)行狀態(tài) 和 解決系統(tǒng)故障 。 Java 日志
    的頭像 發(fā)表于 07-30 10:00 ?1436次閱讀
    <b class='flag-5'>日志</b><b class='flag-5'>框架</b>簡介-Slf4j+Logback入門實(shí)踐

    地平線科研論文入選國際計(jì)算機(jī)視覺會(huì)ECCV 2024

    近日,地平線兩篇論文入選國際計(jì)算機(jī)視覺會(huì)ECCV 2024,自動(dòng)駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1328次閱讀
    地平線科研論文入選國際計(jì)算機(jī)視覺<b class='flag-5'>頂</b><b class='flag-5'>會(huì)</b>ECCV <b class='flag-5'>2024</b>

    鐵威馬教程 如何收集NAS的日志

    時(shí),重啟后TOS網(wǎng)頁的系統(tǒng)報(bào)告缺失相關(guān)日志,不利于異常原因的分析。 故障原因: 當(dāng)TNAS設(shè)備出現(xiàn)宕機(jī)重啟TNAS后,系統(tǒng)相關(guān)部份日志會(huì)被清
    的頭像 發(fā)表于 07-16 18:02 ?883次閱讀
    鐵威馬教程 如何收集NAS的<b class='flag-5'>日志</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品