0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道怎樣在Azure machine learning中使用異常檢測的方法?

8gVR_D1Net08 ? 來源:NL ? 2019-05-09 13:56 ? 次閱讀

正如Azure最新機器學(xué)習(xí)服務(wù)所顯示的那樣,機器學(xué)習(xí)已不再僅僅是關(guān)乎視覺和語音。

微軟在機器學(xué)習(xí)上押下重注的一個關(guān)鍵部分是,這些技術(shù)需要被民主化,并且能夠轉(zhuǎn)變?yōu)橄鄬θ菀桌斫獾臉?gòu)建塊,以便微軟的開發(fā)人員能夠快速學(xué)習(xí)并在自己的應(yīng)用程序中進行使用。

這就是Azure認(rèn)知服務(wù)的用武之地。這些服務(wù)不需要用戶了解ResNet50深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練層次,也不需要了解如何使用TensorFlow或Microsoft Cognitive Toolkit (CNTK)來構(gòu)建學(xué)習(xí)平臺,而僅僅只需要使用API即可。微軟已經(jīng)為這些服務(wù)訓(xùn)練了神經(jīng)網(wǎng)絡(luò),并將繼續(xù)對它們進行優(yōu)化,還將真實世界的操作用來作為未來改進的基礎(chǔ)。與構(gòu)建和運行您自己的機器學(xué)習(xí)算法的計算和存儲成本相比,它們的使用成本則相對低廉。

Azure上的機器學(xué)習(xí)工具已迅速成為了任何想要向應(yīng)用程序添加基本人工智能的人的重要資源。需要注意的是它們的使用范圍依然是有限的,其重點放在了以下三個關(guān)鍵領(lǐng)域:計算機視覺、文本分析和語音識別。它們都是重要的領(lǐng)域,但它們也只是現(xiàn)代機器學(xué)習(xí)的一個有限子集而已。

Azure認(rèn)知服務(wù)

進入了一個新的AI領(lǐng)域

幸運的是,第一個探索機器學(xué)習(xí)在其他方面應(yīng)用的新認(rèn)知服務(wù)也在最近進入了測試階段:將異常檢測添加到了功能集中。異常檢測是一種重要的人工智能工具,用于分析在數(shù)據(jù)源正常運行特征之外的時間序列數(shù)據(jù)。這使得它成為了一個非常靈活的工具,因為現(xiàn)代企業(yè)擁有大量的流數(shù)據(jù),從金融交易到軟件日志再到設(shè)備遙測。顯然,你不應(yīng)低估使用一個API就可以在所有這些不同的數(shù)據(jù)源中工作的能力,因為它使構(gòu)建適當(dāng)?shù)能浖兊酶尤菀琢恕?/span>

正常情況下,異常檢測需要足夠的時間來設(shè)置。您需要使用大量數(shù)據(jù)來對您的模型進行訓(xùn)練,以確定什么是正常操作,什么是異常操作。這就是信用卡欺詐檢測系統(tǒng)是如何建立一個你的消費(以及他們所有客戶的習(xí)慣)模型,以檢測何時使用了被泄密了的卡片,并阻止任何未來的交易,將損失降到最低的。

如果要使這種類型的操作成為通用服務(wù),就需要能夠為發(fā)送到服務(wù)的數(shù)據(jù)類型切換合適的檢測模型。這正是Azure認(rèn)知服務(wù)異常檢測器所采用的方法,它能夠使用一個自適應(yīng)推理引擎來選擇一個適合當(dāng)前時間序列數(shù)據(jù)的檢測模型。

通過在運行時選擇算法,微軟繞過了異常檢測訓(xùn)練成本中最糟糕的部分??赡芩褂玫乃惴ú⒉煌昝溃撬鼘⒈仁褂靡粋€通用規(guī)則引擎來處理異常檢測要好得多。還有一個額外的好處:您不必花費大量的時間來標(biāo)記千兆字節(jié)的訓(xùn)練數(shù)據(jù)了。

構(gòu)建異常檢測應(yīng)用程序

與所有Azure認(rèn)知服務(wù)一樣,異常檢測器也需要一個訂閱密鑰,該密鑰可以在Azure門戶中生成,連同你的訂閱端點URL。微軟還提供了一個運行在Jupyternotebook上的演示服務(wù),您可以使用它在使用您自己的代碼和數(shù)據(jù)之前快速試用該服務(wù)。

實際上,您將通過異步函數(shù)來向服務(wù)端發(fā)送JSON格式的數(shù)據(jù)。如果您正在處理流數(shù)據(jù),您可以在每次更新時發(fā)送一個時間序列數(shù)據(jù)的移動窗口,并檢測序列中最后一段數(shù)據(jù)的異常情況。如果您使用它來分析批處理數(shù)據(jù),那么您將得到數(shù)據(jù)集中已標(biāo)識的異常位置的列表,其中保存著每個數(shù)據(jù)點的布爾值數(shù)組。如果為true,則表示異常,您可以使用任何true值所對應(yīng)的索引來作為您所提供的源數(shù)據(jù)數(shù)組中異常的索引。

使用時間序列數(shù)據(jù)

異常檢測器的工作原理與大多數(shù)Azure平臺服務(wù)類似,它提供了一個REST API來接收J(rèn)SON格式的數(shù)據(jù)。使用C# SDK可以更容易地構(gòu)建代碼來使用該服務(wù);您也可以使用其他語言,但這樣你就需要手工來構(gòu)建REST調(diào)用。

微軟對數(shù)據(jù)格式也有一些限制:數(shù)據(jù)之間的時間間隔必須是固定的,雖然系統(tǒng)可以接受丟失最多10%預(yù)期點的數(shù)據(jù),但最好確保您的數(shù)據(jù)是完整的。如果要交付具有清晰模式的數(shù)據(jù),則批處理中的數(shù)據(jù)點的數(shù)量可能會有所不同。數(shù)據(jù)集中至少需要有12個點,最多8,640個點,時間戳使用UTC格式。

您不僅限于在流數(shù)據(jù)上使用異常檢測器;如果使用時間序列數(shù)據(jù)庫來記錄數(shù)據(jù),那么你也可以在所有數(shù)據(jù)上以批處理的方式運行它,但這可能意味著要發(fā)送大量的數(shù)據(jù)。這種方法可以幫助識別過去可能被忽略的問題,例如發(fā)現(xiàn)不正常的金融交易,這些交易是出現(xiàn)欺詐的指標(biāo),或是可能影響整體生產(chǎn)力的機器的持續(xù)問題。在歷史數(shù)據(jù)上運行它可以幫助您獲得所需的信息,以便對您所使用的算法進行微調(diào),從而使其更有可能發(fā)現(xiàn)您特定業(yè)務(wù)中的問題。

調(diào)整異常檢測器

關(guān)于異常檢測API需要注意的一點是:它與其他的認(rèn)知服務(wù)有所不同,因為您可以調(diào)整它處理數(shù)據(jù)的方式。作為JSON請求的一部分,您可以指定數(shù)據(jù)周期的詳細信息、它的粒度以及兩個微調(diào)算法敏感性的選項。其中一個是maxAnomalyRatio,它被用來幫助識別數(shù)據(jù)點是否出現(xiàn)了異常。另一個則是sensitivity,幫助調(diào)整算法的邊際值;數(shù)值越低,邊緣越大,異常檢測的靈敏度則越低。

您的應(yīng)用程序中可能有大量的時間序列數(shù)據(jù),而且通常很難從中提取價值。通過添加一點機器學(xué)習(xí),您就可以開始查看那些不符合正常模式的內(nèi)容了,然后使用這些信息構(gòu)建適當(dāng)?shù)捻憫?yīng)。

這就是為什么使用像Jupyter Notebook這樣的工具來探索結(jié)果,并在將其構(gòu)建為代碼之前對檢測器進行調(diào)優(yōu)是一個好主意的原因了。您首先需要查看發(fā)生了什么異常,并且能夠?qū)⑺鼈兣c需要管理的事件聯(lián)系起來。通過使用交互式筆記本和歷史數(shù)據(jù),您可以從中找到適當(dāng)?shù)南嚓P(guān)性,從而幫助您設(shè)計應(yīng)用程序,以使用接近實時的異常檢測來交付您可以理解的結(jié)果。這時您就可以開始使用異常檢測API來獲得真正的業(yè)務(wù)價值了。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 異常檢測
    +關(guān)注

    關(guān)注

    1

    文章

    42

    瀏覽量

    9743
  • Machine
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    8338
  • Azure
    +關(guān)注

    關(guān)注

    1

    文章

    123

    瀏覽量

    12781

原文標(biāo)題:如何在Azure machine learning中使用異常檢測

文章出處:【微信號:D1Net08,微信公眾號:AI人工智能D1net】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英特爾FPGA 助力Microsoft Azure機器學(xué)習(xí)提供AI推理性能

    Machine Learning SDK 相集成以供預(yù)覽。客戶可以使用 Azure 大規(guī)模部署的英特爾? FPGA(現(xiàn)場可編程邏輯門陣列)技術(shù),為其模型提供行業(yè)領(lǐng)先的人工智能 (AI) 推理性能。
    的頭像 發(fā)表于 05-16 17:25 ?6384次閱讀

    構(gòu)建\"PSOC_Edge_Machine_Learning_Profiler\" 項目,未找到 cy_ml_inference.h文件怎么解決?

    我正試圖構(gòu)建\"PSOC_Edge_Machine_Learning_Profiler\" 項目,但發(fā)現(xiàn)一個錯誤。 其中 cy_ml_inference.h 文件未找到。 請?zhí)峁┇@取該文件的方法
    發(fā)表于 07-23 07:59

    Read#Machine learning methods for wind turbine condition monitoring: A review mat share

    Machine learning methods for wind turbine condition monitoring: A review風(fēng)力發(fā)電機監(jiān)控系統(tǒng)中常用的一些機器學(xué)習(xí)的方法
    發(fā)表于 07-12 07:29

    基于深度學(xué)習(xí)的異常檢測的研究方法

    的研究方法進行了系統(tǒng)而全面的綜述。此外,我們回顧了這些方法不同應(yīng)用領(lǐng)域中的應(yīng)用,并評估了它們的有效性。我們根據(jù)所采用的基本假設(shè)和方法,將最先進的深度
    發(fā)表于 07-12 07:10

    基于深度學(xué)習(xí)的異常檢測的研究方法

    ABSTRACT1.基于深度學(xué)習(xí)的異常檢測的研究方法進行結(jié)構(gòu)化和全面的概述2.回顧這些方法各個領(lǐng)域這個中的應(yīng)用情況,并評估他們的有效性。3
    發(fā)表于 07-12 06:36

    深度異常檢測的應(yīng)用

    9 Applications of Deep Anomaly Detection 深度異常檢測的應(yīng)用9.1 Intrusion Detection9.2 Fraud Detection9.3
    發(fā)表于 07-12 09:18

    MCU也能做Machine learning

    知道嗎?MCU也能做Machine learning (ML)剛剛過去的2018年被稱為“人工智能元年”,2隨著單芯片計算力的不斷增長,機器學(xué)習(xí)(ML)不再是云計算和高性能處理器的專
    發(fā)表于 11-03 06:36

    基于ME-PGNMF的異常流量檢測方法

    意義不明確。針對上述問題,多維信息熵的基礎(chǔ)上,提出梯度投影非負(fù)矩陣分解異常流量檢測方法。將流量數(shù)據(jù)處理為多維特征熵矩陣,用梯度投影非負(fù)矩陣分解方法
    發(fā)表于 01-17 17:19 ?0次下載
    基于ME-PGNMF的<b class='flag-5'>異常</b>流量<b class='flag-5'>檢測</b><b class='flag-5'>方法</b>

    微軟宣布強化Azure公有云基礎(chǔ)設(shè)施平臺上提供的人工智能產(chǎn)品

    今天一系列AI相關(guān)的公告中,最引人關(guān)注的就是Azure Machine Learning Service的面市,這款基于云的產(chǎn)品讓數(shù)據(jù)科學(xué)家和開發(fā)者可以用來快速創(chuàng)建和訓(xùn)練機器學(xué)習(xí)模型
    發(fā)表于 12-07 10:08 ?1110次閱讀

    知道Uboot中的net是怎樣的?

    知道Uboot中的net是怎樣的?
    發(fā)表于 05-15 15:20 ?1165次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>Uboot中的net是<b class='flag-5'>怎樣</b>的?

    什么是異常檢測_異常檢測的實用方法

    異常檢測是一個發(fā)現(xiàn)“少數(shù)派”的過程,由于它們與大多數(shù)數(shù)據(jù)不一樣而引起我們的注意。幾個典型場景中,異常數(shù)據(jù)能為我們關(guān)聯(lián)到一些潛在的問題,如銀行欺詐行為、藥品問題、結(jié)構(gòu)缺陷、設(shè)備故障等。
    的頭像 發(fā)表于 06-29 09:25 ?1.9w次閱讀

    關(guān)于6種時序異常檢測淺析

    時序異常檢測并不困難,如果找對方法則可以今年KDD比賽中獲取比較好的成績。本文將使用tsod庫完成簡單的
    的頭像 發(fā)表于 04-22 10:09 ?4034次閱讀
    關(guān)于6種時序<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>淺析

    知道嗎?MCU也能做Machine learning (ML)

    知道嗎?MCU也能做Machine learning (ML)剛剛過去的2018年被稱為“人工智能元年”,2019年人工智能將會有更大的發(fā)展,將會有更多的AI項目落地。隨著單芯片計算
    發(fā)表于 10-28 16:21 ?2次下載
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>嗎?MCU也能做<b class='flag-5'>Machine</b> <b class='flag-5'>learning</b> (ML)

    基于生成對抗網(wǎng)絡(luò)的異常檢測方法

    取特征,所以訓(xùn)練數(shù)據(jù)集中就不需要異常樣本。此系統(tǒng)的異常檢測結(jié)果由樣本的最終得分來判別,其中異常分?jǐn)?shù)由表觀損失和潛在損失組成。本文方法的亮點在
    發(fā)表于 04-06 16:06 ?3581次閱讀

    使用MATLAB進行異常檢測(下)

    使用 MATLAB 進行異常檢測(上)中,我們探討了什么是異常值,簡單的一維數(shù)據(jù)異常檢測問題,
    的頭像 發(fā)表于 11-24 10:46 ?2215次閱讀