0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么將AI注入到IT運營中比數(shù)據(jù)本身更多的是數(shù)據(jù)

倩倩 ? 來源:新經(jīng)網(wǎng) ? 2020-07-14 16:44 ? 次閱讀

我與之交談的幾乎每個CIO都大膽地宣稱他們的企業(yè)是“數(shù)據(jù)驅(qū)動的企業(yè)”。但是,畢馬威會計師事務(wù)所(KPMG)最近進行的 全球CEO前景 調(diào)查卻截然不同:全球67%的CEO(美國的這一數(shù)字躍升至78%)表明,他們忽略了由CIO /他們提供的數(shù)據(jù)驅(qū)動的分析和預(yù)測模型IT團隊,因為這與他們自己的經(jīng)驗相矛盾;他們根據(jù)自己的直覺做出了重大的企業(yè)決策。

忽略了數(shù)據(jù)驅(qū)動的見解而遵循直覺的CEO

雖然結(jié)果有些令人震驚,但可以很容易地解釋它。首先,盡管企業(yè)生產(chǎn)的數(shù)據(jù)量足夠多,但是數(shù)據(jù)仍然在業(yè)務(wù)單元,域,平臺和實現(xiàn)(例如云與私有數(shù)據(jù)中心)之間非常分散。根據(jù)Forrester的說法,多達73%的公司數(shù)據(jù)未用于分析和見解。難怪首席執(zhí)行官僅使用總數(shù)據(jù)的27%生成的模型就獲得了可怕的結(jié)果!其次,大多數(shù)當前的預(yù)測模型僅使用歷史數(shù)據(jù),而不使用流(實時)數(shù)據(jù)。這兩個重要因素導致預(yù)測的準確性不高。首席執(zhí)行官如果不信任模型,就無法做出決策,因為他們業(yè)務(wù)的成敗取決于他們做出的決策。

更多數(shù)據(jù)可以帶來更好的預(yù)測

盡管是IT運營使其他企業(yè)AI計劃保持平穩(wěn)運行,但實施AI以改善其自身的運營速度卻很慢。原因之一是上述數(shù)據(jù)零散。當向AI / ML模型提供部分數(shù)據(jù)時,您只會獲得企業(yè)的部分視圖。另一個主要原因是因為當前大多數(shù)AI / ML實施都是為了創(chuàng)新,并且通常由BU資助。傳統(tǒng)上,企業(yè)將IT視為成本中心,因此他們不愿意花錢來使用AI來改善運營。但是,隨著大量的數(shù)據(jù),以及當前的大流行病產(chǎn)生了更多的未連接的遠程數(shù)據(jù),這種感覺在開始淹沒Ops團隊時發(fā)生了變化。IT運營團隊正在達到一個臨界點,要處理的數(shù)據(jù)過多,這是AI的理想方案。這是AI和ML的最佳選擇。人工智能在大量數(shù)據(jù)上蓬勃發(fā)展。實際上,向AI算法饋送的數(shù)據(jù)越多,模型就越好。

傳統(tǒng)上,IT運營團隊多年來一直監(jiān)視IT基礎(chǔ)結(jié)構(gòu)監(jiān)視(ITIM)和網(wǎng)絡(luò)性能監(jiān)視與診斷(NPMD)層。在過去的十年中,應(yīng)用程序性能管理(APM)幫助提高了每個應(yīng)用程序的可見性。但是,即使所有這些系統(tǒng)都表明它們正常工作,客戶仍會根據(jù)位置,連接類型(移動/互聯(lián)網(wǎng)),所使用的緩存/ CDN提供程序的類型等而遇到問題?,F(xiàn)代應(yīng)用程序及其組件的復(fù)雜性加載到客戶視圖中會使其變得非常復(fù)雜。數(shù)字體驗監(jiān)視(DEM)的概念已獲得可見性,可以專門監(jiān)視,分析和優(yōu)化客戶體驗。但是,它們更像是監(jiān)視工具,而不是診斷工具。

AIOps(IT運營中的人工智能)解決方案可以幫助解決此問題。一個好的AIOps解決方案應(yīng)該能夠從多個來源獲取數(shù)據(jù),消除噪聲,關(guān)聯(lián)事件序列并基于歷史數(shù)據(jù)和實時數(shù)據(jù)的組合產(chǎn)生可行的見解。

數(shù)據(jù)采集

可以說,這是最重要的一步。不僅需要將歷史數(shù)據(jù)饋送給AI進行模型創(chuàng)建,而且還需要將實時數(shù)據(jù)饋給AI進行推理和更新模型。僅像過去那樣收集日志或SNMP并不能提供企業(yè)的全面情況。收集盡可能多的信息,包括事件,日志,時間序列數(shù)據(jù),應(yīng)用程序數(shù)據(jù),性能數(shù)據(jù),利用率數(shù)據(jù)等。新的基于事件的范式轉(zhuǎn)移到發(fā)布/訂閱或基于事件的消息傳遞。盡管這些消息非常重要,但它們對于收集實時數(shù)據(jù)以提供企業(yè)的完整視圖并做出準確的預(yù)測絕對至關(guān)重要。大多數(shù)基于云的系統(tǒng),無論是基于容器的還是基于虛擬機的,都通過API提供大量信息。

收集結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。盡管現(xiàn)有的BI和分析系統(tǒng)在處理非結(jié)構(gòu)化數(shù)據(jù)時遇到困難,但AI還是喜歡它。它可以解析幾乎所有內(nèi)容,包括音頻,視頻,文本文件,圖像,配置文件,文檔,PDF文件等。

最后,大多數(shù)團隊忘記將配置記錄,變更管理系統(tǒng),CMBD等作為等式的一部分。這對于每天有時會推動多個發(fā)布周期的敏捷團隊尤其重要。除非IT運營團隊意識到最近的變化,否則他們將浪費大量時間試圖找出問題的根本原因。

數(shù)據(jù)質(zhì)量和數(shù)據(jù)攝取

AI存在數(shù)據(jù)質(zhì)量問題。創(chuàng)建AI / ML模型時,“垃圾填埋,垃圾填埋”是非常正確的。您的算法有多好或數(shù)據(jù)科學家有多好都無關(guān)緊要。如果您沒有提供足夠的質(zhì)量數(shù)據(jù),那么您將一無所獲。當企業(yè)收集大量數(shù)據(jù)時,它仍然是不完整,不正確和/或不一致的。您還需要收集相鄰和相關(guān)的數(shù)據(jù)。您可能會認為它們無關(guān)緊要,但是對于AI使用看似無關(guān)的數(shù)據(jù)所能找到的東西,您會感到驚訝。一個例子是,當NASA衛(wèi)星破裂時,IBM的AI工程師和NASA科學家找到了一種方法,可以利用太陽光以98%的準確度來計算紫外線強度。我最近寫了一篇關(guān)于此的文章,可以在這里看到。

如果您與數(shù)據(jù)科學家交談,他們會告訴您他們花了多少時間準備數(shù)據(jù)。他們多達80%的時間用于準備數(shù)據(jù),而不是分析數(shù)據(jù)或創(chuàng)建和微調(diào)模型。

數(shù)據(jù)分類和標簽

數(shù)據(jù)需要正確分類,分類和標記,以便AI / ML從中學習。對于監(jiān)督學習模型尤其如此。在訓練,驗證和調(diào)整模型之前,這是重要的一步。標簽的準確性和質(zhì)量是最重要的兩件事。準確性衡量的是標簽與真實情況之間的接近程度,或與您的企業(yè)事實和/或?qū)嶋H條件匹配的程度。質(zhì)量與用于模型的整個數(shù)據(jù)集的標注準確性有關(guān)。當您結(jié)合使用自動,外包和內(nèi)部標簽工作時,尤其如此。所有組都會在整個數(shù)據(jù)集中一致地標記嗎?

數(shù)據(jù)清理

如果使用偏差數(shù)據(jù)訓練AI模型,則無疑會產(chǎn)生偏差模型。我寫了一篇有關(guān)如何避免這種情況并使您的數(shù)據(jù)失偏的文章。原始數(shù)據(jù)可能包含隱性偏見信息,例如種族,性別,出身,政治,社會或其他意識形態(tài)偏見。消除它們的唯一方法是分析不平等并在創(chuàng)建模型之前對其進行修復(fù)。如果不從數(shù)據(jù)中消除歧視性做法,該模型將傾向于產(chǎn)生有偏見的結(jié)果。

僅當數(shù)據(jù)來自經(jīng)驗證,權(quán)威,經(jīng)過驗證和可靠的來源時,才應(yīng)包括在內(nèi)。來自不可靠來源的數(shù)據(jù)應(yīng)該完全消除,或者在輸入模型時應(yīng)給予較低的置信度。另外,通過控制分類精度,可以以最小的增量成本來大大減少辨別力。這種數(shù)據(jù)預(yù)處理優(yōu)化應(yīng)集中在控制區(qū)分,限制數(shù)據(jù)集中的失真和保留實用程序上。

資料儲存庫

考慮到數(shù)據(jù)的數(shù)量,速度和種類,用于數(shù)據(jù)存儲和數(shù)據(jù)管理的傳統(tǒng)現(xiàn)場解決方案不適用于數(shù)字本機解決方案。許多公司已采用數(shù)據(jù)湖解決方案來解決此問題。盡管單個集中的數(shù)據(jù)源可以提供幫助,但需要對其進行適當?shù)陌踩Wo,管理和定期更新。它應(yīng)該能夠無縫處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。

結(jié)論

人工智能需要大量數(shù)據(jù)。正如我最喜歡的《短路》中的角色Johnny V(基于AI的機器人)說:“我需要更多的輸入……”。如果您的高管要基于此做出重大的企業(yè)決策,請確保為AI提供正確數(shù)量和質(zhì)量的數(shù)據(jù)。如果沒有,他們將忽略您的模型輸出/建議并做出自己的決定,從而最大程度地降低您的價值,并最終使您獲得數(shù)字化和改善業(yè)務(wù)所需的資金。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31054

    瀏覽量

    269407
  • 數(shù)據(jù)驅(qū)動

    關(guān)注

    0

    文章

    127

    瀏覽量

    12355
收藏 人收藏

    評論

    相關(guān)推薦

    專訪阿里云數(shù)據(jù)庫周文超博士:AI就緒的智能數(shù)據(jù)平臺設(shè)計思路

    在生成式AI的浪潮中,數(shù)據(jù)的重要性日益凸顯。大模型在實際業(yè)務(wù)場景的落地過程中,必須有海量數(shù)據(jù)的支撐:經(jīng)過訓練、推理和分析等一系列復(fù)雜的數(shù)據(jù)處理過程,才能最終產(chǎn)生業(yè)務(wù)價值。事實上,大模型
    的頭像 發(fā)表于 01-02 17:18 ?124次閱讀
    專訪阿里云<b class='flag-5'>數(shù)據(jù)</b>庫周文超博士:<b class='flag-5'>AI</b>就緒的智能<b class='flag-5'>數(shù)據(jù)</b>平臺設(shè)計思路

    數(shù)據(jù)驅(qū)動AI工具在哪

    數(shù)據(jù)驅(qū)動AI工具并不遙遠,它們就存在于我們的日常生活中,只是我們可能沒有意識。這些工具通常被嵌入各種應(yīng)用程序、軟件和服務(wù)中,為我們提供便利。接下來,
    的頭像 發(fā)表于 12-09 10:52 ?146次閱讀

    維智科技用數(shù)據(jù)+AI驅(qū)動業(yè)務(wù)增長

    在當今數(shù)字化時代,以數(shù)據(jù)驅(qū)動業(yè)務(wù)增長和品牌影響力提升成為企業(yè)競爭的關(guān)鍵手段,利用AI進行精準決策也成為企業(yè)降低運營成本的重要抓手。
    的頭像 發(fā)表于 11-25 14:07 ?233次閱讀

    LumenAI光纖交易鏈接亞馬遜數(shù)據(jù)中心

    近日,據(jù)相關(guān)報道,Lumen公司計劃在最新的AI光纖交易中,與亞馬遜數(shù)據(jù)中心建立緊密的鏈接。這一舉措無疑進一步提升數(shù)據(jù)傳輸?shù)男屎退俣?,為互?lián)網(wǎng)行業(yè)
    的頭像 發(fā)表于 10-31 11:29 ?420次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    的深入發(fā)展。 3. 挑戰(zhàn)與機遇并存 盡管AI在生命科學領(lǐng)域取得了顯著的成果,但也面臨著諸多挑戰(zhàn)。例如,數(shù)據(jù)隱私、算法偏見、倫理道德等問題都需要我們認真思考和解決。同時,如何更好地AI
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    和數(shù)量直接影響模型的準確性和可靠性。因此,數(shù)據(jù)獲取、處理、分析和質(zhì)量控制在AI for Science中至關(guān)重要。此外,數(shù)據(jù)驅(qū)動的研究范式也促使科學家從傳統(tǒng)的假設(shè)驅(qū)動轉(zhuǎn)向更加靈活和開
    發(fā)表于 10-14 09:16

    在FX3S上如何通過USB和GPIF數(shù)據(jù)存儲eMMC中?

    我使用的是賽普拉斯 FX3S。 S0 端口連接了 eMMC,F(xiàn)X3S 還連接了 TI DSP(TMS320C28346ZFE)。 我想通過 USB 數(shù)據(jù)和/或文件從主機 PC 存儲 eMMC,并
    發(fā)表于 07-23 07:57

    esp8266怎么做才能每秒發(fā)送更多數(shù)據(jù)包呢?

    在我的項目中,我需要通過WIFI實時傳輸大量數(shù)據(jù)。在 esp8266 參考手冊中指出,我可以 UART 波特率提高 4 Mbits 左右,以實現(xiàn)更快的通信。 問題是,增加波特率不會改變整體發(fā)送
    發(fā)表于 07-22 08:00

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    ,如果醫(yī)生和患者都能了解AI推薦治療方案的原因,大大增加對技術(shù)的接受度和信任。 算法公平性的保障同樣不可或缺。AI系統(tǒng)在設(shè)計時就需要考慮多樣性和包容性,避免因為訓練
    發(fā)表于 07-16 15:07

    AI時代,我們需要怎樣的數(shù)據(jù)中心?AI重新定義數(shù)據(jù)中心

    超過60%的中國企業(yè)計劃在未來12至24個月內(nèi)部署生成式人工智能。AI、模型的構(gòu)建,顛覆數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)、運維和運營。一個全新的數(shù)據(jù)
    發(fā)表于 07-16 11:33 ?719次閱讀
    <b class='flag-5'>AI</b>時代,我們需要怎樣的<b class='flag-5'>數(shù)據(jù)</b>中心?<b class='flag-5'>AI</b>重新定義<b class='flag-5'>數(shù)據(jù)</b>中心

    格式化數(shù)據(jù)存儲char數(shù)組的最簡單方法是什么?

    os_printf文本格式化為 UART 輸出的函數(shù)。 格式化數(shù)據(jù)存儲 char 數(shù)組的最簡單方法是什么?
    發(fā)表于 07-11 08:01

    夏普與KDDI共同努力 堺工廠改建為英偉達AI數(shù)據(jù)中心

    近日,夏普公司對外公布其位于日本堺市的制造工廠將會暫停運營,這家工廠主要負責生產(chǎn)高端彩色電視液晶顯示器用的大型LCD面板。據(jù)了解,為了適應(yīng)市場需求的變化,夏普公司正計劃與日本知名電信運營商KDDI攜手合作,堺工廠改造升級成為一
    的頭像 發(fā)表于 06-03 16:29 ?680次閱讀

    如何數(shù)據(jù)傳入單片機的模型中去輸出?

    怎么數(shù)據(jù)傳入移植單片機中的模型中去并輸出
    發(fā)表于 03-25 06:26

    數(shù)據(jù)賦能:構(gòu)建數(shù)據(jù)治理與AI的協(xié)同閉環(huán)

    在數(shù)字化浪潮中,數(shù)據(jù)已成為企業(yè)的新型燃料,而AI則是提煉這種燃料的精煉廠。數(shù)據(jù)治理與AI的協(xié)同作用,正在引領(lǐng)企業(yè)邁向更智能、更高效的未來。本文
    的頭像 發(fā)表于 03-15 10:47 ?496次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備
    發(fā)表于 03-12 08:09