在當(dāng)今復(fù)雜的業(yè)務(wù)環(huán)境中,IT 團(tuán)隊面臨著不斷的挑戰(zhàn),從員工賬號鎖定等簡單問題到關(guān)鍵的安全威脅,不勝枚舉。針對這些情況,既需要快速修復(fù),也需要戰(zhàn)略防御,這使得維持平穩(wěn)和安全運營的工作變得愈發(fā)困難。
而這正是 AIOps 的用武之地。它將人工智能與 IT 運營相結(jié)合,不僅可以自動執(zhí)行日常任務(wù),還能夠增強(qiáng)安全措施。這種方法非常高效,不僅可讓團(tuán)隊快速處理小問題,而且更重要的是,還能讓團(tuán)隊比以前更快、更準(zhǔn)確地識別安全問題并作出響應(yīng)。
借助機(jī)器學(xué)習(xí),AIOps 不僅成為了簡化操作的重要工具,而且還能全面加強(qiáng)安全性。事實證明,對于希望為團(tuán)隊引入先進(jìn) AI 的企業(yè)來說,AIOps 將成為一個顛覆性的工具,幫助企業(yè)未雨綢繆,提前為應(yīng)對潛在安全風(fēng)險做好準(zhǔn)備。
據(jù) IDC 數(shù)據(jù)顯示,IT 運營管理軟件市場預(yù)計將以每年 10.3% 的速度增長;到 2027 年,預(yù)計收入將達(dá)到 284 億美元。這一增長凸顯了企業(yè)日益依賴 AIOps 來提升運營效率,并且它已成為現(xiàn)代網(wǎng)絡(luò)安全戰(zhàn)略的關(guān)鍵組成部分。
隨著機(jī)器學(xué)習(xí)運維的快速增多,生成式 AI 時代不斷發(fā)展。由 NVIDIA 合作伙伴組成的廣泛生態(tài)系統(tǒng)正在提供 AIOps 解決方案,利用 NVIDIA AI 幫助企業(yè)改進(jìn) IT 運營。
NVIDIA 致力于通過加速計算和 AI 軟件,為廣泛的 AIOps 合作伙伴生態(tài)系統(tǒng)提供幫助。其中包括 NVIDIA AI Enterprise,這是一個可以在任何地方運行的云原生堆棧,并通過 NVIDIA NIM(用于加快 AI 模型推理)、NVIDIA Morpheus(用于基于 AI 的網(wǎng)絡(luò)安全)和 NVIDIA NeMo(用于自定義生成式 AI)等軟件,為實現(xiàn) AIOps 奠定堅實的基礎(chǔ)。該軟件有助于實現(xiàn)基于生成式 AI 的聊天機(jī)器人、摘要和搜索功能。
使用 NVIDIA AI 的 AIOps 服務(wù)提供商包括:
Dynatrace Davis 超模態(tài) AI 集成了因果 AI、預(yù)測式 AI 和生成式 AI 技術(shù),并采用 Davis CoPilot,以強(qiáng)化 AIOps。這一組合能夠提供精確、切實可行且由 AI 驅(qū)動的回答和自動化,有助于增強(qiáng) IT、開發(fā)、安全和業(yè)務(wù)運營的可觀察性和安全性。
Elastic 提供用于語義和向量搜索的 Elasticsearch Relevance Engine (ESRE),該引擎集成了 GPT-4 等熱門 LLM,能夠為可觀察性和安全性解決方案中的 AI 助手提供強(qiáng)大的支持。Observability AI Assistant 是新一代 AIOps 功能,可協(xié)助 IT 團(tuán)隊了解復(fù)雜系統(tǒng)、監(jiān)控運行狀況,并自動修復(fù)運營問題。
New Relic 正在利用其機(jī)器學(xué)習(xí)、生成式 AI 助手框架以及長期以來在可觀察性方面積累的專業(yè)知識來強(qiáng)化 AIOps。它的機(jī)器學(xué)習(xí)和高級邏輯可幫助 IT 團(tuán)隊減少警報噪音、縮短平均檢測時間和平均修復(fù)時間、自動分析根本原因并生成回顧。它的生成式 AI 助手 New Relic AI 可加快問題解決速度,用戶無需切換上下文,即可識別、解釋和解決錯誤。它能夠直接在開發(fā)者的集成開發(fā)環(huán)境中提供代碼修復(fù)建議并修復(fù)代碼。此外,它還能自動生成高級系統(tǒng)運行狀況報告、分析和匯總儀表盤以及回答有關(guān)用戶應(yīng)用、基礎(chǔ)設(shè)施和服務(wù)的簡單語言問題,將事件可見性和預(yù)防擴(kuò)展到非技術(shù)團(tuán)隊。對于受益于 NVIDIA GPU 的 AI 驅(qū)動的應(yīng)用,New Relic 還能實現(xiàn)全??捎^察性。
PagerDuty 在 PagerDuty Copilot 中新增一項功能,即在 Slack 中集成了生成式 AI 助手,以便在從事件發(fā)生到解決的整個過程中提供深入洞察,簡化事件生命周期,并減少 IT 團(tuán)隊的人工任務(wù)量。
ServiceNow 致力于創(chuàng)建主動 IT 運維, 包括自動產(chǎn)出洞察(以對事件作出快速響應(yīng))、優(yōu)化服務(wù)管理和檢測異?!,F(xiàn)在,該公司正在與 NVIDIA 合作推進(jìn)生成式 AI 的發(fā)展,進(jìn)一步推動技術(shù)服務(wù)和運營的創(chuàng)新。
Splunk 的技術(shù)平臺依托人工智能和機(jī)器學(xué)習(xí),針對實現(xiàn)運營問題與威脅,實現(xiàn)了識別、診斷和解決流程的自動化,進(jìn)而提高 IT 效率,并改善安全狀況。Splunk IT Service Intelligence 是 Splunk 的主要 AIOps 產(chǎn)品,能夠從一個位置提供由嵌入式 AI 驅(qū)動的事件預(yù)測、檢測和解決方案。
亞馬遜云科技 (AWS)、谷歌云和 Microsoft Azure 等云服務(wù)提供商為企業(yè)和組織靈活地提供大規(guī)模云資源,幫助其實現(xiàn) IT 運營的自動化和優(yōu)化。
亞馬遜云科技提供了一套有助于 AIOps 的服務(wù),包括用于監(jiān)控和可觀察性的 Amazon CloudWatch、用于跟蹤用戶活動和 API 使用情況的 AWS CloudTrail、用于創(chuàng)建可重復(fù)且負(fù)責(zé)任的機(jī)器學(xué)習(xí)工作流的 Amazon SageMaker 和用于無服務(wù)器計算、可基于觸發(fā)器自動執(zhí)行響應(yīng)操作的 AWS Lambda。
谷歌云通過 Google Cloud Operations 等服務(wù)為 AIOps 提供支持,該服務(wù)可為云端和本地的應(yīng)用提供監(jiān)控、日志記錄和診斷功能。谷歌云的 AI 和機(jī)器學(xué)習(xí)產(chǎn)品包括 Vertex AI(用于模型訓(xùn)練和預(yù)測)和 BigQuery(利用 Google 基礎(chǔ)設(shè)施的處理能力進(jìn)行快速 SQL 查詢)。
Microsoft Azure 通過 Azure Monitor 來全面監(jiān)控應(yīng)用、服務(wù)和基礎(chǔ)設(shè)施,推動 AIOps 發(fā)展。Azure Monitor 的內(nèi)置 AIOps 功能有助于預(yù)測容量使用情況,實現(xiàn)自動擴(kuò)展,識別應(yīng)用性能問題,以及檢測虛擬機(jī)、容器和其他資源中的異常行為。Microsoft Azure 機(jī)器學(xué)習(xí)(AzureML)提供了一個基于云的 MLOps 環(huán)境,可安全、負(fù)責(zé)任地大規(guī)模訓(xùn)練、部署和管理機(jī)器學(xué)習(xí)模型。
專注于 MLOps 的平臺主要致力于簡化機(jī)器學(xué)習(xí)模型的生命周期(從開發(fā)到部署和監(jiān)控)。下列公司雖然核心任務(wù)在于讓機(jī)器學(xué)習(xí)變得更易于獲取、更高效和更具可擴(kuò)展性,但鑒于其技術(shù)和方法增強(qiáng)了 IT 運營中的 AI 功能,因此也間接實現(xiàn)了對 AIOps 的支持:
Anyscale 的平臺基于 Ray,可以輕松擴(kuò)展 AI 和機(jī)器學(xué)習(xí)應(yīng)用,包括 AIOps 中用于異常檢測和自動修復(fù)等任務(wù)的應(yīng)用。Anyscale 通過促進(jìn)分布式計算,幫助 AIOps 系統(tǒng)更高效地處理大量運營數(shù)據(jù),實現(xiàn)實時分析和決策。
Dataiku 可用于創(chuàng)建預(yù)測 IT 系統(tǒng)故障或優(yōu)化資源分配的模型,IT 團(tuán)隊借助它,可在生產(chǎn)環(huán)境中快速部署和迭代這些模型。
Dataloop 的平臺提供完整的數(shù)據(jù)生命周期管理功能,并能夠靈活地為端到端工作流引入 AI 模型,使用戶能夠使用自身數(shù)據(jù)開發(fā) AI 應(yīng)用。
DataRobot 是一個完整的 AI 生命周期平臺,可幫助 IT 運營團(tuán)隊快速構(gòu)建、部署和管理 AI 解決方案,提高運營效率和性能。
Domino Data Lab 的平臺使企業(yè)及其數(shù)據(jù)科學(xué)家在統(tǒng)一的端到端平臺上構(gòu)建、部署和管理 AI。所有環(huán)境中的數(shù)據(jù)、工具、計算、模型和項目都是集中管理的,因此團(tuán)隊可以彼此協(xié)作、監(jiān)控生產(chǎn)模型,并實現(xiàn)受治理的 AI 創(chuàng)新最佳實踐標(biāo)準(zhǔn)化。這種方法對于 AIOps 至關(guān)重要,因為它既能滿足數(shù)據(jù)科學(xué)團(tuán)隊對自助服務(wù)的需求,又能滿足 IT 運營所需的完全可復(fù)現(xiàn)性、精細(xì)的成本跟蹤和對 AI 的主動治理。
Weights & Biases 提供用于實驗跟蹤、模型優(yōu)化和協(xié)作的工具,這對于開發(fā)和微調(diào) AIOps 中使用的 AI 模型至關(guān)重要。Weights & Biases 還提供有關(guān)模型性能的詳細(xì)洞察,并促進(jìn)團(tuán)隊間的協(xié)作,這有助于確保為 IT 運營部署有效且透明的 AI 模型。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4994瀏覽量
103166 -
人工智能
+關(guān)注
關(guān)注
1791文章
47352瀏覽量
238774 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132724 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
339瀏覽量
12324
原文標(biāo)題:GTC24 | 設(shè)計安全:NVIDIA AIOps 合作伙伴生態(tài)系統(tǒng)為企業(yè)帶來 AI 加持
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論