0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

這次人工智能和機器學習“盯”上了數(shù)據(jù)中心

如意 ? 來源:今日頭條 ? 作者:計算機世界 ? 2020-10-29 14:27 ? 次閱讀

關于人工智能的討論目前主要還集中在自動駕駛汽車、聊天機器人、數(shù)字孿生技術、機器人技術以及從大數(shù)據(jù)集中利用基于AI的“智能”系統(tǒng)獲取業(yè)務洞察力等方面。目前盡管可以自主運維的數(shù)據(jù)中心和自動駕駛汽車一樣還沒有成為現(xiàn)實,但是數(shù)據(jù)中心人工智能已經(jīng)在技術、運維和人員等方面取得了許多重大突破。

人工智能(AI)和機器學習(ML)終究有一天將在企業(yè)數(shù)據(jù)中心內(nèi)發(fā)揮重要作用。未來人工智能或許可以幫助企業(yè)創(chuàng)建高度自動化的、安全的且具有自我修復功能的數(shù)據(jù)中心。這些數(shù)據(jù)中心能夠以更高的效率和更高的彈性運行,幾乎不再需要進行人工干預。

人工智能提升數(shù)據(jù)中心效率和擴展業(yè)務的潛力主要在以下4個方面:

安全性:公安部在16個城市試點基礎上,在全國分兩批推廣機動車檢驗標志電子化。

工作負載管理:AI系統(tǒng)可實現(xiàn)工作負載實時地自動向效率最高的基礎設施遷移,這些基礎設施既可以在數(shù)據(jù)中心內(nèi)部,也可以在混合云環(huán)境上;既可以在本地,也可以在云端,還可以在邊緣環(huán)境中。

電源管理:基于AI的電源管理可優(yōu)化冷卻系統(tǒng),降低電費成本,減少人員數(shù)量,提高效率。

設備管理:AI系統(tǒng)可以檢查系統(tǒng)是否配置正確,監(jiān)視服務器、存儲和網(wǎng)絡設備的健康狀況,預測設備的故障時間。

人工智能與安全

安全運營中心(SOC)的安全專業(yè)人員常常會被大量的警報搞得精疲力盡?;贏I的系統(tǒng)可以掃描大量遙測數(shù)據(jù)和日志信息,處理一些簡單的工作,從而使得安全專家有時間展開深入的調(diào)查。基于AI的系統(tǒng)可以檢測、阻止和隔離威脅,并展開溯源以確定到底發(fā)生了什么,以及黑客能夠利用哪些漏洞。這使得人工智能在實時入侵檢測方面極為有用。

迅速進行根本原因分析可以幫助運維人員做出明智的決定并采取行動。人工智能和機器學習可以通過對事件進行快速分類和聚類的方式,識別出重要事件并將其與噪音分離,從而簡化事件處理(事件響應)。

除了可以幫助解譯那些超出人類能力水平的數(shù)據(jù)外,AI自動化還可在優(yōu)化能源使用、工作負載分配和數(shù)據(jù)中心資產(chǎn)利用效率最大化等方面幫助獲取深刻的洞察力。

基于AI的工作負載優(yōu)化

無論是在本地還是在云端,AI在應用程序?qū)涌勺詣訉⒐ぷ髫撦d移動到適當?shù)奈恢?。例如,將工作負載自動遷移到最節(jié)能的服務器上,同時確保服務器以最高效率(利用率為70%~80%)運行。

人工智能系統(tǒng)還可將時間敏感性高的應用程序遷移到高效率服務器上運行,同時確保那些不需要迅速執(zhí)行的應用程序不會消耗過多的電力。

未來,AI/ML還可根據(jù)性能、成本、治理、安全性、風險和可持續(xù)性等因素,實時決定將工作負載遷移至何處。

將電源管理與服務器工作負載管理整合在一起

AI帶來的好處與出色硬件設計所帶來的好處不在一個層次上。電源管理則是最容易進行改進的地方。這關乎生產(chǎn)力,關系到每個BTU是否可以完成更多的工作,關系到每瓦特電能是否能做更多的工作。

這也意味著工作要更加智能化,以及設備是否能夠更加智能地工作。如果傳感器檢測到服務器運行溫度過高,那么系統(tǒng)可自動地快速將工作負載轉(zhuǎn)移到未充分利用的服務器上,以避免關鍵任務應用程序出現(xiàn)中斷的危險。同時系統(tǒng)會調(diào)查服務器過熱的原因,是風扇出現(xiàn)了故障(HVAC問題),還是物理組件出現(xiàn)了故障(設備問題),亦或是服務器出現(xiàn)了過載(工作負荷問題)。

AI系統(tǒng)還可以通過關聯(lián)HVAC系統(tǒng)數(shù)據(jù)和環(huán)境傳感器數(shù)據(jù)來了解設施目前的狀態(tài)。例如,基于AI的系統(tǒng)可以幫助數(shù)據(jù)中心管理員了解當前或潛在的冷卻問題。如HVAC單元性能不佳、冷熱通道之間的空氣量不足,以及由于機柜密度過高阻礙了空氣流通導致冷氣輸送不足等問題。

容量規(guī)劃也是一個可能改進的地方。除了尋找發(fā)熱點和冷卻點之外,AI系統(tǒng)還能確保數(shù)據(jù)中心只為適當數(shù)量的物理服務器提供電力,如果出現(xiàn)臨時性需求激增的情況,系統(tǒng)還可以啟動新的物理服務器以提高可用容量。

許多企業(yè)之所以正在花大力氣研究數(shù)據(jù)中心電源管理,一方面是為了節(jié)省資金,另一方面也是為了承擔起企業(yè)的環(huán)保責任。有數(shù)據(jù)顯示,數(shù)據(jù)中心消耗了全球3%的電力供應,并造成了約2%的溫室氣體排放。

谷歌在2018年曾宣布已將其多個超大規(guī)模數(shù)據(jù)中心的冷卻系統(tǒng)控制權交給AI程序控制,由AI算法提供的建議使得耗電量下降了40%。

運行狀態(tài)監(jiān)控和配置管理監(jiān)督

安裝了大量組件的IT機柜是勞動密集型工作,因此檢查工作可能會存在不及時和不徹底情況。運行狀態(tài)監(jiān)視可檢查設備配置是否正確以及性能是否達到預期效果。

數(shù)據(jù)中心內(nèi)還有許多需要定期維護的物理設備。AI系統(tǒng)不僅可以對這些物理設備進行定期維護,還可收集和分析遙測數(shù)據(jù),幫助確定需要立即關注的特定區(qū)域。以大量傳感數(shù)據(jù)日志為基礎的預測性設備故障建模可以發(fā)現(xiàn)迫在眉睫的組件或設備故障,并評估是否需要立即維護以避免服務中斷。

人工智能系統(tǒng)最終可能會實現(xiàn)“告訴我問題出在哪里,我去解決這些問題”,但是即便實現(xiàn)了這一功能,許多數(shù)據(jù)中心運營商可能只會接受“如果出了問題,請告訴我要去哪里查看就行了?!?/p>

保持設備平穩(wěn)安全運行的另一個重要環(huán)節(jié)是控制“配置漂移”。AI可作為“額外的安全檢查”,可幫助識別出由于配置導致的數(shù)據(jù)中心問題。(注:配置漂移為數(shù)據(jù)中心術語,指臨時配置隨著時間的變化可能會導致一些問題的發(fā)生。)

部署AI所面臨的挑戰(zhàn)

優(yōu)化和自動化數(shù)據(jù)中心是數(shù)字化轉(zhuǎn)型計劃中不可或缺的一部分。新冠疫情讓許多公司開始尋求數(shù)據(jù)中心的進一步自動化,實現(xiàn)數(shù)字數(shù)據(jù)中心由AI驅(qū)動并可自我修復。這使得AI在數(shù)據(jù)中心中具有廣闊的應用前景。一些AI/ML功能可用于事件處理、基礎設施運行狀況和散熱優(yōu)化。

盡管如此,要想讓AI/ML模型超越目前的標準數(shù)據(jù)中心基礎設施管理(DCIM)需要有更多突破,和更多的時間。這與自動駕駛汽車的發(fā)展極為類似,早期階段可能非常具有吸引力,但是與最終承諾的顛覆性經(jīng)濟/商業(yè)案例相比仍然相去甚遠。

AIOps平臺的成熟度、IT技能和運維成熟度均為重大挑戰(zhàn)。更高級別的部署面臨的挑戰(zhàn)還包括數(shù)據(jù)質(zhì)量,以及IT基礎設施和運維團隊缺乏數(shù)據(jù)科學技能。此外,需要雇用或培訓合適的人來管理系統(tǒng),以及需要數(shù)據(jù)標準和相關體系結(jié)構(gòu)都是部署AI時所面臨的挑戰(zhàn)。

但是自始至終最大的挑戰(zhàn)還是在于人。各種基礎設施的運維人員都在做放權給AI的準備。但是如果人們并不信任做出決定的決策者,那么在如此大規(guī)模的過渡期間人員如何培訓,如何安撫人員的情緒?在過渡期間,人們普遍會想一個問題,那就是如果自己照做了,自己會失業(yè)嗎?

對許多企業(yè)來說,不僅聘用到資深的數(shù)據(jù)科學家是一個挑戰(zhàn),就連培訓現(xiàn)有員工也困難重重。因為企業(yè)員工抵制技術的傳統(tǒng)由來已久。以軟件定義網(wǎng)絡(SDN)為例,SDN已經(jīng)推出十年了,但是仍有3/4以上的IT運維在使用命令行界面。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)中心

    關注

    16

    文章

    4792

    瀏覽量

    72175
  • 人工智能
    +關注

    關注

    1791

    文章

    47352

    瀏覽量

    238771
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132723
收藏 人收藏

    評論

    相關推薦

    人工智能對數(shù)據(jù)中心基礎設施帶來了哪些挑戰(zhàn)

    在加密貨幣和人工智能/機器學習(AI/ML)等新興應用的驅(qū)動下,數(shù)據(jù)中心的能耗巨大,并將快速增長以滿足用戶需求。根據(jù)國際能源署(IEA)的最新報告,2022 年
    發(fā)表于 12-31 13:48 ?177次閱讀
    <b class='flag-5'>人工智能對數(shù)據(jù)中心</b>基礎設施帶來了哪些挑戰(zhàn)

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體中,使它們能夠感知、學習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠在人類社會中有效
    發(fā)表于 12-24 00:33

    嵌入式和人工智能究竟是什么關系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的一場革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨特的優(yōu)勢和重要性,發(fā)揮著不可或缺的作用。通過深度學習和神經(jīng)網(wǎng)絡等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù)
    發(fā)表于 11-14 16:39

    人工智能對數(shù)據(jù)中心的挑戰(zhàn)

    在加密貨幣和人工智能/機器學習(AI/ML)等新興應用的驅(qū)動下,數(shù)據(jù)中心的能耗巨大,并將快速增長以滿足用戶需求。根據(jù)國際能源署(IEA)的最新報告,2022 年
    的頭像 發(fā)表于 11-13 16:05 ?380次閱讀
    <b class='flag-5'>人工智能對數(shù)據(jù)中心</b>的挑戰(zhàn)

    人工智能機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數(shù)據(jù)
    發(fā)表于 10-24 17:22 ?2500次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    Molex連接器助力構(gòu)建未來數(shù)據(jù)中心 充分發(fā)揮人工智能AI的力量

    隨著高性能計算,在人工智能(AI)和機器學習(ML)領域中不斷演進,各種應用對復雜計算能力、海量存儲容量和無縫連接提出了前所未有的需求。電子組件之間實現(xiàn)更快速、更高效的通信,能夠促使專門構(gòu)建的生成式
    的頭像 發(fā)表于 08-29 11:57 ?1813次閱讀
    Molex連接器助力構(gòu)建未來<b class='flag-5'>數(shù)據(jù)中心</b> 充分發(fā)揮<b class='flag-5'>人工智能</b>AI的力量

    借助電源完整性測試提高人工智能數(shù)據(jù)中心的能效

    數(shù)據(jù)中心正在部署基于人工智能 (AI) 的技術,處理器密集型服務器正在推動能源需求的增長,下表說明了這種發(fā)展趨勢所帶來的巨大影響。國際能源署 (IEA) 預測,到2030年,數(shù)據(jù)中心的耗電量將占全球耗電量的7%,相當于印度全國的
    的頭像 發(fā)表于 07-30 09:36 ?557次閱讀
    借助電源完整性測試提高<b class='flag-5'>人工智能</b><b class='flag-5'>數(shù)據(jù)中心</b>的能效

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    人工智能數(shù)據(jù)中心的新型連接解決方案

    (AI)和機器學習(ML)應用對復雜計算能力、海量存儲容量和無縫連接提出了前所未有的要求。電子元件之間高速、高效的通信使人工智能數(shù)據(jù)中心能夠計算龐大的
    的頭像 發(fā)表于 06-13 08:26 ?568次閱讀
    <b class='flag-5'>人工智能</b><b class='flag-5'>數(shù)據(jù)中心</b>的新型連接解決方案

    夏普討論建立人工智能數(shù)據(jù)中心

    近日,夏普公司宣布與KDDI公司達成重要合作意向,雙方將針對建立人工智能數(shù)據(jù)中心進行深入討論。據(jù)悉,此次合作將圍繞英偉達的人工智能計算平臺和Supermicro平臺展開,共同探索人工智能
    的頭像 發(fā)表于 06-05 09:17 ?475次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學者完整學習流程實現(xiàn)手寫數(shù)字識別案例_V2-20240506.pdf 人工智能 語音對話機器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業(yè)和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是
    的頭像 發(fā)表于 04-04 08:41 ?337次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學者完整學習流程實現(xiàn)手寫數(shù)字識別案例.pdf 人工智能 語音對話機器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對話
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    聯(lián)網(wǎng)ARM開發(fā) NB-IoT開發(fā)及實戰(zhàn) 七:python工程師,人工智能工程師 python語法基礎 python核心編程 基于OpenCV的機器視覺開發(fā) 嵌入式人工智能滲入生活的方方面面,廣泛應用
    發(fā)表于 02-26 10:17