電子發(fā)燒友網(wǎng)報道(文/黃山明)近日,據(jù)外媒報道,亞馬遜云服務(wù)(AWS)發(fā)生宕機事故,導(dǎo)致大面積網(wǎng)站、服務(wù)和應(yīng)用程序癱瘓,直接后果是造成亞馬遜電商業(yè)務(wù)交付混亂、貨物堆積。而這也不是今年亞馬遜第一次發(fā)生服務(wù)器宕機事故。
據(jù)了解,此次AWS的宕機對于亞馬遜配送業(yè)務(wù)造成嚴重影響,導(dǎo)致許多司機無法獲得配送路線,無法為用戶配送快遞。同時,使用AWS的眾多廠商也受到了影響,如Facebook、迪士尼+、Netflix、任天堂等。
不安分的服務(wù)器
就在美國時間12月7日,AWS出現(xiàn)宕機,導(dǎo)致旗下的PrimeMusic、PrimeVideo、Alexa在內(nèi)的大量網(wǎng)站和APP無法正常訪問,也讓許多使用AWS云服務(wù)的企業(yè)蒙受損失。
如任天堂便在12月8日凌晨宣布旗下Switch網(wǎng)絡(luò)服務(wù)大規(guī)模癱瘓,推測主要原因可能是與導(dǎo)入AWS云服務(wù)有關(guān)。盡管亞馬遜方面迅速進行了搶修,但是此次事故仍然給亞馬遜云服務(wù)帶來了不小的損失。
據(jù)相關(guān)報告統(tǒng)計,此次AWS云服務(wù)器故障導(dǎo)致亞馬遜帶來的損失或?qū)⒊^1800萬美元(折合人民幣1.14億)。并且這也不是亞馬遜今年第一次出現(xiàn)服務(wù)器宕機,今年的7月份以及10月份都已經(jīng)出現(xiàn)過服務(wù)網(wǎng)絡(luò)中斷的問題。
當然,服務(wù)器宕機的情況并不是亞馬遜專屬,中國的許多企業(yè)便經(jīng)歷過服務(wù)器宕機事故。2019年3月份,阿里云出現(xiàn)大規(guī)模宕機故障,影響了數(shù)量眾多的華北地區(qū)互聯(lián)網(wǎng)公司,故障原因是IOHang(即因為IO錯誤造成的IO路徑阻塞,導(dǎo)致數(shù)據(jù)拷貝異常緩慢),最終也對阿里云造成了較大的經(jīng)濟損失。
華為云在2020年4月份其位于北京區(qū)的云服務(wù)器發(fā)生宕機,花費了近三個小時才得以恢復(fù),也對相關(guān)用戶及廠商造成了一定影響。此外,今年7月份,包括B站、豆瓣、晉江等多家大型網(wǎng)站都發(fā)生了宕機,導(dǎo)致許多用戶無法正常登錄瀏覽網(wǎng)頁。
宕機是如何產(chǎn)生的?
所謂宕機即英文直譯過來的“down機”,通常指網(wǎng)站、游戲或者網(wǎng)絡(luò)應(yīng)用服務(wù)器處于非正常運行的狀態(tài),服務(wù)器處于假死、停止使用或者關(guān)閉導(dǎo)致無法正常運行,都能稱為宕機。
宕機的產(chǎn)生通常有三個原因,一個是由管理人員主動將服務(wù)器重啟,用于更新維護;第二個是非主動重啟所造成的意外,如供電不足、震動、硬件質(zhì)量、資源沖突、系統(tǒng)文件損壞、病毒等等;第三是用戶訪問量過大,導(dǎo)致資源耗盡,數(shù)據(jù)溢出從而宕機。
當然,理論上來說,訪問量大并不會造成宕機,不過當服務(wù)器內(nèi)存滿了、CPU性能不足無法處理龐大數(shù)據(jù),都會導(dǎo)致信息處理速度變慢,或者拒絕新的服務(wù)請求。簡而言之,配置過低,加錢就能解決。
另一方面,與個人PC不同的地方在于,服務(wù)器基本上全年365天都不會關(guān)機,這就導(dǎo)致服務(wù)器宕機幾乎成為必然。
并且在現(xiàn)實生活中,服務(wù)器宕機的情況會更加復(fù)雜。通常如今云服務(wù)器會有多個節(jié)點做負載分散,這樣一來哪怕是其他節(jié)點都死機,只有一個節(jié)點能夠工作也不會導(dǎo)致服務(wù)器的完全宕機。
如果是在普通情況下的確可行,但是萬一遇到一波大量數(shù)據(jù)來襲,導(dǎo)致其中幾個節(jié)點暫時性負荷變高,反應(yīng)速度變慢,那么接下來短時間的所有流量都會被導(dǎo)入剩余的節(jié)點當中,導(dǎo)致剩余的節(jié)點很難處理過量的數(shù)據(jù),最終導(dǎo)致服務(wù)器宕機。
也就是說,本來許多所有節(jié)點共同參與才能完成的工作,其中有幾個節(jié)點率先陣亡,導(dǎo)致剩下的節(jié)點壓力飆升,完蛋是遲早的事。
解決宕機問題,是實現(xiàn)元宇宙的關(guān)鍵
已經(jīng)明白了宕機如何產(chǎn)生,那么解決服務(wù)器宕機的方法通常有兩個,一個是及時發(fā)現(xiàn)服務(wù)器宕機的問題,盡快修復(fù),避免不必要的損失,例如在負載節(jié)點還能支持的時候解決這一問題;另一個則是額外準備一個備用服務(wù)器,存放的內(nèi)容相同,但IP不同,并且機房的地理位置也不同,這樣發(fā)現(xiàn)宕機后能夠迅速修改服務(wù)器域名,切換至備用服務(wù)器解決問題。
但有了解決方案卻并不意味著所有的問題都能解決,比如最容易讓服務(wù)器發(fā)生宕機的情況就是訪問量數(shù)據(jù)突然過大,導(dǎo)致服務(wù)器無法及時處理導(dǎo)致崩潰。而目前討論火熱的元宇宙,將對云服務(wù)器提出更為嚴峻的挑戰(zhàn)。
舉個例子,近十數(shù)年來雙十一都是用戶網(wǎng)絡(luò)購物狂歡的節(jié)日,但過去許多用戶發(fā)現(xiàn),在雙十一當晚零點購物支付時,會發(fā)生卡頓或者無法彈出相關(guān)界面的問題,就是因為訪問量數(shù)據(jù)突然增大,導(dǎo)致后臺服務(wù)器無法處理造成系統(tǒng)卡頓的情況。
如今雙十一的購物卡頓減少,也是因為阿里提前從外界租了許多服務(wù)器為了應(yīng)對這一局面,而平常并沒有這么多服務(wù)器來維持運行。
如果元宇宙成真,那么支撐元宇宙的服務(wù)器或許將每時每刻都要面臨超過雙十一數(shù)千倍甚至上萬倍的訪問量,更何況元宇宙中的數(shù)據(jù)更為復(fù)雜,處理時需要的資源也更多。
海量的數(shù)據(jù)意味著海量的服務(wù)器,其背后的成本也將不是某個企業(yè)甚至某個國家能夠單獨完成的。如果還需要準備備用服務(wù)器,那么成本更是一個天文數(shù)字。
但宕機問題也是元宇宙必須要面對的,想要當做人類的第二世界,如果經(jīng)常發(fā)生卡頓、數(shù)據(jù)無法訪問的情況,那么這個游戲永遠也無法被稱為元宇宙。
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9353瀏覽量
86228 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
838瀏覽量
39088 -
元宇宙
+關(guān)注
關(guān)注
13文章
1396瀏覽量
11591
發(fā)布評論請先 登錄
相關(guān)推薦
浪潮信息發(fā)布元腦R1推理服務(wù)器
獨立服務(wù)器和云服務(wù)器哪個快一些?
云服務(wù)器還是服務(wù)器好用一些?
企業(yè)云服務(wù)器平臺設(shè)計與搭建
內(nèi)網(wǎng)通過公網(wǎng)地址訪問內(nèi)網(wǎng)服務(wù)器的設(shè)置方法
元腦服務(wù)器第八代新品重磅發(fā)布
獨立服務(wù)器與云服務(wù)器的區(qū)別
日本云服務(wù)器多少錢一個月?
云服務(wù)器和虛擬服務(wù)器的區(qū)別是什么
聯(lián)想發(fā)布國內(nèi)首個軟硬一體元宇宙平臺:聯(lián)想晨星元宇宙平臺
工業(yè)元宇宙的應(yīng)用場景有哪些
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤燈顯示紅色,服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b>數(shù)據(jù)恢復(fù)—<b class='flag-5'>服務(wù)器</b>硬盤燈顯示紅色,<b class='flag-5'>服務(wù)器</b>崩潰的數(shù)據(jù)恢復(fù)案例](https://file1.elecfans.com/web2/M00/C4/78/wKgZomXzvXuAEFGcAAKmpuubElY738.png)
評論