網(wǎng)絡(luò)排錯對于網(wǎng)絡(luò)工程師或運維人員甚至對很多人(搞IT的朋友們)都十分重要,因此知道網(wǎng)絡(luò)排錯的一個詳細流程以及流程中每一步的原理就顯得非常重要了,當網(wǎng)絡(luò)出現(xiàn)問題時,我們就可以迅速排查出網(wǎng)絡(luò)問題所在,從而快速解決網(wǎng)絡(luò)問題。
這里要說的網(wǎng)絡(luò)排錯,應(yīng)該是適合大部分對網(wǎng)絡(luò)有一定了解的人員的,其實關(guān)于網(wǎng)絡(luò)排錯的方法,網(wǎng)絡(luò)上已經(jīng)有大部分的資料,但我個人覺得太多都只是停留在文字層面上的,對其中涉及的一些基本原理并沒有提及,因此實用性并不大,這里希望寫出一篇圖文并茂并有一定技術(shù)性的網(wǎng)絡(luò)排錯文章給大家,讓大家真正掌握一套系統(tǒng)的網(wǎng)絡(luò)排錯方法。
1 網(wǎng)絡(luò)排錯的必備條件
為什么要先講必備條件?因為這里所講的網(wǎng)絡(luò)排錯并不僅僅是停留在某一個小小命令的使用上,而是一套系統(tǒng)的方法,如果沒有這些條件,真的不能保證下面聊的這些可以聽得懂,并且能運用到實際當中,所以還是先看看這些基礎(chǔ)的條件吧。
1.1 熟悉 OSI 七層模型與 TCP/IP 協(xié)議棧
這應(yīng)該是網(wǎng)絡(luò)排錯要知道的最基本的知識了。
無論是 OSI 七層模型還是 DoD 模型,都是用來描述網(wǎng)絡(luò)通信的一個過程,以讓我們對網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收有一個大致的認識。OSI 七層模型對應(yīng) OSI 七層模型的協(xié)議,DoD 模型對應(yīng) DoD 模型的協(xié)議,也就是 TCP/IP 協(xié)議棧。
TCP/IP 協(xié)議棧里面的協(xié)議就顯得十分重要了,比如 DNS、TCP、UDP、IP、ICMP、ARP,這些最基本的應(yīng)該得知道吧,我們不需要像《TCP/IP 協(xié)議棧》中說得的那么細,但至少,對于這些協(xié)議的基本功能我們是必須得要知道的,這些就不是一兩句可以說清楚的了,計網(wǎng)里也都學(xué)了~
1.2 了解網(wǎng)絡(luò)通信的基礎(chǔ)設(shè)備和其對應(yīng)的 OSI 層次
像交換機、三層交換機、路由器、防火墻這些最基本的網(wǎng)絡(luò)設(shè)備應(yīng)該要有些了解,尤其是它們對應(yīng)的 OSI 層次以及作用,比如普通的二層交換機對應(yīng) OSI 七層模型中的數(shù)據(jù)鏈路層,它可以隔絕沖突域,同時可以通過虛擬局域網(wǎng)技術(shù)(VLAN)來隔絕廣播域,二層交換機通過二層地址即 MAC 地址來實現(xiàn)數(shù)據(jù)幀的轉(zhuǎn)發(fā);再比如路由器,它對應(yīng)網(wǎng)絡(luò)層,可以提供路由尋址的功能等等。
1.3 了解中小型企業(yè)網(wǎng)絡(luò)的基本架構(gòu)
一般中小型企業(yè)網(wǎng)絡(luò)的基本架構(gòu)都是這樣的:接入層 -- 匯聚層 -- 核心層 -- 網(wǎng)絡(luò)出口。
下面給個圖:
如果網(wǎng)絡(luò)環(huán)境比較龐大,匯聚層和核心層都會有,像這里的話,就直接沒有匯聚層,不過思想是一樣的。下面講的排錯其實都是針對用戶 PC 來說明的,事實上,數(shù)據(jù)中心中的網(wǎng)絡(luò)排錯也是類似的。不管網(wǎng)絡(luò)環(huán)境多么復(fù)雜,其實簡化下來跟這個都是差不多的。
1.4 知道常用的網(wǎng)絡(luò)排錯命令
如果用戶使用的是 Windows 操作系統(tǒng),那么下面的這些命令就很重要了:
如果使用的是 Linux 操作系統(tǒng),那么也有對應(yīng)的相關(guān)命令。其實說到底就是要熟悉你所使用的設(shè)備,當然,在實際網(wǎng)絡(luò)排錯的過程中,如果只是為了測試網(wǎng)絡(luò)通信是否正常,你可以換上你熟悉的設(shè)備操作。
1.5 清楚知道網(wǎng)絡(luò)排錯的一個重要原則
網(wǎng)絡(luò)排錯,不就是要判斷網(wǎng)絡(luò)哪里出了問題,因此,你就必須要知道數(shù)據(jù)的走向。
所以一個重要原則是:關(guān)注數(shù)據(jù)的走向。
下面講的網(wǎng)絡(luò)排錯思路其實就是通過追蹤數(shù)據(jù)的走向來一步步縮小網(wǎng)絡(luò)故障點的,因此,時刻記住這一點非常非常重要!這也是為什么上面需要讓你了解中小型企業(yè)網(wǎng)絡(luò)的基本架構(gòu)了。
2 網(wǎng)絡(luò)排錯的基本思路
基本思路如下,這跟網(wǎng)上的大多數(shù)人寫的應(yīng)該是差不多的。
(1)檢查物理鏈路是否有問題
(2)查看本機 IP 地址、路由、DNS 的設(shè)置是否有問題
(3)測試網(wǎng)關(guān)或路由器的通暢情況。先測網(wǎng)關(guān)然后再測路由器,一級一級地測試
(4)測試 ping 公網(wǎng) ip 的通暢情況(平時要記幾個外部 IP)
(5)測試 DNS 的通暢情況,可以直接 ping 網(wǎng)站地址
3 網(wǎng)絡(luò)排錯詳細步驟
為了更好的講述網(wǎng)絡(luò)排錯的過程和思路,假設(shè)我們有下面的一個網(wǎng)絡(luò)環(huán)境:
(說明:雖然是假設(shè),但實際上該網(wǎng)絡(luò)環(huán)境是通過 GNS3 聯(lián)動虛擬機和真實網(wǎng)絡(luò)架設(shè)起來的,所以是可以真實參考的)
下面,我們就以上面這個網(wǎng)絡(luò)環(huán)境為例子,詳細介紹我們的網(wǎng)絡(luò)排錯思路,每一步要怎么做,每一步為什么要這樣做以及這樣做之后我們可以得到什么信息,都會做一個說明。
3.1 檢查物理鏈路是否有問題
這一步是我個人認為在做網(wǎng)絡(luò)排錯時必須要做的第一步!經(jīng)常會聽朋友說,領(lǐng)導(dǎo)的電腦上不了網(wǎng),需要過去排錯,搞了老半天,還發(fā)現(xiàn)不了問題,最后在幾經(jīng)絕望之時,竟然發(fā)現(xiàn)網(wǎng)線都沒接上電腦。這就真的是悲劇了,浪費了很多時間不說,這樣的網(wǎng)絡(luò)排錯思路本來就是有錯誤的。
因為也許不是每個人都可以去機房查看交換機的接線情況,所以這一步,我們排查的重點范圍就應(yīng)該放在如下面圖所示的地方:
在這一步,下面幾點是需要注意排查的:
1. 確認電腦本身的網(wǎng)卡有沒有問題
2. 確認接的網(wǎng)線有沒有問題
3. 本機所連接的交換機(如果可以去機房查看的話)
如果上面這幾點排查都沒有問題了,那么就是該網(wǎng)絡(luò)環(huán)境中的其他設(shè)備問題了。這一范圍的排查相對比較簡單,因為只涉及到物理鏈路的連接問題。
對于這種測試,可以考慮使用測線器,但個人的建議是,拿一臺配置正確的筆記本來做測試也未嘗不可。
3.2 查看本機 IP 地址、路由、DNS 的設(shè)置是否有問題
上面第一步,物理鏈路的排查沒有問題了,也就是說,電腦接上網(wǎng)線之后,電腦有反應(yīng)了,可以識別,但是網(wǎng)絡(luò)還是不通,來到這一步,就應(yīng)該先把注意的范圍放在電腦的設(shè)置上面了。
這一步,我們關(guān)注的重點是:
1. IP 地址設(shè)置
如果采用的是 DHCP 自動獲取的方法,那么這時候只需要看自己本機的設(shè)置上有沒有開啟自動獲取 IP 的設(shè)置以及有沒有開啟相關(guān)的服務(wù);
如果用的是靜態(tài) IP,那么就必須要注意 IP 地址的填寫有沒有錯(一般網(wǎng)絡(luò)管理人員給的)、IP 地址的子網(wǎng)掩碼有沒有問題(這很重要,對于靜態(tài) IP,很多人在這里設(shè)置錯誤,建議是,最好把 IP 地址、VLSM 這方面的知識學(xué)一下)。
一般可以用下面的命令查看:
2. 路由設(shè)置
對于服務(wù)器、PC,一般是指默認網(wǎng)關(guān)的設(shè)置了;對于路由器本身或三層交換機,那就是靜態(tài)路由或動態(tài)路由的設(shè)置問題了。
3. DNS 設(shè)置
主要是要確保所設(shè)置的 DNS 服務(wù)器地址到底有沒有提供域名解析服務(wù)或者是否出現(xiàn)了故障,至于如何判斷,后面會給出方法,這里關(guān)注的是,你得設(shè)置一個正確的 DNS 服務(wù)器地址或可以自動獲取。在 windows 上面你可以通過下面的命令查看:
3.3 測試網(wǎng)關(guān)或路由器的通暢情況。先測網(wǎng)關(guān)然后再測路由器,一級一級地測試
在上面的網(wǎng)絡(luò)環(huán)境中,在網(wǎng)絡(luò)通的情況下,我們在電腦上使用命令 tracert -d 命令,會得到下面的結(jié)果:
通過這個測試結(jié)果,我們可以清楚地知道電腦在訪問互聯(lián)網(wǎng)時,數(shù)據(jù)的走向情況:
根據(jù)這個數(shù)據(jù)走向,我們就可以得到一個重要的思路,就是根據(jù)數(shù)據(jù)走向來檢測網(wǎng)絡(luò)的通暢情況!因此,我們可以分兩步:
1. 先測試電腦到網(wǎng)關(guān) 192.168.2.254 的通暢情況
我們可以在自己的電腦上自己 ping 網(wǎng)關(guān)的地址,看是否有響應(yīng)
一般這樣的判斷方法是比較快的,但有時候,無論怎樣 ping 都不能,那么則可能有以下的幾種情況:
a. 網(wǎng)關(guān)設(shè)備做了禁止 ping 的設(shè)置
b. 網(wǎng)關(guān)接口或網(wǎng)關(guān)設(shè)備出現(xiàn)故障
對于 a,一般很少會在這些設(shè)備在做 ping 的限制操作,實在是沒有太大的必要這樣做,當然,網(wǎng)絡(luò)安全等要求十分嚴格的除外。ping 通 192.168.2.254 網(wǎng)關(guān)后,再 ping 一下 172.16.13.1 以確認電腦到整個網(wǎng)關(guān)設(shè)備都沒有問題。
對于 ping 不通的時候,我個人還建議在電腦上執(zhí)行如下操作:
即查看電腦本身有沒有獲取到網(wǎng)關(guān)的 MAC 的地址,顯然,如果沒有網(wǎng)關(guān)的 MAC 地址,那也是不可能 ping 通網(wǎng)關(guān)的,在排除了前面電腦設(shè)置的問題后,你可以猜測是網(wǎng)關(guān)設(shè)備出了問題,這時就可以聯(lián)系網(wǎng)絡(luò)工程師對網(wǎng)關(guān)設(shè)備進行測試了。
2. 測試到其它路由器的通暢情況
前面一步?jīng)]有問題了,也就是電腦到網(wǎng)關(guān)通信正常了,再測試網(wǎng)關(guān)到出口路由器的通暢情況:
這里,我們使用 tracert -d 命令就可以了:
當然,如果發(fā)現(xiàn)不通,那么則可能是下面的情況:
a. 網(wǎng)關(guān)設(shè)備與路由器之間的物理鏈路問題
b. 網(wǎng)關(guān)設(shè)備與路由器之間的設(shè)置問題,比如路由協(xié)議、接口配置之類的
出現(xiàn)上面的情況,那就是網(wǎng)絡(luò)工程師的問題了,當然,如果你是網(wǎng)絡(luò)工程師,應(yīng)該要馬上查看一下設(shè)備的狀態(tài),看是不是設(shè)備哪里出現(xiàn)問題了。
上面的步驟完成了,假設(shè)你的出口路由器設(shè)置是沒有問題的,比如 NAT 與默認路由等的設(shè)置,那么我們大致可以知道,內(nèi)網(wǎng)的一個基本通信是正常的(至少你的電腦和出口路由器的通信沒問題),我們就要看看電腦到底能不能訪問互聯(lián)網(wǎng)了。
3.4 測試 ping 公網(wǎng) ip 的通暢情況(平時要記幾個外部 IP)
來到這一步的時候,就說明前面三步是沒有問題的,也就是說,本地局域網(wǎng)絡(luò)的通信是正常的,這時要做的就是判斷本地局域網(wǎng)絡(luò)與外網(wǎng)(公網(wǎng))之間的通信有沒有問題了:
這里采取的是直接 ping 公網(wǎng)地址的方法,是為了排除 DNS 的影響(萬一你的 DNS 設(shè)置又有問題),至于要 ping 什么樣的公網(wǎng)地址,個人建議是,可以 ping 一些沒有禁止 ping 的公共 DNS 服務(wù)器地址,比如 114.114.114.114 和 8.8.8.8 的:
這樣之后,基本上就可以確定網(wǎng)絡(luò)是沒有問題的了。當然,這里并沒有提到出口放置防火墻的情況,實際上,思路是一致的,但是,你需要考慮的是,你的訪問數(shù)據(jù)有沒有被防火墻給過濾掉,是數(shù)據(jù)出去的時候過濾了,還是數(shù)據(jù)回來的時候過濾了?由于還要涉及到防火墻的設(shè)置,這里就不再提及了,只是仍要注意這一點就是了。
3.5 測試 DNS 的通暢情況,可以直接 ping 網(wǎng)站地址
如題,可以直接 ping 網(wǎng)站地址,看有沒有回顯 IP 地址,至于通不通是另外一回事,只要可以回顯 IP 地址,那么 DNS 就沒有問題了,不過這里仍然要說一下 nslookup 這個命令,這是一個非常好用的命令,我平常自己在網(wǎng)絡(luò)排錯時,基本上都會用到:
當然也可以像下面這樣使用:
使用 nslookup 命令,作用有二:
1. 幫你測試你設(shè)置的 DNS 服務(wù)器有沒有問題
2. 在不考慮 DNS 服務(wù)器是否智能的前提下,你可以根據(jù)回顯 IP 地址速度的快慢來大致判斷 DNS 服務(wù)器的優(yōu)劣情況
所以可以充分利用 nslookup 命令了。
4 最后的重要說明
其實基本上,一個相對完整的網(wǎng)絡(luò)排錯過程就應(yīng)該如上面所說的了,不過,是基本上的,因為上面的講解,都幾乎是假定你是沒有權(quán)限進入機房查看網(wǎng)絡(luò)設(shè)備的情況的。
事實上,你是根本不需要照搬來進行上面的全部步驟的,在實際排錯的過程中,可能你用到的只是其中的一小部分而已,畢竟,如果每次都這樣下來,沒有誰是不會瘋掉的,因為一些很簡單的問題也要這樣折騰,那就是太浪費時間了!但是,上面的方法,只是提出一種網(wǎng)絡(luò)排錯的思路,希望按照這個思路可以判斷出網(wǎng)絡(luò)的問題出現(xiàn)在哪里,至于如何去解決,這中間真的又涉及到太多太多的經(jīng)驗問題。其實整個下來,個人覺得,最重要的仍然不是技術(shù)本身,而是在網(wǎng)絡(luò)排錯過程當中的一個思路,思路決定出路,這可以讓自己在網(wǎng)絡(luò)排錯的過程中時刻保持清醒的頭腦,這一點很重要。
編輯:黃飛
?
評論
查看更多