0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

談談一個字符的網(wǎng)路旅程

馬哥Linux運維 ? 來源:CSDN ? 2023-07-31 09:57 ? 次閱讀

我們開發(fā)的面向普通用戶的應用程序,目前看來幾乎都是互聯(lián)網(wǎng)應用程序,也就是說,用戶操作的應用程序,不管是瀏覽器還是移動App,核心請求都會通過互聯(lián)網(wǎng)發(fā)送到后端的數(shù)據(jù)中心進行處理。這個數(shù)據(jù)中心可能是像微信這樣的自己建設的、在多個地區(qū)部署的大規(guī)模機房,也可能是阿里云這樣的云服務商提供的一個虛擬主機。

但是不管這個數(shù)據(jù)中心的大小,應用程序都需要在運行期和數(shù)據(jù)中心交互。比如我們在淘寶的搜索框隨便輸入一個字符“a”,就會在屏幕上看到一大堆商品。那么我們的手機是如何通過互聯(lián)網(wǎng)完成這一操作的?這個字符如何穿越遙遠的空間,從手機發(fā)送到淘寶的數(shù)據(jù)中心,在淘寶計算得到相關的結果,然后將結果再返回到我們的手機上,從而完成自己的互聯(lián)網(wǎng)之旅呢?

雖然我們在編程的時候,很少要自己直接開發(fā)網(wǎng)絡通信代碼,服務器由Tomcat這樣的WEB容器管理網(wǎng)絡通信,服務間網(wǎng)絡通信通過Dubbo這樣的分布式服務框架完成網(wǎng)絡通信。但是由于我們現(xiàn)在開發(fā)的應用主要是互聯(lián)網(wǎng)應用,它們構建在網(wǎng)絡通信基礎上,網(wǎng)絡通信的問題可能會出現(xiàn)在系統(tǒng)運行的任何時刻。了解網(wǎng)絡通信原理,了解互聯(lián)網(wǎng)應用如何跨越龐大的網(wǎng)絡構建起來,對我們開發(fā)一個互聯(lián)網(wǎng)應用系統(tǒng)很有幫助,對我們解決系統(tǒng)運行過程中各種因為網(wǎng)絡通信而出現(xiàn)的各種問題更有幫助。

DNS

我們先從DNS說起。

構成互聯(lián)網(wǎng)Internet的最基本的網(wǎng)絡協(xié)議就是互聯(lián)網(wǎng)協(xié)議Internet Protocol,簡稱IP協(xié)議。IP協(xié)議里面最重要的部分是IP地址,各種計算機設備之間能夠互相通信,首先要能夠找到彼此,IP地址就是互聯(lián)網(wǎng)的地址標識。手機上的淘寶App能夠訪問淘寶的數(shù)據(jù)中心,就是知道了淘寶數(shù)據(jù)中心負責請求接入的服務器的IP地址,然后建立網(wǎng)絡連接,進而處理請求數(shù)據(jù)。

那么手機上的淘寶App如何知道數(shù)據(jù)中心服務器的IP地址呢?當然淘寶的工程師可以在App里寫死這個IP地址,但是這樣做會帶來很多問題,比如影響編程的靈活性以及程序的可用性等。

事實上這個IP地址是通過DNS域名解析服務器得到的。當我們打開淘寶App的時候,淘寶要把App首頁加載進來,這時候就需要連接域名服務器進行域名解析,將xxx.taobao.com這樣的域名解析為一個IP地址,然后連接目標服務器。

c337e56c-2ee4-11ee-815d-dac502259ad0.png

CDN

事實上DNS解析出來的IP地址,并不一定是淘寶數(shù)據(jù)中心的IP地址,也可能是淘寶CDN服務器的IP地址。

CDN是內容分發(fā)網(wǎng)絡Content Delivery Network的縮寫。我們能夠用手機或者電腦上網(wǎng),是因為運營服務商為我們提供了互聯(lián)網(wǎng)接入服務,將我們的手機和電腦連接到互聯(lián)網(wǎng)上。App請求的數(shù)據(jù)最先到達的是運營服務商的機房,然后運營商通過自己建設的骨干網(wǎng)絡和交換節(jié)點,將我們請求數(shù)據(jù)的目的地址發(fā)往互聯(lián)網(wǎng)的任何地方。

為了提高用戶請求訪問的速度,也為了降低數(shù)據(jù)中心的負載壓力,淘寶會在全國各地各個主要的運營服務商的接入機房中部署一些緩存服務器,緩存那些靜態(tài)的圖片、資源文件等,這些緩存服務器構成了淘寶的CDN。

如果用戶請求的數(shù)據(jù)數(shù)據(jù)是靜態(tài)的資源,這些資源的URL通常以image.taobao.com之類的二級域名進行標識,域名解析的時候就會解析為淘寶CDN的IP地址,請求先被CDN處理,如果CDN中有需要的靜態(tài)文件,就直接返回,如果沒有,CDN會將請求發(fā)送到淘寶的數(shù)據(jù)中心,CDN從淘寶數(shù)據(jù)中心獲得靜態(tài)文件后,一方面緩存在自己的服務器上,一方面將數(shù)據(jù)返回給用戶的App。

c33e3b9c-2ee4-11ee-815d-dac502259ad0.png

而如果請求的數(shù)據(jù)是動態(tài)的,比如要搜索關鍵詞為“a”的商品列表,請求的域名可能會是search.taobao.com這樣的二級域名,就會直接被DNS解析為淘寶的數(shù)據(jù)中心的服務器IP地址,App請求發(fā)送到數(shù)據(jù)中心處理。

HTTP

不管發(fā)送到CDN還是數(shù)據(jù)中心,App請求都會以HTTP協(xié)議發(fā)送。

HTTP是一個應用層協(xié)議,當我們進行網(wǎng)絡通信編程的時候,通常需要關注兩方面的內容,一方面是應用層的通信協(xié)議,主要是我們通信的數(shù)據(jù)如何編碼,既能使網(wǎng)絡傳輸過去的數(shù)據(jù)攜帶必要的信息,又使通信的兩方都能正確識別這些數(shù)據(jù),即通信雙方應用程序需要約定一個數(shù)據(jù)編碼協(xié)議。另一方面就是網(wǎng)絡底層通信協(xié)議,即如何為網(wǎng)絡上需要通信的兩個節(jié)點建立連接完成數(shù)據(jù)傳輸,目前互聯(lián)網(wǎng)應用中最主要的就是TCP協(xié)議。

在TCP傳輸層協(xié)議層面,就是保證建立通信兩方的穩(wěn)定通信連接,將一方的數(shù)據(jù)以bit流的方式源源不斷地發(fā)送到另一方,至于這些數(shù)據(jù)代表什么意思,哪里是兩次請求的分界點,TCP協(xié)議統(tǒng)統(tǒng)不管,需要應用層面自己解決。如果我們基于TCP協(xié)議自己開發(fā)應用程序,就必須解決這些問題。而互聯(lián)網(wǎng)應用需要在全球范圍為用戶提供服務,將全球的應用和全球的用戶聯(lián)系在一起,需要一個統(tǒng)一的應用層協(xié)議,這個協(xié)議就是HTTP協(xié)議。

c35eae54-2ee4-11ee-815d-dac502259ad0.png

這張圖是HTTP的請求頭的例子,包括請求方法和請求頭參數(shù)。請求方法主要有GET、POST,這是我們最常用的兩種,此外還有DELETE、PUT、HEAD、TRACE等幾種方法;請求頭參數(shù)包括緩存控制Cache-Control、響應過期時間Expires、Cookie等等。

HTTP請求如果是GET方法,那么就只有請求頭;如果是POST方法,在請求頭之后還有一個body部分,包含請求提交的內容,HTTP會在請求頭的Content-Length參數(shù)聲明body的長度。

c383d8aa-2ee4-11ee-815d-dac502259ad0.png

這是HTTP響應頭的例子,響應頭和請求頭一樣包含各種參數(shù),而status狀態(tài)碼聲明響應狀態(tài),狀態(tài)碼是200,表示響應正常。

響應狀態(tài)碼是3XX,表示請求被重定向,常用的302,表示請求被臨時重定向到新的URL,響應頭中包含新的臨時URL,客戶端收到響應后,重新請求這個新的URL;狀態(tài)碼是4XX,表示客戶端錯誤,常見的403,表示請求未授權,被禁止訪問,404表示請求的頁面不存在;狀態(tài)碼是5XX,表示服務器異常,常見的500請求未完成,502請求處理超時,503服務器過載。

如果響應正常,那么在響應頭之后就是響應body,瀏覽器的響應body通常是一個HTML頁面,App的響應body通常是個JSON字符串。

TCP

應用程序使用操作系統(tǒng)的socket接口進行網(wǎng)絡編程,socket里封裝了TCP協(xié)議。應用程序通過socket接口使用TCP協(xié)議完成網(wǎng)絡編程,socket或者TCP在應用程序看就是一個底層通信協(xié)議,事實上,TCP僅僅是一個傳輸層協(xié)議,在傳輸層協(xié)議之下,還有網(wǎng)絡層協(xié)議,網(wǎng)絡層協(xié)議之下還有數(shù)據(jù)鏈路層協(xié)議,數(shù)據(jù)鏈路層協(xié)議之下還有物理層協(xié)議。

c3b17260-2ee4-11ee-815d-dac502259ad0.png

傳輸層協(xié)議TCP和網(wǎng)絡層協(xié)議IP共同構成TCP/IP協(xié)議棧,成為互聯(lián)網(wǎng)應用開發(fā)最主要的通信協(xié)議。OSI開放系統(tǒng)互聯(lián)模型將網(wǎng)絡協(xié)議定義了7層,TCP/IP協(xié)議棧將OSI頂部三層協(xié)議應用層、表示層、會話層合并為一個應用層,HTTP協(xié)議就是TCP/IP協(xié)議棧中的應用層協(xié)議。

物理層負責數(shù)據(jù)的物理傳輸,計算機輸入輸出的只能是0 1這樣的二進制數(shù)據(jù),但是在真正的通信線路里有光纖、電纜、無線各種設備。光信號和電信號,以及無線電磁信號在物理上是完全不同的,如何讓這些不同的設備能夠理解、處理相同的二進制數(shù)據(jù),這就是物理層要解決的問題。

數(shù)據(jù)鏈路層就是將數(shù)據(jù)進行封裝后交給物理層進行傳輸,主要就是將數(shù)據(jù)封裝成數(shù)據(jù)幀,以幀為單位通過物理層進行通信,有了幀,就可以在幀上進行數(shù)據(jù)校驗,進行流量控制。數(shù)據(jù)鏈路層會定義幀的大小,這個大小也被稱為最大傳輸單元。

像HTTP要在傳輸?shù)臄?shù)據(jù)上添加一個HTTP頭一樣,數(shù)據(jù)鏈路層也會將封裝好的幀添加一個幀頭,幀頭里記錄的一個重要信息就是發(fā)送者和接受者的mac地址。mac地址是網(wǎng)卡的設備標識符,是唯一的,數(shù)據(jù)幀通過這個信息確保數(shù)據(jù)送達到正確的目標機器。

前面已經(jīng)提到,網(wǎng)絡層IP協(xié)議使得互聯(lián)網(wǎng)應用根據(jù)IP地址就能訪問到淘寶的數(shù)據(jù)中心,請求離開App后,到達運營服務商的交換機,交換機會根據(jù)這個IP地址進行路由轉發(fā),可能中間會經(jīng)過很多個轉發(fā)節(jié)點,最后數(shù)據(jù)到達淘寶的服務器。

網(wǎng)絡層的數(shù)據(jù)需要交給鏈路層進行處理,而鏈路層幀的大小定義了最大傳輸單元,網(wǎng)絡層的IP數(shù)據(jù)包必須要小于最大傳輸單元才能進行網(wǎng)絡傳輸,這個數(shù)據(jù)包也有一個IP頭,主要包括的就是發(fā)送者和接受者的IP地址。

IP協(xié)議不是一個可靠的通信協(xié)議,并不會確保數(shù)據(jù)一定送達。要保證通信的穩(wěn)定可靠,需要傳輸層協(xié)議TCP。TCP協(xié)議在傳輸正式數(shù)據(jù)前,會先建立連接,這就是著名的TCP三次握手。

c3cb953c-2ee4-11ee-815d-dac502259ad0.png

App和服務器之間發(fā)送三次報文才會建立一個TCP連接,報文中的SYN表示請求建立連接,ACK表示確認。App先發(fā)送 SYN=1,Seq=X的報文,表示請求建立連接,X是一個隨機數(shù);淘寶服務器收到這個報文后,應答SYN=1,ACK=X+1,Seq=Y的報文,表示同意建立連接;App收到這個報文后,檢查ACK的值為自己發(fā)送的Seq值+1,確認建立連接,并發(fā)送ACK=Y+1的報文給服務器;服務器收到這個報文后檢查ACK值為自己發(fā)送的Seq值+1,確認建立連接。至此,App和服務器建立起TCP連接,就可以進行數(shù)據(jù)傳輸了。

TCP也會在數(shù)據(jù)包上添加TCP頭,TCP頭除了包含一些用于校驗數(shù)據(jù)正確性和控制數(shù)據(jù)流量的信息外,還包含通信端口信息,一臺機器可能同時有很多進程在進行網(wǎng)絡通信。如何使數(shù)據(jù)到達服務器后能發(fā)送給正確的進程去處理,就需要靠通信端口進行標識了。HTTP默認端口是80,當然我們可以在啟動HTTP應用服務器進程的時候,隨便定義一個數(shù)字作為HTTP應用服務器進程的監(jiān)聽端口,但是App在請求的時候,必須在URL中包含這個端口,才能在構建的TCP包中記錄這個端口,也才能在到達服務器后,被正確的HTTP服務器進程處理。

如果我們以POST方法提交一個搜索請求給淘寶服務器,那么最終在數(shù)據(jù)鏈路層構建出來的數(shù)據(jù)幀大概是這個樣子,這里假設IP數(shù)據(jù)包的大小沒有超過鏈路層的最大傳輸單元。

c3d2ac8c-2ee4-11ee-815d-dac502259ad0.png

App要發(fā)送的數(shù)據(jù)只是key="a"這樣一個JSON字符串,每一層協(xié)議都會在上一層協(xié)議基礎上添加一個頭部信息,最后封裝成一個鏈路層的數(shù)據(jù)幀在網(wǎng)絡上傳輸,發(fā)送給淘寶的服務器。淘寶的服務器在收到這個數(shù)據(jù)幀后,在通信協(xié)議的每一層進行校驗檢查,確保數(shù)據(jù)準確后,將頭部信息刪除,再交給自己的上一層協(xié)議處理。HTTP應用服務器在最上層,負責HTTP協(xié)議的處理,最后將key="a"這個JSON字符串交給淘寶工程師開發(fā)的應用程序處理。

LB(負載均衡)

HTTP請求到達淘寶數(shù)據(jù)中心的時候,事實上也并不是直接發(fā)送給搜索服務器處理。因為對于淘寶這樣日活用戶數(shù)億的互聯(lián)網(wǎng)應用而言,每時每刻都有大量的搜索請求到達數(shù)據(jù)中心,為了使這些海量的搜索請求都能得到及時處理,淘寶會部署一個由數(shù)千臺服務器組成的搜索服務器集群,共同為這些高并發(fā)的請求提供服務。

因此,搜索請求到達數(shù)據(jù)中心的時候,首先到達的是搜索服務器集群的負載均衡服務器,也就是說,DNS解析出來的是負載均衡服務器的IP地址。然后,由負載均衡服務器將請求分發(fā)到搜索服務器集群中的某臺服務器上。

負載均衡服務器的實現(xiàn)手段有很多種,淘寶這樣規(guī)模的應用,通常使用Linux內核支持的鏈路層負載均衡。

c3f305e0-2ee4-11ee-815d-dac502259ad0.png

這種負載均衡模式也叫直接路由模式,在負載均衡服務器的Linux操作系統(tǒng)內核拿到數(shù)據(jù)包后,直接修改數(shù)據(jù)幀中的mac地址,將其修改為搜索服務器集群中某個服務器的mac地址,然后將數(shù)據(jù)重新發(fā)送回服務器集群所在的局域網(wǎng),這個數(shù)據(jù)幀就會被某個真實的搜索服務器接收到。

負載均衡服務器和集群內的搜索服務器配置相同的虛擬IP地址,也就是說,在網(wǎng)絡通信的IP層面,負載均衡服務器變更mac地址的操作是透明的,不影響TCP/IP的通信連接。所以真實的搜索服務器處理完搜索請求,發(fā)送應答響應的時候,就會直接發(fā)送回請求的App手機,不會再經(jīng)過負載均衡服務器。

總結

事實上,這個搜索字符“a”的互聯(lián)網(wǎng)之旅到這里還沒有結束。淘寶搜索服務器程序在收到這個搜索請求的時候,首先在本地緩存中查找是否有對應的搜索結果。如果沒有,會將這個搜索請求,也就是這個字符發(fā)送給一個分布式緩存集群查找是否有對應的搜索結果。如果還沒有,才會將這個請求發(fā)送給一個更大規(guī)模的搜索引擎集群去查找。

這些分布式緩存集群或者搜索引擎集群都需要通過RPC遠程過程調用的方式進行調用請求,也就是需要通過網(wǎng)絡進行服務調用,這些網(wǎng)絡服務也都是基于TCP協(xié)議進行編程的。

對于互聯(lián)網(wǎng)應用,用戶請求數(shù)據(jù)離開手機通過各種網(wǎng)絡通信,最后到達數(shù)據(jù)中心的應用服務器進行最后的計算、處理,中間會經(jīng)過許多環(huán)節(jié),事實上,這些環(huán)節(jié)就構成了互聯(lián)網(wǎng)系統(tǒng)的整體架構,所以通過網(wǎng)絡通信,可以將整個互聯(lián)網(wǎng)應用系統(tǒng)串起來,對理解互聯(lián)網(wǎng)系統(tǒng)的技術架構很有幫助,在程序開發(fā)、運行過程中遇到各種網(wǎng)絡相關問題,也可以快速分析問題原因,快速解決問題。

鏈接:https://blog.csdn.net/qq_35030548/article/details/131872192





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DNS
    DNS
    +關注

    關注

    0

    文章

    218

    瀏覽量

    19845
  • RPC
    RPC
    +關注

    關注

    0

    文章

    111

    瀏覽量

    11537
  • 虛擬機
    +關注

    關注

    1

    文章

    917

    瀏覽量

    28209
  • HTTP協(xié)議

    關注

    0

    文章

    62

    瀏覽量

    9722
  • TCP通信
    +關注

    關注

    0

    文章

    146

    瀏覽量

    4223

原文標題:一個字符的網(wǎng)路旅程

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    請問C語言中如何解析一個字符串?

    我是通過WIFI模塊獲取一個字符串,然后現(xiàn)在想要解析出一個字符,想把那個字符轉換成16進制,然后賦值給P0口,
    發(fā)表于 10-13 17:59

    labview中已知4個字符串(每個字符串包含一個字符)如何隨機排列?

    labview中已知4個字符串(每個字符串包含一個字符)如何隨機排列?求大神給程框圖。
    發(fā)表于 01-22 15:43

    51單片機發(fā)一個字符串給單片機串口,請問是收到一個字符串才中斷次嗎?

    在學校沒學到什么,現(xiàn)在在小工司當學小工人,有空看下嵌入式,最近看到了串口通信。寫了串口通信的例子。也不是自己寫的,就是看別人的例子,模仿下。但是我想不懂,串口通信是
    發(fā)表于 02-18 06:35

    請問使用Mbed庫的串口怎么接收一個字符串?

    getc 只能收一個字節(jié).scanf 需要字符串以換行符結尾.如題,就是非阻塞方式接收一個字符串,感謝回復.STM32里有線路空閑中斷,Mbed里沒用到.
    發(fā)表于 03-01 06:17

    如何才能接收不止一個字符

    很好的天我直試圖從PC超級終端接收數(shù)據(jù),但我不明白如何才能接收不止一個字符。 以上來自于百度翻譯 以下為原文Good day I've been trying to recieve data
    發(fā)表于 07-23 12:55

    如何判斷一個字符串開頭?

    命令以“$Cmd,”開頭,以“,”分隔,以“*”結尾。單片機回復以“$Message,”開頭,以“,”分隔,以“*”結尾。如果錯誤這以“$Message,ERROR,”開頭,以“,”分隔,以“*”結尾。我想問我如何判斷一個字符串開頭,判斷一個字符沒問題,但判斷
    發(fā)表于 09-11 22:13

    如何輸出連接的字符串中的第一個字符串?

    本帖最后由 疃12345 于 2021-4-19 22:11 編輯 如何輸出第一個字符串?要求單獨輸出第一個字符串,不影響這字符串的連接與輸出,如圖所示,輸出數(shù)值0.4869
    發(fā)表于 04-19 22:07

    求分享STM32從串口讀取一個字符的程序

    求分享STM32從串口讀取一個字符的程序
    發(fā)表于 12-09 07:16

    CC2530如何向上位機PC發(fā)送一個字符串?

    CC2530如何向上位機PC發(fā)送一個字符串?
    發(fā)表于 01-25 06:05

    C語言教程之輸出一個字符的前驅字符

    C語言教程之輸出一個字符的前驅字符,很好的C語言資料,快來學習吧。
    發(fā)表于 04-22 17:45 ?0次下載

    如何編寫C語言程序判斷一個字符是否是字母或數(shù)字

    怎樣判斷一個字符是否是一個字母? 字母表中的所有字母(包括計算機鍵盤上的所有鍵)都被賦予了值,這些字符及其相應的值
    發(fā)表于 01-23 14:50 ?10次下載
    如何編寫C語言程序判斷<b class='flag-5'>一個字符</b>是否是字母或數(shù)字

    解決STM32串口丟失第一個字符

    在使用STM32串口時可能會發(fā)現(xiàn)問題就是發(fā)送字符串時第一個字符缺失情況。解決辦法在發(fā)送字符串前加入以下代碼:if(!(USART1->S
    發(fā)表于 12-27 19:28 ?10次下載
    解決STM32串口丟失第<b class='flag-5'>一個字符</b>

    如何利用Java判斷一個字符串是否包含某個字符

    如何利用Java通過不同的方法來判斷一個字符串是否包含某個字符。 **2 ****方法** 1. .contains方法
    的頭像 發(fā)表于 02-17 15:13 ?1500次閱讀
    如何利用Java判斷<b class='flag-5'>一個字符</b>串是否包含某<b class='flag-5'>個字符</b>

    如何使用JDK截斷一個字符

    目標。 使用JDK截斷一個字符串 Java提供了許多方便的方法來截斷 String 。讓我們來看看。 使用 String 的 substring() 方法 String 類有
    的頭像 發(fā)表于 10-08 15:43 ?522次閱讀

    mysql字符串包含某個字符

    MySQL是種開源的關系型數(shù)據(jù)庫管理系統(tǒng),被廣泛用于構建Web應用程序和其他大型數(shù)據(jù)驅動的應用。在進行MySQL數(shù)據(jù)庫查詢時,經(jīng)常需要使用字符串包含操作,即判斷一個字符串是否包含另一個字符
    的頭像 發(fā)表于 11-16 14:52 ?3822次閱讀