0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

以太網(wǎng)存儲網(wǎng)絡(luò)的擁塞管理連載方案(一)

Linux閱碼場 ? 來源:Linux閱碼場 ? 2024-02-26 10:52 ? 次閱讀

本章重點(diǎn)介紹不使用TCP 而使用無損以太網(wǎng)網(wǎng)絡(luò)的存儲協(xié)議,如FCoE、RoCE 和RoCEv2。第8 章"TCP 存儲網(wǎng)絡(luò)中的擁塞管理"主要介紹在有損以太網(wǎng)網(wǎng)絡(luò)中使用TCP 傳輸?shù)拇鎯f(xié)議,如iSCSI 和NVMe/TCP。

以太網(wǎng)流量控制

以太網(wǎng)流量控制有兩種類型

1. 鏈路級流量控制(LLFC):LLFC 可在直接連接的設(shè)備之間對鏈路上的所有流量進(jìn)行流量控制。LLFC 是一項IEEE 標(biāo)準(zhǔn)(IEEE 802.3x)。

2.基于優(yōu)先級的流量控制(PFC):PFC 可在直接連接的設(shè)備之間對特定流量類別進(jìn)行流量控制,而其他流量類別則在無流量控制的情況下繼續(xù)運(yùn)行。PFC 也是IEEE 標(biāo)準(zhǔn)(IEEE 802.1Qbb)。

LLFC 類似于光纖通道B2B 流量控制機(jī)制,它對鏈路上的所有流量進(jìn)行流量控制(第2 章"了解光纖通道Fabric 中的擁塞",光纖通道流量控制部分)。相反,當(dāng)光纖通道鏈路使用多個虛擬鏈路或電路(VL 或VC)運(yùn)行時,PFC 類似于ER_RDY(或VC_RDY)流量控制機(jī)制(第6 章"在光纖通道Fabric 中防止擁塞",了解虛擬鏈路一節(jié))。在光纖通道Fabric 中,所有流量都需要無損行為,因此所有VL 都啟用了流量控制,而在以太網(wǎng)網(wǎng)絡(luò)中,只有部分流量類別受流量控制,其他類別的流量則不受流量控制。這有助于在同一以太網(wǎng)鏈路上實(shí)現(xiàn)有損和無損行為。

如第1 章"無損網(wǎng)絡(luò)"一節(jié)所述,以太網(wǎng)流量控制(或一般無損網(wǎng)絡(luò))并不能保證不丟幀。當(dāng)幀因比特錯誤而損壞時,以及當(dāng)擁塞嚴(yán)重時幀在緩沖區(qū)中長時間滯留時,仍然會丟棄幀。這些細(xì)節(jié)將在后面的"通過丟棄幀恢復(fù)擁塞"一節(jié)中解釋。

以太網(wǎng)流量控制如何工作?

以太網(wǎng)使用一種稱為暫停幀的特殊幀進(jìn)行流量控制。暫停幀的內(nèi)容、發(fā)送時間和發(fā)送頻率允許直接連接的發(fā)送方調(diào)整傳輸速率,以避免接收方緩沖區(qū)超限。這就避免了因接收方缺乏空閑緩沖區(qū)而造成的數(shù)據(jù)包丟失,從而實(shí)現(xiàn)了無損網(wǎng)絡(luò)。

暫停時間

暫停幀有一個稱為quanta的字段,用于表示必須停止幀傳輸?shù)某掷m(xù)時間(稱為暫停時間)。quanta值范圍在0 到65535 之間(16 位最大值為0xFFFF)。要計算暫停時間,可將quanta值乘以在鏈路上傳輸512 比特所需的時間。無論鏈路的運(yùn)行速度如何,這一方案都有助于實(shí)現(xiàn)一致的執(zhí)行。它還能確保最大暫停時間隨著鏈路速度的增加而減少,這是適應(yīng)高速鏈路上更快傳輸速率的需要。

如下式所示,要將暫停quanta轉(zhuǎn)換為秒,需要將其乘以512,再除以每秒比特的端口速度。

Pause time in seconds = (Pause quanta x 512) / Port speed in bits per second

例如,在10 GbE 鏈路上,單個暫停幀的最大暫停時間為3.355 ms((65535 x 512)/(10 x 109))。當(dāng)10 GbE 端口收到quanta值為0xFFFF 的暫停幀時,可停止傳輸3.355 毫秒。同樣,100 GbE 鏈路的最大暫停時間為0.355 ms。

數(shù)據(jù)流接收器在發(fā)送非零quanta的暫停幀后,可通過兩種方式請求數(shù)據(jù)流發(fā)送器重新開始傳輸:

1. 等待最后發(fā)送的暫停幀所代表的持續(xù)時間。例如,10 GbE 端口只需等待3.355 毫秒。

2. 發(fā)送新的零quanta暫停幀,要求數(shù)據(jù)流發(fā)送方立即恢復(fù)傳輸。因此,零quanta的暫停幀也被稱為恢復(fù)幀或解除暫停幀。

在以下兩個條件下,因收到quanta為非零的暫停幀而處于"暫停"狀態(tài)的數(shù)據(jù)流發(fā)送方將立即恢復(fù)傳輸:

1. 暫停幀中指定的持續(xù)時間結(jié)束。例如,10 GbE 端口在接收到quanta為65535 的暫停幀3.355 毫秒后。

2.它接收到quanta設(shè)為零的暫停幀。同樣,這也可以稱為"恢復(fù)"或"取消暫停"幀。

這意味著暫停幀具有雙重用途。非零quanta的暫停幀會停止或暫停流量,而零quanta的暫停幀則會啟動或恢復(fù)流量。

接下來,讓我們了解一下這些暫停幀是何時發(fā)送的。

何時發(fā)送暫停幀?

圖7-1 顯示了交換機(jī)-1 的兩個端口之間的速度不匹配情況,這兩個端口以10 GbE 連接目標(biāo)-1,以1 GbE 連接主機(jī)-1。交換機(jī)-1 為無損流量分配緩沖區(qū),并將這些緩沖區(qū)組織到入口無丟棄隊列中。為簡單起見,假設(shè)只有一種流量類別需要無損行為,則只顯示一個無丟棄隊列。

73125d4a-d44f-11ee-a297-92fbcf53809c.png

Figure 7-1Ethernet flow control with Pause Threshold and Resume Threshold

當(dāng)Target-1 開始以10 Gbps 的速度傳輸無損流量時,Switch-1 只能以1 Gbps 的速度向Host-1 傳輸。流量速率的差異會導(dǎo)致幀過多,從而開始消耗交換機(jī)-1 上不丟幀隊列的緩沖區(qū)。當(dāng)交換機(jī)-1 的緩沖區(qū)填滿超過閾值(稱為暫停閾值)時,它會向目標(biāo)-1 發(fā)送一個非零quanta的暫停幀。目標(biāo)-1 收到該暫停幀后,會在一個特定的時間間隔內(nèi)停止傳輸流量,該時間間隔稱為暫停時間(如上一節(jié)所述)。因此,Switch-1 的緩沖區(qū)利用率不會進(jìn)一步增加,而是隨著向Host-1 的傳輸繼續(xù)進(jìn)行而開始下降。

最終,當(dāng)Switch-1 的緩沖區(qū)利用率低于恢復(fù)閾值時,Switch-1 會發(fā)送一個零quanta的暫停幀,這是目標(biāo)-1 恢復(fù)流量傳輸?shù)?a target="_blank">信號。如果在發(fā)送第一個非零quanta的暫停幀后的暫停時間內(nèi),Switch-1 的緩沖區(qū)利用率沒有降至恢復(fù)閾值以下,它將繼續(xù)發(fā)送更多非零quanta的暫停幀,以停止或暫停來自目標(biāo)-1 的傳輸,直到Switch-1 的緩沖區(qū)利用率降至恢復(fù)閾值以下。

目標(biāo)-1 最終會恢復(fù)傳輸,要么是因為最后一個非零quanta的暫停幀中指定的持續(xù)時間已過,要么是因為它收到了一個零quanta的暫停幀。但目標(biāo)-1 較快的傳輸速率再次導(dǎo)致交換機(jī)-1 上的不丟棄隊列被填滿,并很快超過了暫停閾值。這時,交換機(jī)-1 再次向目標(biāo)-1 發(fā)送非零quanta的暫停幀,同樣的事件重復(fù)發(fā)生。

最后,交換機(jī)-1 的"暫停閾值"和"恢復(fù)閾值"之間的緊密配合以及"暫停幀"(非零quanta)和"未暫停幀"(零quanta)的發(fā)送實(shí)現(xiàn)了以太網(wǎng)流量控制。

請注意以下幾點(diǎn):

1. 圖7-1 中的以太網(wǎng)流量控制會導(dǎo)致入口端口(連接到Target-1)和出口端口(連接到Host-1)之間的速率均衡。如果在此狀態(tài)下對鏈路進(jìn)行監(jiān)控,Host-1 鏈路上就不會有暫停幀流過,而許多暫停幀會從Switch-1 流向Target-1。

2. 如果不啟用圖7-1 中的流量控制,交換機(jī)-1 將丟棄目標(biāo)-1 的任何多余幀。這將使其成為一個有損網(wǎng)絡(luò)。

3. 雖然quanta值的范圍在0 到65535 之間,但大多數(shù)產(chǎn)品(包括Cisco MDS 交換機(jī)、Nexus 交換機(jī)和UCS)都將其設(shè)置為最大可能值65535。將時間quanta設(shè)置為較小值將要求接收器預(yù)測準(zhǔn)備接收更多幀的持續(xù)時間。這種預(yù)測的實(shí)現(xiàn)比較復(fù)雜。大多數(shù)產(chǎn)品將暫停時間量值設(shè)置為最大值65535,然后在準(zhǔn)備好接收流量時發(fā)送取消暫停幀(時間量值為0),從而使實(shí)現(xiàn)簡單易行。由于這些原因,Cisco MDS 交換機(jī)、Nexus 交換機(jī)和UCS 不允許配置暫停quanta值。

4. 如果認(rèn)為在發(fā)送非零quanta的暫停幀時,流量會在quanta所代表的時間內(nèi)停止,那是不正確的。通常情況下,非零quanta的暫停幀之后很快就會出現(xiàn)取消暫?;蚧謴?fù)幀。流量暫停的最長時間實(shí)際上就是暫停和取消暫停幀之間的時間。在10 GbE 鏈路上,這可能是0.05 微秒(接收64 字節(jié)暫停幀的時間),也可能是3.355 毫秒或介于兩者之間的任何時間。如果緩沖區(qū)利用率仍高于暫停閾值,則可在根據(jù)實(shí)施情況確定的時間(小于量子所代表的時間)后發(fā)送另一個非零quanta的暫停幀。這個暫停幀會"延長"流量暫停的時間。

5.暫停幀不會搶先傳輸已經(jīng)開始的幀。

6. 暫停閾值也稱為XOFF 閾值,恢復(fù)閾值也稱為XON 閾值。XOFF 和XON 中的X 是傳輸?shù)氖鬃帜缚s寫。由于暫停幀的流動方向與流量相反,因此XOFF 閾值與停止流量有關(guān),而XON 閾值與重啟/恢復(fù)流量有關(guān)。一般來說,XOFF 表示"暫停流量",XON 表示"取消暫停流量"。在排除擁塞問題時,請記住這一細(xì)節(jié),因為XOFF 和XON 術(shù)語也可能被使用。

入口和出口隊列

Cisco Nexus 9000 交換機(jī)采用出口緩沖架構(gòu)。這意味著出口端口上會保留隊列。

只有對于不丟棄類,才會為所有可以接收不丟棄類流量的入口端口預(yù)留額外的緩沖區(qū)。如圖7-1 所示,除了出口隊列外,不丟棄流量還被排入入口隊列(具有暫停閾值和恢復(fù)閾值)。

在擁塞期間,首先出口隊列會開始填滿。對于有損流量,如果這些出口隊列已滿,任何新傳入的幀都會被丟棄。

但是,對于無損流量,在不丟棄出口隊列滿之前,會對入口隊列施加內(nèi)部反向壓力(具有暫停閾值和恢復(fù)閾值)。這樣,任何新進(jìn)入的流量都會占用入口隊列,而不會被丟棄。如前所述,通過發(fā)送暫停幀來控制入口隊列的利用率。

這些入口隊列有暫停閾值和恢復(fù)閾值,與出口隊列的主動隊列管理(AQM)機(jī)制(如加權(quán)隨機(jī)早期檢測(WRED))不同??梢允褂肗X-OS 命令show queuing interface 顯示Cisco Nexus 9000 交換機(jī)端口上的入口和出口隊列。

在Cisco Nexus 交換機(jī)上,所有流量都要經(jīng)過出口隊列處理,因此,AQM 與有損和無損流量相關(guān)。第8 章"交換機(jī)緩沖區(qū)管理"一節(jié)介紹了出口隊列的處理和AQM 機(jī)制。本章主要關(guān)注入口隊列(具有暫停閾值和恢復(fù)閾值)的處理。了解兩個隊列(出口隊列和入口隊列)的處理至關(guān)重要,因為如前所述,只有在出口隊列填滿后才會使用入口隊列。因此,監(jiān)控出口隊列的使用情況也是顯示擁塞的一個關(guān)鍵指標(biāo)。有關(guān)詳細(xì)信息,請參閱第8 章隊列深度監(jiān)控和微爆發(fā)檢測一節(jié)。

入口無損隊列的位置

無損以太網(wǎng)網(wǎng)絡(luò)中的所有端口都有入口無損隊列。為簡單起見,圖7-1 僅顯示了一個位置的入口無損隊列,但實(shí)際上所有端口都有入口無損隊列。

1.圖7-1 顯示了交換機(jī)-1 上用于接收目標(biāo)-1 流量的入口無損隊列。利用該無損隊列可控制向目標(biāo)-1 發(fā)送暫停幀。

2. 交換機(jī)-1 上也有類似的入口無損隊列,用于接收來自主機(jī)-1 的流量。利用該無損隊列可控制向Host-1 發(fā)送暫停幀。

3. 目標(biāo)-1 創(chuàng)建一個或多個入口無損隊列,用于接收來自交換機(jī)-1 的流量。利用該無損隊列可控制向Switch-1 發(fā)送暫停幀。

4. 主機(jī)-1 創(chuàng)建一個或多個入口無損隊列,用于接收來自交換機(jī)-1 的流量。利用該無損隊列可控制向Switch-1 發(fā)送暫停幀。

每個端口的輸入無損隊列數(shù)

通常情況下,一個無損流量類的每個端口需要一個無損隊列。也可根據(jù)使用情況創(chuàng)建多個無損隊列,如通過同一鏈路傳輸FCoE 和RoCE 流量。多個無損隊列有各自的"暫停閾值"和"恢復(fù)閾值"。設(shè)備上無損隊列的最大數(shù)量取決于其功能。例如,Cisco Nexus 9000 交換機(jī)最多支持三個無損隊列。但根據(jù)鏈路的最大幀大小和長度,還需要考慮更多因素。這些限制之所以適用,是因為無損隊列需要預(yù)留緩沖區(qū),而每個設(shè)備的緩沖區(qū)空間都是有限的。請參考您環(huán)境中設(shè)備的文檔,但總的來說,要了解這些限制并制定相應(yīng)的計劃。

實(shí)施差異和本書的范圍

有些實(shí)現(xiàn)(盡管不太常見)會在沒有擁塞的情況下持續(xù)發(fā)送quanta為零的暫停幀。換句話說,即使緩沖區(qū)利用率低于恢復(fù)閾值,它們也會發(fā)送取消暫停幀。這樣做是不必要的,因為只需一個"取消暫停"幀就足以恢復(fù)流量,除非中間發(fā)送一個非零quanta的"暫停"幀,否則沒有必要連續(xù)發(fā)送。雖然這種實(shí)現(xiàn)方式并不違反標(biāo)準(zhǔn),但由于無法分別報告暫停和解除暫停幀,也無法報告流量暫停的持續(xù)時間(TxWait/RxWait),因此這種不必要的操作幾乎無法進(jìn)行擁塞檢測。有關(guān)這些指標(biāo)的更多詳情,請參閱后面的"擁塞檢測指標(biāo)"部分。此外,大量連續(xù)發(fā)送的"取消暫停"幀可能會導(dǎo)致明顯的鏈路利用率,因為這些幀實(shí)際占用了帶寬。這種類型的實(shí)施超出了本書的范圍。本書中講解的大多數(shù)擁塞檢測和故障排除技術(shù)都不適用于此類實(shí)施。

本書主要介紹只發(fā)送一個(或幾個)取消暫停幀(零quanta)來恢復(fù)流量,并且在緩沖區(qū)利用率低于恢復(fù)閾值時不連續(xù)發(fā)送取消暫停幀的實(shí)現(xiàn)。這是最常見的實(shí)施類型,包括Cisco MDS 交換機(jī)、Nexus 交換機(jī)和UCS。本書僅介紹這種實(shí)施方式。

以下是Cisco MDS、Nexus 和UCS 的實(shí)現(xiàn)詳情:

1. 當(dāng)超過暫停閾值時,發(fā)送一個具有最大暫停quanta的暫停幀。

2. 如果緩沖區(qū)利用率高于"恢復(fù)閾值",則在50%的最大暫停時長到期后,發(fā)送下一個具有最大暫停時長的暫停幀。

3. 如果緩沖區(qū)利用率低于恢復(fù)閾值,則發(fā)送一個零quanta的暫停幀(取消暫停)。隨后不再發(fā)送零quanta的暫停幀。如果該暫停幀損壞或丟失,流量將在前一個暫停幀所傳達(dá)的暫停時間結(jié)束后恢復(fù)。

很明顯,思科的實(shí)現(xiàn)是僅在必要時發(fā)送暫停幀。這種發(fā)送"暫停幀"的保守方法為通過計算"暫停幀"的數(shù)量來檢測擁塞奠定了基礎(chǔ),如第9 章中詳細(xì)介紹的UCS 流量監(jiān)控(UTM) 應(yīng)用程序所使用的方法。

暫停閾值和恢復(fù)閾值

本節(jié)將解釋暫停閾值和恢復(fù)閾值對正確的headroom和footroom緩沖區(qū)大小的重要意義。如圖7-1 所示。

緩沖區(qū)(隊列)大小取決于設(shè)備的能力。每個啟用PFC 的端口都必須預(yù)留緩沖區(qū)。因此,隊列大小是設(shè)備總緩沖空間和啟用PFC 端口數(shù)量的函數(shù)。

暫停閾值

如前所述,當(dāng)流量接收器的緩沖區(qū)(隊列)利用率超過暫停閾值時,它就會發(fā)送一個非零quanta的暫停幀。

恢復(fù)閾值

如前所述,當(dāng)流量接收器的緩沖區(qū)(隊列)利用率低于恢復(fù)閾值時,它就會發(fā)送一個零quanta的暫停幀(取消暫停)。

暫停閾值必須大于恢復(fù)閾值。整個緩沖區(qū)(隊列)的大小必須足夠大,以滿足暫停閾值和恢復(fù)閾值之間的足夠差值。

Headroom

緩沖區(qū)(隊列)大小與暫停閾值之間的空間稱為headroom。

暫停閾值應(yīng)足夠小于最大緩沖區(qū)大?。ɑ蜿犃写笮。?,以保持足夠的headroom。headroom不足可能導(dǎo)致數(shù)據(jù)包丟失。暫停閾值也不能太低。如果出現(xiàn)這種情況,發(fā)送方會過早暫停,而headroom仍未使用,這可能會導(dǎo)致鏈路利用率低于預(yù)期。

由于流量接收器必須保持足夠的"headroom"來容納,因此它必須在暫停閾值處而不是在其緩沖區(qū)完全耗盡時(圖7-1)發(fā)送具有非零quanta的暫停幀:

發(fā)出的數(shù)據(jù)幀已經(jīng)在物理線路上

發(fā)送方已計劃發(fā)送且不能中斷的數(shù)據(jù)幀。

暫停幀從流量接收方到流量發(fā)送方的序列化和傳播所造成的延遲。

隨著距離的增加,流量接收器必須增加其headroom,因為可能會有更多的幀在傳送中,而且暫停幀到達(dá)流量發(fā)送器所需的時間也會更長。但緩沖區(qū)是有限的資源,因此無損以太網(wǎng)鏈路的最大支持距離取決于其端點(diǎn)的能力。當(dāng)時可用空間無法容納的輸入數(shù)據(jù)包會被丟棄。這偏離了無損網(wǎng)絡(luò)的行為。充足的headroom應(yīng)避免出現(xiàn)這種情況。

Footroom

低于恢復(fù)閾值的緩沖空間稱為footroom。

恢復(fù)閾值應(yīng)大于零,以保持足夠的空間,從而在"解除暫停"幀到達(dá)流量發(fā)送方、設(shè)備恢復(fù)傳輸以及這些幀到達(dá)時,無損隊列中有足夠的幀。如果恢復(fù)閾值過低,在發(fā)送"解除暫停"幀和接收流量之間的一段時間內(nèi),無損隊列將是空的。這可能會導(dǎo)致鏈路利用率低于預(yù)期。

配置緩沖區(qū)大小、暫停閾值和恢復(fù)閾值

在大多數(shù)實(shí)際應(yīng)用中,數(shù)據(jù)中心內(nèi)短距離鏈路不需要更改緩沖區(qū)(隊列)大小、暫停閾值和恢復(fù)閾值。大多數(shù)產(chǎn)品(包括Cisco MDS 交換機(jī)、Nexus 交換機(jī)和UCS)都會根據(jù)鏈路的支持長度(如100 米)默認(rèn)配置測試值。有關(guān)詳細(xì)信息,請參閱產(chǎn)品文檔。

Cisco Nexus 9000 交換機(jī)的默認(rèn)緩沖區(qū)大小和閾值足以滿足100 米長電纜的需要。如果需要更改這些值,例如用于長度超過100 米的電纜,如例7-1 所示,可使用Cisco Nexus 交換機(jī)上的pause buffer-size 命令更改閾值。不同類型的設(shè)備可能會根據(jù)其緩沖區(qū)可用性和架構(gòu)使用不同的值。因此,例7-1 僅用于一般理解,在未查閱產(chǎn)品文檔的情況下,請勿直接使用這些值。

Example 7-1在Cisco Nexus 9000 交換機(jī)上配置緩沖區(qū)大小、暫停閾值和恢復(fù)閾值。

policy-map type queuing INPUT_Q

class type queuing RDMA

pause buffer-size 120000 pause-threshold 46000 resume-threshold 32000

InExample 7-1:

1. 命令pause buffer-size 中的值以字節(jié)為單位。

2. 緩沖區(qū)大?。?20,000 字節(jié))是隊列大小。暫停閾值為46,000 字節(jié),恢復(fù)閾值為32,000 字節(jié)。

3. 緩沖區(qū)大小和暫停閾值之間的差值就是headroom(120,000 - 46,000 = 74,000 字節(jié))。如前所述,如果headroom不足,當(dāng)時無法容納的入口數(shù)據(jù)包就會被丟棄。

4. 恢復(fù)閾值是footroom(32,000 字節(jié))。如前文所述,headroom不足可能導(dǎo)致鏈路利用率低于應(yīng)有水平。

5. 根據(jù)最大幀大小,這些閾值的配置應(yīng)至少容納最低數(shù)量的幀。默認(rèn)的以太網(wǎng)有效載荷為1500 字節(jié),因此在計算報頭后,幀大小為1522 字節(jié)。但存儲流量通常需要更大的幀大小。例如,F(xiàn)CoE 幀最多可達(dá)約2300 字節(jié)。RoCE 幀最大可達(dá)約2 KB 或4 KB。以太網(wǎng)巨型幀最大可達(dá)9216 字節(jié)。在例7-1 中,74,000 字節(jié)的凈空可容納約8 個9216 字節(jié)的全尺寸巨型幀,盡管并非所有幀的大小都相同。

如例7-2 所示,使用命令show queuing interface 驗證Cisco Nexus 9000 交換機(jī)上無損隊列的"暫停閾值"、"恢復(fù)閾值"和headroom。

Example 7-2驗證Cisco Nexus 9000 交換機(jī)上的緩沖區(qū)大小、暫停閾值和恢復(fù)閾值。

switch# show queuing interface ethernet 1/1

Ingress Queuing for Ethernet1/1

-----------------------------------------------------

QoS-Group# Pause

Buff Size Pause Th Resume Th

-----------------------------------------------------

7 - - -

6 - - -

5 - - -

4 - - -

3 120000 46000 32000

2 - - -

1 - - -

0 - - -

PFC 的長途鏈路

長距離無損以太網(wǎng)鏈路的使用不如短距離鏈路普遍。大多數(shù)使用短距離SFP 的數(shù)據(jù)中心內(nèi)鏈路都在幾百米以內(nèi)。支持無損以太網(wǎng)的設(shè)備應(yīng)該有足夠的緩沖區(qū)來處理這些數(shù)據(jù)中心內(nèi)鏈路。但是,如果遇到啟用了PFC 的長距離以太網(wǎng)鏈路,請驗證端點(diǎn)的支持情況,并按照供應(yīng)商的指導(dǎo)增加緩沖區(qū)大小、暫停閾值和恢復(fù)閾值。

如前所述,Cisco Nexus 9000 交換機(jī)的默認(rèn)緩沖區(qū)大小、暫停閾值和恢復(fù)閾值足以滿足100 米電纜長度的要求。更改配置后,Cisco Nexus 93180YC-FX 通過10 千米鏈路支持FCoE。對于任何其他使用情況和更長的距離,請遵循官方文檔。

一般概念是,所有無損網(wǎng)絡(luò)都有距離限制,因為隨著距離的增加,它們需要額外的緩沖區(qū)。光纖通道和無損以太網(wǎng)都是如此。對于光纖通道,需要增加B2B 信用點(diǎn)的數(shù)量,這與物理緩沖區(qū)直接相關(guān)。對于以太網(wǎng)上的PFC/LLFC,在暫停閾值(headroom)以上和恢復(fù)閾值(footroom)以下必須有足夠的緩沖空間。

緩沖區(qū)不足對光纖通道和無損以太網(wǎng)的影響是不同的。在光纖通道中,B2B 緩沖區(qū)不足會導(dǎo)致鏈路利用率低于預(yù)期,因為流量發(fā)送方大部分時間都在等待緩沖區(qū)。在使用PFC 的無損以太網(wǎng)中,會產(chǎn)生兩種影響。首先,如果headroom不足,那么數(shù)據(jù)包可能會在無損流量類中丟棄。其次,如果footroom不足,其結(jié)果類似于光纖通道中缺乏B2B 信用額度,從而導(dǎo)致性能不佳,因為在有少量停頓的情況下,鏈路永遠(yuǎn)達(dá)不到預(yù)期的流量速率。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5450

    瀏覽量

    172177
  • 接收器
    +關(guān)注

    關(guān)注

    14

    文章

    2475

    瀏覽量

    72043
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    21

    文章

    2647

    瀏覽量

    99870
  • TCP
    TCP
    +關(guān)注

    關(guān)注

    8

    文章

    1374

    瀏覽量

    79159
  • 存儲網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    8128

原文標(biāo)題:以太網(wǎng)存儲網(wǎng)絡(luò)的擁塞管理連載(一)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    以太網(wǎng)存儲網(wǎng)絡(luò)擁塞管理連載方案(二)

    本節(jié)將從學(xué)術(shù)角度解釋如何計算無損以太網(wǎng)鏈路的headroom大小。該解釋基于 IEEE 802.1Qbb 優(yōu)先級流量控制標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 02-27 09:12 ?1251次閱讀
    <b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>存儲</b><b class='flag-5'>網(wǎng)絡(luò)</b>的<b class='flag-5'>擁塞</b><b class='flag-5'>管理</b><b class='flag-5'>連載</b><b class='flag-5'>方案</b>(二)

    以太網(wǎng)存儲網(wǎng)絡(luò)擁塞管理連載方案(三)

    在 OSI 模型的第 3 層,流量由 IPv4 或 IPv6 源地址和目標(biāo)地址標(biāo)識。如圖 7-5 所示,IP 標(biāo)頭(v4 和 v6)包含個 6 位 DSCP 字段,允許多達(dá) 64 種分類,但并非所有分類都被使用。
    的頭像 發(fā)表于 02-28 09:16 ?1298次閱讀
    <b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>存儲</b><b class='flag-5'>網(wǎng)絡(luò)</b>的<b class='flag-5'>擁塞</b><b class='flag-5'>管理</b><b class='flag-5'>連載</b><b class='flag-5'>方案</b>(三)

    以太網(wǎng)存儲網(wǎng)絡(luò)擁塞管理連載案例(五)

    解決無損以太網(wǎng)網(wǎng)絡(luò)擁塞問題的方法與光纖通道結(jié)構(gòu)相同。兩者都使用逐跳流量控制機(jī)制,只是實(shí)現(xiàn)方式不同而已。
    的頭像 發(fā)表于 03-04 11:17 ?898次閱讀
    <b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>存儲</b><b class='flag-5'>網(wǎng)絡(luò)</b>的<b class='flag-5'>擁塞</b><b class='flag-5'>管理</b><b class='flag-5'>連載</b>案例(五)

    以太網(wǎng)存儲網(wǎng)絡(luò)擁塞管理連載案例(六)

    消除或減少無損以太網(wǎng)網(wǎng)絡(luò)擁塞的高級方法與光纖通道結(jié)構(gòu)相同。幾十年來,不同的傳輸類型都采用了類似的方法,只是略有不同。
    的頭像 發(fā)表于 03-06 16:35 ?1011次閱讀
    <b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>存儲</b><b class='flag-5'>網(wǎng)絡(luò)</b>的<b class='flag-5'>擁塞</b><b class='flag-5'>管理</b><b class='flag-5'>連載</b>案例(六)

    以太網(wǎng)存儲網(wǎng)絡(luò)擁塞管理連載案例(七)

    學(xué)習(xí)連接到遠(yuǎn)程 VTEP 的設(shè)備的 MAC 地址有兩種常見方法。第種方法使用基于組播的泛洪學(xué)習(xí)機(jī)制。
    的頭像 發(fā)表于 03-08 09:29 ?890次閱讀
    <b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>存儲</b><b class='flag-5'>網(wǎng)絡(luò)</b>的<b class='flag-5'>擁塞</b><b class='flag-5'>管理</b><b class='flag-5'>連載</b>案例(七)

    以太網(wǎng)和工業(yè)以太網(wǎng)的不同

    以太網(wǎng)媒體訪問控制的物理層和數(shù)據(jù)鏈路層。這些標(biāo)準(zhǔn)也說明子配置以太網(wǎng)網(wǎng)絡(luò)的規(guī)則,以及各種網(wǎng)絡(luò)元件如何彼此協(xié)作。以太網(wǎng)支持多臺計算機(jī)通過
    發(fā)表于 10-23 14:20

    工業(yè)以太網(wǎng)的實(shí)現(xiàn)方案和現(xiàn)場實(shí)際應(yīng)用情況

    廉,可選擇范圍十分廣闊。因此,人們期望以太網(wǎng)也能應(yīng)用到工控領(lǐng)域中,憑著它的低成本、極高的通信速率、全球普及的標(biāo)準(zhǔn),逐漸取代現(xiàn)有工控行業(yè)中繁多的總線系統(tǒng),用以太網(wǎng)來實(shí)現(xiàn)從管理層到工業(yè)現(xiàn)場層的貫穿
    發(fā)表于 01-13 07:07

    基于BOOTP的工業(yè)以太網(wǎng)IP儀表的智能化管理策略

    摘要:提出種基于BOOTP 的工業(yè)以太網(wǎng)終端IP 儀表的網(wǎng)絡(luò)管理方案。該方案不僅可完成對終端
    發(fā)表于 02-26 09:58 ?21次下載
    基于BOOTP的工業(yè)<b class='flag-5'>以太網(wǎng)</b>IP儀表的智能化<b class='flag-5'>管理</b>策略

    以太網(wǎng)光纖通道(FCoE)技術(shù)問答

    以太網(wǎng)光纖通道技術(shù)(FCoE),能壓縮光纖通道存儲數(shù)據(jù),使之通向以太網(wǎng)的LAN(局域網(wǎng)),消除了數(shù)據(jù)中心分離存儲
    發(fā)表于 12-01 15:51 ?1097次閱讀

    以太網(wǎng)協(xié)議及應(yīng)用方案

    以太網(wǎng)協(xié)議及應(yīng)用方案
    發(fā)表于 01-21 12:07 ?9次下載

    低成本CAN與以太網(wǎng)互連的方案

    介紹了種廉價的CAN與以太網(wǎng)互連的方案。該方案實(shí)現(xiàn)了以太網(wǎng)與現(xiàn)有CAM總線的直接連接,方便了管理
    發(fā)表于 09-07 20:20 ?12次下載
    低成本CAN與<b class='flag-5'>以太網(wǎng)</b>互連的<b class='flag-5'>方案</b>

    以太網(wǎng)的分類及靜態(tài)以太網(wǎng)交換和動態(tài)以太網(wǎng)交換、介紹

    以太網(wǎng)交換技術(shù)具有許多類型,各自宣傳其具有不同的優(yōu)點(diǎn);通過簡單的鼠標(biāo)即可增加、移動和改變往來落的結(jié)構(gòu);比網(wǎng)橋和路由器更為有效地進(jìn)行網(wǎng)絡(luò)分段;為高性能工作站或服務(wù)器提供高寬帶。網(wǎng)絡(luò)管理
    的頭像 發(fā)表于 10-07 10:06 ?6515次閱讀

    萬兆以太網(wǎng)和IP SAN的融合

    IP SAN存儲網(wǎng)融合到萬兆以太網(wǎng)絡(luò)中,將大大增加了IP SAN網(wǎng)絡(luò)的通信帶寬,提高主機(jī)訪問存儲的速度,同時由于
    的頭像 發(fā)表于 01-24 15:16 ?3239次閱讀

    光纖通道到以太網(wǎng)存儲結(jié)構(gòu)解析

    行業(yè)專家認(rèn)為,以太網(wǎng)存儲結(jié)構(gòu)(ESF)是下存儲網(wǎng)絡(luò)的理想選擇,因為其具有卓越的性能、智能和效率。
    發(fā)表于 07-21 15:59 ?1214次閱讀

    TOSUN 車載以太網(wǎng)仿真測試解決方案

    TOSUN車載以太網(wǎng)仿真測試解決方案隨著自動駕駛、車聯(lián)網(wǎng)和智能化系統(tǒng)的廣泛應(yīng)用,車載電子組件和傳感器的數(shù)量與復(fù)雜性都在持續(xù)增加,為了滿足這些更為復(fù)雜性的需求,車載以太網(wǎng)作為種新型車載
    的頭像 發(fā)表于 12-07 01:07 ?483次閱讀
    TOSUN 車載<b class='flag-5'>以太網(wǎng)</b>仿真測試解決<b class='flag-5'>方案</b>