SDN概念的誕生已經(jīng)有十多個年頭,從近年來SDN技術(shù)發(fā)展與應(yīng)用部署情況來看,數(shù)據(jù)中心領(lǐng)域技術(shù)發(fā)展成熟較早并迅速得到廣泛應(yīng)用,而國內(nèi)大型互聯(lián)網(wǎng)公司和運(yùn)營商廣域網(wǎng)領(lǐng)域相對發(fā)展要慢一些,究其原因還是由廣域網(wǎng)的網(wǎng)絡(luò)實(shí)際情況決定的。
數(shù)據(jù)中心場景業(yè)務(wù)流量相對簡單,主要是東西向流量的和南北向流量,相關(guān)數(shù)據(jù)中心SDN架構(gòu)解決方案主要面向解決和處理好Overlay隧道層面流量的打通和調(diào)度。而廣域網(wǎng)場景業(yè)務(wù)流量相對復(fù)雜,裸IP流量、MPLS-VPN業(yè)務(wù)流量、EVPN流量,往往疊加到一起,同時還要考慮到廣域網(wǎng)的互聯(lián)互通情況中多互聯(lián)互通出口流量的優(yōu)化和調(diào)度。
從網(wǎng)絡(luò)規(guī)模和網(wǎng)絡(luò)設(shè)備層面考慮,數(shù)據(jù)中心相對廣域網(wǎng)是個小范圍區(qū)域網(wǎng)絡(luò),在單個數(shù)據(jù)中心資源池新建時,完全可以直接采用較為成熟的SDN架構(gòu),單一資源池或者一個資源的一個POD內(nèi)直接采用單廠家方案,不同的資源池之間或者同一個資源池的不同POD間通過標(biāo)準(zhǔn)的SDN北向接口實(shí)現(xiàn)異常家解耦。而廣域網(wǎng)是個覆蓋范圍廣大的網(wǎng)絡(luò),運(yùn)營商級廣域網(wǎng)單個AS域就可以有上千臺路由器的規(guī)模,網(wǎng)絡(luò)架構(gòu)雖然一直向扁平化方向發(fā)展,但是遠(yuǎn)沒有數(shù)據(jù)中心Spine-Leaf架構(gòu)那么規(guī)整。廣域網(wǎng)建設(shè)時為避免單廠家綁定,往往是異廠家設(shè)備混合組網(wǎng),因此廣域網(wǎng)SDN架構(gòu)需要控制器直接去控制不同廠家的設(shè)備,無法簡單的應(yīng)用單廠家的SDN解決方案。
基于以上原因,廣域網(wǎng)SDN應(yīng)用和部署相對滯后。廣域網(wǎng)的SDN架構(gòu)升級和部署,要考慮業(yè)務(wù)流量的平滑過渡,不能推倒重建,所以廣域網(wǎng)SDN架構(gòu)設(shè)計(jì)和部署往往是要分階段地去實(shí)現(xiàn),從最迫切的需求入手,合理安排設(shè)備的升級節(jié)奏,逐步地引入和完善相關(guān)SDN功能。
2.廣域網(wǎng)SDN應(yīng)用部署與演進(jìn)的三個階段
第一階段,先從提升業(yè)務(wù)開通效率入手,解決最迫切的客戶業(yè)務(wù)自動開通需求,實(shí)現(xiàn)網(wǎng)絡(luò)的自動化配置能力。通過部署SDN控制器,實(shí)現(xiàn)配置命令通過Netconf接口或其他方式自動下發(fā)。對于有業(yè)務(wù)需求的節(jié)點(diǎn),可以先更換或者升級這些節(jié)點(diǎn)的PE設(shè)備,實(shí)現(xiàn)SR-BE功能,使業(yè)務(wù)流量基于SR-BE去承載,有條件的可以兼顧實(shí)現(xiàn)基于松散路徑模式的SR-TE功能,這一階段也可以同時實(shí)現(xiàn)基于BGP-LS或其他協(xié)議的拓?fù)渖膳c呈現(xiàn)。
第二階段,隨著設(shè)備的逐步升級,SR功能的全網(wǎng)具備,以及SDN南向接口協(xié)議標(biāo)準(zhǔn)化演進(jìn)和更廣泛的廠家設(shè)備支持,逐步實(shí)現(xiàn)基于SR-TE的差異化服務(wù)和業(yè)務(wù)流量路徑調(diào)優(yōu)功能,實(shí)現(xiàn)基于Telemetry的秒級信息采集,實(shí)現(xiàn)SDN控制器對網(wǎng)絡(luò)狀態(tài)和網(wǎng)絡(luò)資源全面的管理掌控。同時可以同步探索和實(shí)現(xiàn)部份網(wǎng)絡(luò)智能化功能,比如網(wǎng)絡(luò)流量模擬和網(wǎng)絡(luò)故障模擬,從而對網(wǎng)絡(luò)規(guī)劃、網(wǎng)絡(luò)優(yōu)化升級、網(wǎng)絡(luò)設(shè)備和架構(gòu)調(diào)整提供更好的模擬分析和決策參考。
第三階段,基于SDN能力實(shí)現(xiàn)更高層次的網(wǎng)絡(luò)智能化。未來的IBN(Intent-based Network)或IDN (Intent-Driven Network),都要以SDN能力為基礎(chǔ)去演進(jìn)和實(shí)現(xiàn)。
目前運(yùn)營商的廣域網(wǎng)SDN部署基本都在第一階段已經(jīng)部份實(shí)現(xiàn),正在向第二階段演進(jìn)的過程中。大型互聯(lián)網(wǎng)公司因?yàn)闃I(yè)務(wù)的需求更強(qiáng)烈,整體研發(fā)能力強(qiáng),同時網(wǎng)絡(luò)規(guī)模又比運(yùn)營商相對較小,因此廣域網(wǎng)SDN部署和應(yīng)用相比運(yùn)營商要更完善和超前。
3.廣域網(wǎng)SDN功能
如果只介紹廣域網(wǎng)SDN架構(gòu),會比較公式化。為了使大家更好的理解廣域網(wǎng)SDN,先談一談廣域網(wǎng)SDN的功能,理解了部署廣域網(wǎng)SDN是為了要實(shí)現(xiàn)那些功能,回過頭來再去看廣域網(wǎng)SDN架構(gòu)以及廣域網(wǎng)SDN所涉及的接口協(xié)議,可能會理解的更加深入一些。
談到SDN控制器的功能,就不得不先分析下SDN控制器和傳統(tǒng)網(wǎng)管的關(guān)系。普遍的認(rèn)為傳統(tǒng)的網(wǎng)管側(cè)重于設(shè)備和網(wǎng)絡(luò)狀態(tài)監(jiān)控管理,而SDN控制器側(cè)重于網(wǎng)絡(luò)資源管理和網(wǎng)絡(luò)轉(zhuǎn)發(fā)控制。資源管理和網(wǎng)絡(luò)設(shè)備硬件狀態(tài)的管理、網(wǎng)絡(luò)拓?fù)涞墓芾?,是分不開的,資源管理以設(shè)備狀態(tài)和網(wǎng)絡(luò)拓?fù)涔芾頌榛A(chǔ),而SDN控制器的控制功能是以全面掌握網(wǎng)絡(luò)資源和信息為基礎(chǔ)的,可以這么說SDN控制器需要繼承一部分傳統(tǒng)網(wǎng)管的能力或者要以傳統(tǒng)網(wǎng)管的能力為基礎(chǔ)來實(shí)現(xiàn)上層的功能,因此我覺得未來控制器和網(wǎng)管會走向合并和統(tǒng)一。
在傳統(tǒng)網(wǎng)管的監(jiān)控和管理能力之外,SDN控制器要實(shí)現(xiàn)資源的實(shí)時管控、業(yè)務(wù)的自動下發(fā)、路由分析、網(wǎng)絡(luò)仿真、差異化服務(wù)、流量調(diào)度等功能。下面對個人理解的廣域網(wǎng)SDN應(yīng)該具備的功能進(jìn)行梳理與介紹。
3.1.網(wǎng)絡(luò)監(jiān)測和數(shù)據(jù)呈現(xiàn)
能通過BGP-LS或其他協(xié)議獲取網(wǎng)絡(luò)拓?fù)?,支持以BGP-LS收集SR-MPLS、SRv6等信息,能通過Telemetry實(shí)現(xiàn)秒級的網(wǎng)絡(luò)數(shù)據(jù)監(jiān)測上報(bào),或者至少能通過SNMP實(shí)現(xiàn)全網(wǎng)監(jiān)測數(shù)據(jù)的周期采集。可以通過TWAMP或其他協(xié)議實(shí)現(xiàn)網(wǎng)絡(luò)質(zhì)量監(jiān)控。
基于數(shù)據(jù)的采集和分析,可以呈現(xiàn)網(wǎng)絡(luò)的物理拓?fù)浜瓦壿嬐負(fù)?,可以呈現(xiàn)相關(guān)數(shù)據(jù)信息和狀態(tài)信息,比如可以呈現(xiàn)各鏈路網(wǎng)絡(luò)流量情況及變化趨勢曲線圖,并根據(jù)一定的閾值設(shè)定對端口流量利用率進(jìn)行監(jiān)控和告警。
3.2.業(yè)務(wù)配置自動下發(fā)與管理
SDN控制器能通過Netconf接口或其他方式實(shí)現(xiàn)下發(fā)MPLS-VPN、EVPN等業(yè)務(wù)配置,能夠監(jiān)測網(wǎng)絡(luò)內(nèi)已有配置并同步到控制器,具備資源和配置參數(shù)沖突監(jiān)測功能,能對網(wǎng)絡(luò)配置參數(shù)和網(wǎng)絡(luò)資源全局統(tǒng)一分配管理。
3.3.SR隧道下發(fā)與管理
能夠創(chuàng)建、修改或者刪除SR-TE Tunnel。能夠通過PCEP或其他協(xié)議實(shí)現(xiàn)SR-TE Tunnel的托管和下發(fā)??梢栽O(shè)置隧道的Hot-Standby路徑或者Ti-LFA保護(hù)。
能夠創(chuàng)建、修改或刪除SR Policy和SRv6 Policy隧道,支持SR Policy和SRv6 Policy隧道Color、Candidate Path等參數(shù)的設(shè)置。
SDN控制器能夠支持以圖形化的方式呈現(xiàn)SR隧道路徑、流量、告警等信息,便于網(wǎng)絡(luò)管理員對隧道狀態(tài)和隧道所承載業(yè)務(wù)流量進(jìn)行觀測與管理。
3.4.SR隧道路徑計(jì)算功能
一般提到通過SDN實(shí)現(xiàn)差異化服務(wù)和業(yè)務(wù)流量路徑靈活調(diào)優(yōu)等能力,都是以隧道路徑的計(jì)算、控制和下發(fā)能力為基礎(chǔ)的。隧道路徑計(jì)算功能主要包含以下幾個方面。
多重約束條件計(jì)算路徑
路徑計(jì)算時可以基于多重約束條件計(jì)算路徑,可以支持帶寬、時延、跳數(shù)限制、顯示路徑等約束條件。其中顯示路徑約束條件又分為顯示路徑包含(隧道必須嚴(yán)格或松散地經(jīng)過有序指定的鏈路或節(jié)點(diǎn))和顯示路徑排除(隧道必須不能經(jīng)過指定的鏈路或節(jié)點(diǎn))。
基于特定選路策略進(jìn)行選路
根據(jù)約束條件計(jì)算路徑后可能有多條備選路徑,支持基于鏈路可用度最優(yōu)、鏈路剩余帶寬最大、Cost最小、時延最小等選路策略進(jìn)行選路。
主備路徑分離
支持隧道主備路徑分離(SR-TE Tunnel或SR Policy),主備路徑盡量完全不共路或者少共路。也可以通過TI-LFA的方式實(shí)現(xiàn)隧道路徑的保護(hù)。
跨AS域隧道路徑計(jì)算(有多個AS域的超大網(wǎng)絡(luò)場景)
能實(shí)現(xiàn)跨AS域E2E路徑計(jì)算。支持基于收集的跨域拓?fù)?,根?jù)隧道約束條件進(jìn)行E2E路徑計(jì)算,并將計(jì)算的路徑下發(fā)到轉(zhuǎn)發(fā)器。AS域內(nèi)隧道和跨AS域隧道可以共存。
目前跨AS域場景的隧道計(jì)算和管理依然是廣域網(wǎng)SDN的一個難題,在進(jìn)行域內(nèi)路徑和域間路徑的拼接時,域內(nèi)路徑最優(yōu)和域間路徑最優(yōu)要綜合考慮和衡量,整體比較復(fù)雜。
3.5.裸IP流量調(diào)度
在MPLS-VPN的業(yè)務(wù)場景,MPLS-VPN業(yè)務(wù)流量直接Over在SR 隧道上,通過更改或者優(yōu)化隧道路徑,就可以實(shí)現(xiàn)業(yè)務(wù)流量的差異化服務(wù)和路徑調(diào)優(yōu)。
在裸IP流量場景,要能實(shí)現(xiàn)將裸IP業(yè)務(wù)流量導(dǎo)入到隧道當(dāng)中,從而實(shí)現(xiàn)裸IP流量的調(diào)優(yōu)??梢曰谠碔P、目的IP、源AS、目的AS、BGP路由Community等參數(shù)來抓取裸IP流量,并通過PBR方式導(dǎo)入到隧道當(dāng)中。當(dāng)然SR Policy場景下流量的導(dǎo)入會方便很多。
3.6.路由分析功能
能在網(wǎng)絡(luò)拓?fù)渲锌梢暬尸F(xiàn)IGP路由狀態(tài)信息,可以獲取并呈現(xiàn)IGP路由告警,包括IGP Peer Up、Down告警、IGP前綴路由撤銷和IGP路由Flapping等告警。
能通過BMP實(shí)現(xiàn)BGP路由信息采集,能在拓?fù)渲锌梢暬尸F(xiàn)BGP路由協(xié)議狀態(tài),包括Peer信息、AS發(fā)布路由等信息;對網(wǎng)絡(luò)中設(shè)備BGP運(yùn)行狀態(tài)進(jìn)行實(shí)時監(jiān)控,包括Peer的狀態(tài),路由新增、撤銷、更新事件。能提供BGP路由的分析與預(yù)警,包括公網(wǎng)BGP路由及BGP VPN路由。
3.7.網(wǎng)絡(luò)仿真
網(wǎng)絡(luò)故障仿真
能實(shí)現(xiàn)基于鏈路或者設(shè)備故障的網(wǎng)絡(luò)流量預(yù)測,并支持基于預(yù)測結(jié)果的網(wǎng)絡(luò)流量仿真。在網(wǎng)絡(luò)正常狀態(tài)下,能對特定設(shè)備或者鏈路故障時的網(wǎng)絡(luò)狀態(tài)進(jìn)行模擬,輸出模擬仿真后的網(wǎng)絡(luò)狀態(tài)結(jié)果,包括模擬后的網(wǎng)絡(luò)資源和鏈路利用率,各鏈路承載的業(yè)務(wù)信息,以及重要業(yè)務(wù)流量的承載劣化情況等。便于網(wǎng)絡(luò)管理員對可能出現(xiàn)的網(wǎng)絡(luò)故障進(jìn)行影響分析,并更有針對性地準(zhǔn)備網(wǎng)絡(luò)故障預(yù)案。
網(wǎng)絡(luò)流量仿真
能實(shí)現(xiàn)流量突發(fā)場景的仿真,比如對重大熱點(diǎn)事件、電商促銷等流量突發(fā)場景進(jìn)行仿真,根據(jù)導(dǎo)入的流量突發(fā)模型模擬流量突發(fā)后網(wǎng)絡(luò)承載情況,包括鏈路的擁塞情況,網(wǎng)絡(luò)資源和設(shè)備的負(fù)載情況。為網(wǎng)絡(luò)管理員制定疏導(dǎo)方案提供更有借鑒意義和直觀的參考。
4.廣域網(wǎng)SDN架構(gòu)設(shè)計(jì)
4.1.單一管理域或AS域SDN架構(gòu)設(shè)計(jì)
對于多廠家設(shè)備混合組網(wǎng)的廣域網(wǎng)SDN架構(gòu),理想的方案當(dāng)然是單一控制器通過標(biāo)準(zhǔn)的南向接口去控制不同廠家的設(shè)備,但是現(xiàn)實(shí)情況是目前不同廠家的南向接口沒有實(shí)現(xiàn)全部的標(biāo)準(zhǔn)化,尤其設(shè)備配置Netconf的Yang模型,不同廠家還主要是以私有實(shí)現(xiàn)為主,所以SDN控制器在某些南向接口協(xié)議上就不得不去適配不同廠家私有接口。整體的廣域網(wǎng)SDN架構(gòu)如下圖。
圖1.廣域網(wǎng)SDN架構(gòu)
接口1、接口2、接口3為廠家的私有Netconf接口,SDN控制器通過適配廠家的私有Netconf接口去下發(fā)業(yè)務(wù)和設(shè)備配置。未來隨著技術(shù)的發(fā)展,如果能實(shí)現(xiàn)SDN南向Netconf接口的全面標(biāo)準(zhǔn)化和解耦,這三個接口可以統(tǒng)一為一個標(biāo)準(zhǔn)接口。此外需要說明的是,某些標(biāo)準(zhǔn)化程度不高,需要控制器去適配廠家私有實(shí)現(xiàn)的協(xié)議,也可以放入到接口1、接口2和接口3中,比如Telemetry。
接口4是一組協(xié)議,目前主要應(yīng)用的有如下SDN南向接協(xié)議。
- PCEP,用于實(shí)現(xiàn)SR-TE Tunnel的托管、路徑下發(fā)和狀態(tài)上報(bào);
- SNMP,讀取設(shè)備信息,如接口流量、隧道流量,通過SNMP Trap接收設(shè)備的告警信息;
- Telemetry,信息采集,如接口和隧道流量采集,性能數(shù)據(jù)采集,Telemetry比SNMP效率更高,可以實(shí)現(xiàn)秒級的信息采集,可以更好的實(shí)時監(jiān)控網(wǎng)絡(luò)設(shè)備和資源狀態(tài);
- BMP,BGP運(yùn)行狀態(tài)采集,包括對等體關(guān)系的建立與解除、路由信息刷新等;
- BGP-LS,控制器通過BGP-LS收集拓?fù)湫畔ⅰR-MPLS信息,SRv6信息、鏈路時延等信息;
- BGP Flowspec,控制器通過下發(fā)攜帶流量匹配條件和流量匹配后執(zhí)行動作的BGP Flowspec路由,實(shí)現(xiàn)流量調(diào)優(yōu);
- BGP SR Policy/BGP SRv6 Policy,控制器通過BGP下發(fā)SR Policy信息,其中包含endpoint、color、candidate path信息,實(shí)現(xiàn)對隧道路徑、隧道負(fù)載等情況的控制;
- Netstream/Netflow/IPFIX:流量采樣,用于流量分析。在流量調(diào)優(yōu)和其他網(wǎng)絡(luò)調(diào)整前,都需要以流量分析結(jié)果作為參考;
- TWAMP,雙向主動測量協(xié)議,可以探測鏈路的時延、抖動、丟包率。
4.2.跨域SDN架構(gòu)
某些大型網(wǎng)絡(luò)經(jīng)營者擁有多個獨(dú)立AS域的網(wǎng)絡(luò),大部分網(wǎng)絡(luò)業(yè)務(wù)域內(nèi)配置開通,但是也有部份業(yè)務(wù)需要跨域開通,例如運(yùn)營商跨省網(wǎng)和骨干網(wǎng)的業(yè)務(wù)開通與流量調(diào)度。在跨域的場景下,可以通過業(yè)務(wù)編排層實(shí)現(xiàn)跨域的業(yè)務(wù)開通。但編排層是和業(yè)務(wù)和應(yīng)用強(qiáng)關(guān)聯(lián)的,不具備直接的網(wǎng)絡(luò)管理能力,如果要實(shí)現(xiàn)承載業(yè)務(wù)流量的隧道路徑跨域計(jì)算和跨域端到端流量調(diào)度,就需要具備強(qiáng)大的網(wǎng)絡(luò)管理能力。我個人還是傾向于認(rèn)為這個協(xié)同跨域業(yè)務(wù)開通的編排層如果被開發(fā)具備強(qiáng)大的網(wǎng)絡(luò)管理能力(跨域隧道路徑計(jì)算和跨域流量調(diào)度),應(yīng)該叫超級控制器會更貼切些。
圖2.跨域廣域網(wǎng)SDN架構(gòu)
當(dāng)然網(wǎng)絡(luò)架構(gòu)是為網(wǎng)絡(luò)需求服務(wù)的,以力求完備的架構(gòu)和功能實(shí)現(xiàn)為出發(fā)點(diǎn)而不是以迫切的網(wǎng)絡(luò)需求為出發(fā)點(diǎn)去規(guī)劃和建設(shè)網(wǎng)絡(luò),背離了網(wǎng)絡(luò)發(fā)展和演進(jìn)的原則。廣域網(wǎng)SDN架構(gòu)演進(jìn)也是如此,以需求為導(dǎo)向,盡量在滿足需求的情況下去輕量化部署網(wǎng)絡(luò)SDN架構(gòu)。比如經(jīng)常討論到的在廣域網(wǎng)SDN架構(gòu)中,普遍認(rèn)為差異化服務(wù)和流量調(diào)優(yōu)要以隧道路徑計(jì)算、隧道路徑優(yōu)化為基礎(chǔ)去實(shí)現(xiàn)。我覺得基于隧道路徑計(jì)算、優(yōu)化的功能實(shí)現(xiàn)差異化服務(wù)和流量調(diào)優(yōu)肯定是需要支持的,對于重點(diǎn)客戶的精確化服務(wù)能力的實(shí)現(xiàn)也是有意義的。但是面對大量客戶成千上萬的業(yè)務(wù)流量和承載隧道,調(diào)整起來會非常復(fù)雜,對控制器的要求會非常高,部署起來的困難可想而知。所以我覺得不管域內(nèi)還是域間的差異化服務(wù)還是要以QOS能力為基礎(chǔ)去實(shí)現(xiàn),端到端給重要客戶的業(yè)務(wù)流量配置高優(yōu)先級,確保高優(yōu)先級業(yè)務(wù)流量在網(wǎng)絡(luò)承載能力不足、網(wǎng)絡(luò)擁塞時被優(yōu)先轉(zhuǎn)發(fā)。所以,在沒有明確的跨域隧道路徑調(diào)優(yōu)需求的場景下,完全不用開發(fā)超級控制器層,而只開發(fā)面向業(yè)務(wù)開通的編排層就可以,當(dāng)然涉及到跨域業(yè)務(wù)開通時邊界設(shè)備的配置對接,當(dāng)然也要編排層協(xié)調(diào)分配一定的網(wǎng)絡(luò)配置參數(shù)給到兩個域的不同控制器。
4.3.SDN控制器高可靠部署架構(gòu)
SDN控制器作為整個網(wǎng)絡(luò)的大腦,高可靠部署非常重要。在單一的控制器內(nèi)部,要通過集群或主備方式實(shí)現(xiàn)服務(wù)級高可靠保護(hù),服務(wù)模塊單節(jié)點(diǎn)故障時,SDN控制器功能不受影響。
同時要實(shí)現(xiàn)SDN控制器的異地災(zāi)備部署,在兩個不同的物理位置分別部署主、備控制器,主備控制器間數(shù)據(jù)進(jìn)行實(shí)時同步。主備控制器可以快速切換,主備切換時,原有業(yè)務(wù)不中斷。
圖3.廣域網(wǎng)SDN控制器高可靠架構(gòu)
5.總結(jié)
升級SDN架構(gòu),是網(wǎng)絡(luò)智能化演進(jìn)的基礎(chǔ),是廣域網(wǎng)網(wǎng)絡(luò)升級的必然途徑和必選項(xiàng)。但受限于廣域網(wǎng)多廠家混合組網(wǎng)的現(xiàn)狀,廣域網(wǎng)SDN架構(gòu)升級是一個逐步升級和功能完善的過程,網(wǎng)絡(luò)運(yùn)營者可以根據(jù)各自實(shí)際的網(wǎng)絡(luò)和業(yè)務(wù)情況去逐步推進(jìn)SDN架構(gòu)的部署與功能演進(jìn)。
審核編輯:郭婷
評論
查看更多