李季碧,趙 蕾,路振山
(重慶郵電大學通信與信息工程學院,重慶 400065)
目前提出的OBS網絡故障恢復機制主要關注于如何縮短故障的恢復時間,加快恢復速度。而對于恢復后的通信負載如何在網絡中進行均衡分配則少有研究。提高恢復速度一般采用預先計算路由的主動式故障恢復方案[1-3],并且為了便于分析通常假設鏈路的容量足夠大。但是,在網絡產生故障時,這些方案只是簡單地將故障路徑上的業務轉移到備份路徑上傳送,這種轉移容易造成備份路徑的擁塞,導致網絡吞吐能力下降。
為保證備用路徑的可用性,同時避免備份路徑擁塞,網絡不僅需要對故障后的負載進行均衡分配,而且要加強網絡對鏈路可用性的感知功能。為此,筆者改進了傳統的故障恢復機制,在支持區分業務恢復機制的基礎上,引入可用性自感知機制。網絡通過恢復路徑擁塞狀態的反饋結果,對受損業務進行均衡分配,從而提高網絡對高優先級業務的恢復能力。
如圖1所示,假設網絡使用JIT協議[2],每個核心節點含有一個通向目的節點的工作路徑及恢復路徑下一跳節點信息的轉發表。采用2-shortest-path的路由算法,一條作為工作路徑,另一條作為恢復路徑。網絡采取集中式管理,網絡中所有節點根據來自中心網管系統的鏈路狀態信息更新轉發表。

圖1 快速恢復策略示意圖
當節點X-D之間鏈路出現故障,節點X首先采取本地恢復,將業務轉發到備用路徑L0中,同時產生并廣播告警信息。當節點Y收到告警信息后,屏蔽故障鏈路,更新并廣播告警消息,在L1和L0中選擇最優路徑作為恢復路徑,轉發受影響的業務。當告警消息傳至源節點后,源節點屏蔽故障鏈路,啟動通道恢復,將受影響的業務通過恢復路徑L2轉發。
快速故障恢復機制充分利用兩種恢復策略的優點,在不同恢復階段采取不同的恢復策略。即為加快恢復速度,故障前端節點進行本地恢復,并廣播告警信息。隨著告警信息的廣播,各節點根據資源利用情況采取合適的恢復機制,從而提高資源利用率。
由于OBS網絡采用單向波長信道預約方式,所以很容易引起數據突發競爭,占用波長信道資源,從而導致數據丟失。尤其在網絡出現故障的情況下,簡單地將故障路徑上的業務轉移到備份路徑上傳送,更容易造成備份路徑的擁塞,造成大量數據突發丟失并引起核心節點業務吞吐量的迅速下降。如果擁塞狀況不能及時解決,則會進一步加重OBS網絡的擁塞,導致鏈路不可用,惡化網絡性能。
恢復節點簡單轉發受損業務,容易出現備份路徑擁塞現象[4-5],從而導致網絡的可用性降低。為解決上述問題,該方案在快速恢復策略中引入可用性感知機制。故障恢復節點通過恢復路徑的擁塞狀況反饋結果,對故障后的負載進行均衡分配,從而提高業務恢復率,改善網絡性能。
如圖2所示,當節點X-D間鏈路出現故障,節點X采取本地恢復,將產生的CMP(Control Management Packet)沿恢復路徑L0發送到目的節點D,同時產生并廣播告警信息。目的節點D收到CMP后,處理并產生確認分組CMP-ACK(Control Management Packet-Acknowledge),CMP-ACK周期性沿路L0返回節點X,沿途中各節點將本節點的擁塞狀況填入CMP-ACK,節點X根據L0中各節點的擁塞情況調整轉發的業務量,不能成功轉發的突發數據則丟棄。當節點Y收到告警信息后,屏蔽故障鏈路,更新并廣播告警消息。選擇最優的路徑L0作為默認恢復路徑,并在轉發受影響的業務前,分別通過恢復路徑L1和L0向目的節點D發送CMP1,CMP2。節點Y根據周期性收到的CMP-ACK1,CMP-ACK2調整轉發至兩條路徑的業務量。如果其中一條鏈路出現擁塞,則減小其對應的發送窗口,增大另外一條恢復路徑的發送窗口。如果兩條路徑都擁塞,則節點主動丟棄突發數據。當擁塞解除后,增加默認恢復路徑的業務發送量。同樣,當告警消息傳至源節點后,源節點屏蔽故障鏈路,啟動通道恢復。并根據來自L0,L1,L2的 CMP-ACK調整轉發至3條路徑的業務量。

圖2 基于可用性感知的恢復機制示意圖
該機制以鏈路中某個節點一個周期內通過該節點端口的各路徑上的BDP丟失率是否大于路徑可用門限作為判斷鏈路可用性的條件。在這里,僅考慮由業務擁塞導致鏈路的不可用,鏈路可用門限即為節點的擁塞門限。假設核心節點的擁塞門限為D,節點的總丟失率為Pnode;通過節點的路徑有N條;Di為節點第i條路徑單位時間內接收的突發總數量,其中丟失的突發數為DLi;擁塞解除門限為D-δ;δ為一個任意小數,則

當Pnode>D時,表明節點發生擁塞,路徑不可用,并將CMP-ACK中節點擁塞告警指示CF置1;當Pnode≤D-δ時,表明鏈路可用或擁塞解除,恢復鏈路可用,并將CMPACK中節點擁塞指示CF清0。
恢復鏈路覆蓋的各核心節點將本地節點的擁塞狀態通過分組CMP-ACK反饋給恢復操作節點,恢復操作節點根據鏈路的可用情況采取相應的措施調整發送流量的大小。如果可用性告警指示CF為0,則選用最優恢復路徑偏轉受影響的全部業務;如果可用性告警指示CF為1,則根據業務量調整策略減少流量。
目前,OBS網絡中沒有高速光隨機存儲器,對BDP沒有緩存過程,只有用光纖延遲線(FDL)作為光數據單元的緩存器。在核心節點中除了有限延時的FDL緩存器外,很難做到對大量業務的隨機存取[3]。當BDP到達核心節點時,如果沒有空閑的波長信道承載業務,則該BDP只能被丟棄。因此,傳統的調整節點業務發送速率的方式[4-5]不再適用于OBS網絡。
通過對業務劃分不同的優先級,以不同優先級的業務為調整對象,以相同優先級的所有受影響的BDP為調整粒度,來調整故障恢復節點轉發業務流量的大小。流量調整機制如下:
1)未收到擁塞告警,默認為恢復路徑沒有擁塞,將所有受影響業務通過最優恢復路徑轉發至目的節點。
2)收到擁塞告警,CF=0,恢復路徑沒有擁塞,將所有受影響業務通過最優恢復路徑轉發至目的節點。
3)收到擁塞告警,CF=1,恢復路徑發生擁塞,首先,查詢當前擁塞路徑中轉發業務的優先級別。其次,將當前擁塞路徑中轉發的低優先級業務通過其他恢復路徑轉發至目的節點。如果該節點沒有其他恢復路徑,或其他恢復路徑中無空閑資源,則丟棄低優先級業務。然后,將較高優先級業務通過最優恢復路徑轉發至目的節點,直至所有業務由最優恢復路徑轉發至目的節點。
4)收到擁塞告警,CF=0,恢復路徑擁塞擁塞解除,首先,較高優先級業務通過最優恢復路徑轉發至目的節點。其次,查詢其他恢復路徑中轉發業務的優先級別。最后,將由其他恢復路徑轉發業務中較高優先級業務通過最優恢復路徑轉發至目的節點,直至所有業務由最優恢復路徑轉發至目的節點。
根據恢復節點有無收到擁塞告警信息,可將恢復方案的實施過程分為2個階段:恢復啟動階段和自適應調整階段。假設業務分為3個優先級別:Class0,Class1,Class2。其中Class0優先級最高,Class1次之,Class2優先級最低。下面介紹各階段的恢復機制實施過程。
在恢復啟動階段,當鏈路發生故障時,節點首先產生并廣播告警信息,同時查詢恢復路徑。節點在轉發受影響業務之前,生成CMP,由恢復路徑中的控制信道傳送到目的節點,并接收來自目的節點的CMP_ACK。CMP_ACK攜帶恢復路徑的擁塞信息。如果節點未收到CMP_ACK,將受影響的全部業務轉發至恢復路徑;如果恢復信道沒有可用資源,則將丟棄業務。
在自適應調整階段,當節點收到來自目的節點的CMP_ACK后,節點根據CMP_ACK攜帶的擁塞信息對轉發的不同優先級別的業務量進行自適應調整。CF=0和CF=1時的調整過程如圖3~4所示。

圖3 CF=0時恢復節點處理流程圖
采用OPNET仿真軟件對改進機制進行仿真驗證。網絡仿真拓撲如圖5所示。業務源采用ON/OFF模型,且ON∶OFF=1∶1,ON期間IP包的產生間隔服從負指數分布,突發包分為3個優先等級,從高到低依次為BE,AF,EF,且3 種類型業務的強度之比為 BE∶AF∶EF=1∶2∶2。每條鏈路有8條數據信道和1條控制信道,信道傳輸速率為2.5 Gbit/s,假定鏈路的傳輸時延為0.2 ms。
不同恢復機制下恢復時間與負載的關系如圖6所示。



帶有可用性感知的恢復機制(Con_QoS)與基于鏈路的恢復機制(Link)具有較低的恢復時間,且兩者相差不大,平均為0.506 ms。這是因為兩種機制都由故障鏈路的前端節點采取恢復操作,節省了故障告警傳輸時延。而基于子路徑的恢復機制(Subpath)及基于通道的恢復機制(Path)由于要等到故障告警信息傳到恢復操作節點及源節點之后,才實施恢復動作,因此較之帶有可用性感知的恢復機制(Con_QoS)與基于鏈路的恢復機制(Link)具有較大的傳輸延時,從而導致恢復時間增大。
當節點2負載為0.5時兩種機制在不同門限下的丟包率隨仿真時間的變化關系如圖7所示。其中NON_QoS為沒有可用性感知的恢復機制,CON_QoS,CON_QoS_1,CON_QoS_2為基于可用性感知的恢復機制,不可用門限分別為0.012,0.0115 ,0.011。由圖7可知,基于可用性感知的恢復機制相比不帶有可用性感知的恢復機制具有較好的丟包性能。當備用鏈路發生擁塞時,即丟包率大于不可用門限時,基于可用性感知的恢復機制能夠及時調整轉發流量大小,通過主動丟棄較低優先級業務的方式解決備用鏈路的不可用問題,因此丟包率在不可用門限左右。

圖7 節點2不同門限時丟包率與仿真時間的變化關系(Load=0.5,截圖)
節點2采集到的基于可用性感知的恢復機制在不同告警周期下的丟包率隨仿真時間的變化關系如圖8所示。其中負載Load=0.5,可用門限D=0.011。由圖8可知,恢復操作節點周期越小,丟包率的擺動幅度越小,越接近門限值。這主要因為當備用鏈路發生擁塞時,告警周期越小,基于可用性感知的恢復機制越能夠及時調整轉發流量大小,通過主動丟棄較低優先級業務的方式解決備用鏈路的不可用問題,不僅在恢復操作節點較低優先級業務轉發包數的變化率越低,而且備用路徑中丟包率在不可用門限左右擺動的幅度也越小。

圖8 節點2丟包率與仿真時間的變化關系(Load=0.5,D=0.011,截圖)
節點2處不同恢復機制總丟包率與網絡負載的關系如圖9所示。其中NON_QoS表示傳統的不帶有可用性感知的恢復機制,CON_QoS表示基于可用性感知的恢復機制,可用門限D分別取值0.02,0.015,0.011。由圖9可知,在負載低于0.51時,兩種機制的丟包率都隨業務負載的增加而增大,且兩種機制具有相同的丟包率,因為此時沒有達到恢復機制的可用門限。但當丟包率高于可用門限時,基于可用性感知的恢復機制的丟包率保持在可用門限左右,而不帶有可用性感知的恢復機制則隨負載的增大而增大,表明當Load>0.51時,基于可用性感知的恢復機制在丟包率方面相比傳統沒有可用性感知的恢復機制具有較好的性能。這主要是因為帶有可用性感知的恢復機制能夠根據恢復路徑的鏈路可用指示信息周期性地調整轉發業務量,從而有效避免了因為鏈路擁塞而導致的鏈路不可用,提高了恢復成功率,并且可用性門限越低,丟包率越小。

圖9 節點2丟包率與網絡負載的關系
本文針對快速恢復機制所存在的問題,提出了一種基于可用性感知的故障恢復機制。通過對備用鏈路的可用性感知,使得故障恢復節點能夠根據鏈路的擁塞情況進行自適應的業務均衡分配。業務量的轉發以優先級為調整粒度,從而在恢復過程中很好地實現了業務區分,增強了網絡對高優先級業務的恢復能力。
仿真結果表明,基于可用性感知的恢復機制比傳統的恢復機制具有較好的丟包性能,并且能夠對業務進行區分。對高優先級業務丟包性能的改善更為明顯,提高了對受影響業務尤其是高優先級業務的恢復能力,從而改善網絡性能。
[1]XIONG Y,VANDERHOUTE M,CANKAYA H C.Control architecture in optical burst-switched WDM networks[J].IEEE Journal on Selected Areas in Communication,2000,18(10):1838-1851.
[2]XIN Yufeng,TENG Jing,KARMOUS E G,et al.Fault management with fast restoration for optical burst switched networks[C]//Proc.BroadNets 2004.[S.l.]:Broadband Networks,2004:34-42.
[3]HUANG Y,HERITAGE J P,MUKHERIEE B.Dynamic routing with preplanned congestion avoidance for survivable optical bust-switched(OBS)networks[C]//Proc.OFC/NFOEC 2005.[S.l.]:OFC,2005:3-7.
[4]CHEN Hehe,GAO Zehua,NING Fan,et al.A novel burst assembly algorithm based on control channel and traffic type for OBS[C]//Proc.APCC 2009.[S.l.]:APCC,2009:507-510.
[5]郭彥濤,文愛軍,劉增基,等.光突發交換網絡擁塞控制策略[J].西安電子科技大學學報:自然科學版,2009,36(1):5-10.