摘要:服務質量(QoS)技術是IP網絡技術能否成為未來統一承載網絡技術的關鍵。根據擁塞持續時間,網絡QoS風險可以分為微秒級、毫秒級、秒級、分鐘級,和更長時間級別等5個等級。調度機制、緩存和隊列、呼叫接納控制、流量工程等技術均是解決一類QoS風險的有效手段。IP網絡運營商需要在分析網絡中主要風險的基礎上制定整體QoS解決方案,在呼損、時延、抖動、丟包4項指標中取得均衡。
關鍵詞:IP網絡;QoS;調度機制;隊列技術;呼叫接納控制;流量工程
服務質量(QoS)技術是IP網絡技術能否成為未來統一承載網絡技術的關鍵。從業務的角度看,網絡的服務質量包括業務質量和接通率兩部分指標。業務質量指已經接通業務的服務質量,可以客觀或主觀地評價,如IP語音(VoIP)業務的知覺通話質量測量(PSQM)值和平均主觀值(MOS),并映射到傳統的丟包、時延、抖動等IP網絡QoS參數。接通率則是衡量系統工作情況的綜合指標,反映業務接續的實現和丟失情況,其對應的指標是呼損。目前IP網絡技術在QoS上有了很大進步,衍生出了多種QoS技術[1-2],但是對網絡QoS解決方案還有相當大的爭議。
每一種QoS技術都有其合理的應用場景,能且只能最佳解決一類特定的QoS問題,研討QoS整體解決方案必須首先對IP網絡中的QoS風險進行分類,進而確定每一類QoS問題各自的對策。
1 QoS風險分類
IP網絡是基于分組的統計復用網絡,因此高帶寬、輕載的網絡中也有突發擁塞的可能,進而引起IP網絡QoS問題。正因為QoS問題是由擁塞引起的,所以網絡QoS風險可以按照網絡中擁塞的時間長度分類進行定量分析。如果網絡中絕大多數對業務產生關鍵影響的QoS問題是持續時間在微秒級別的擁塞,則將這類網絡問題稱為微秒級QoS風險。因此,根據擁塞時間長度對業務的影響程度,以及解決擁塞問題所需要的技術措施不同,網絡QoS風險可以分為微秒級、毫秒級、秒級、分鐘級,和更長時間級別5個等級。
微秒級的QoS風險可以采用簡單的調度機制避免丟包,例如從兩個接口上同時到達的分組從同一個端口上輸出造成的擁塞,由路由器/交換機的網絡接口卡(NIC)成幀緩存,再由轉發進程調度,就可以解決這兩個包的順序輸出的問題。
毫秒級的QoS風險則需要更多的分組緩存和較復雜的隊列機制來應對,包括流分類、擁塞避免和隊列調度技術,如加權隨機早期檢測(WRED)、嚴格優先隊列(PQ)、低延遲隊列(LLQ)、基于類的加權公平隊列(CBWFQ)等。
秒級的QoS風險靠緩存和隊列技術難以解決。設備的緩存有限,很難緩存數以秒計的分組,尤其是大容量的高速路由器和交換機應用。秒級的QoS風險需要網絡級的接納控制來解決,即在秒級時間長度的業務擁塞出現或預判即將出現時,在業務接入點上通過策略定制拒絕接入部分業務,避免高速路由/交換設備上出現超出處理能力的擁塞流量從而導致大量丟包。
分鐘級的QoS風險往往由突發的業務量增加引起。采用接納控制技術丟棄業務降低了業務接通率,增加了呼損,并且電信網絡不允許這種狀態持續數分鐘以上,因此分鐘級的QoS風險需要有其他的解決措施。目前已有的解決方案技術是流量工程和資源預留,即在分鐘級時間長度的擁塞出現或預判即將出現時,通過人工或者策略服務器自動方式,采用流量工程技術將部分業務疏導到空閑的鏈路上,繞開擁塞點。由于流量工程隧道的部署決策需要時間,部署也需要時間,所以不能取代接納控制技術,作為短時間擁塞控制技術的替代,以避免頻繁的網絡動蕩。

更長時間的QoS風險就說明網絡規劃流量和網絡流量不匹配,不再是哪一種QoS技術手段能解決。針對這樣的QoS風險,需要運營商通過網絡性能測量,采取明確針對性的網絡擴容手段來解決。
5類QoS風險與QoS技術的對應關系如圖1所示。
需要注意的是,微秒級、毫秒級、秒級、分鐘級等均是寬泛的時間范圍,是相對概念,如毫秒級QoS風險,其擁塞時間長度上限是由設備能夠處理的時間長度和業務可以允許的QoS容限決定的,而分鐘級所指的時間長度下限與實際網絡流量工程決策時間、業務呼損容限有關。
2 調度和隊列技術
調度和隊列技術在流量突發時緩存分組以避免分組丟失,當突發流量時間長度超過緩存指標而溢出時,策略地丟棄超出緩存處理能力的分組,以降低優先級業務的損失,或者以接續中的業務允許范圍內的損傷為代價,處理微秒級和毫秒級的QoS風險。如圖2所示。
部署調度和隊列技術增加了分組的時延和抖動,減輕了因為擁塞而可能引起的丟包的影響,即在丟包、時延、抖動3項指標之間折中,使得網絡的QoS指標控制在業務需求的范圍之內。
典型路由/交換設備的隊列調度和管理流程包括流分類、丟棄算法和出入隊列調度算法3個環節[3]。當前有多種流分類機制,簡單的有基于以太幀優先級(802.1p)、IP服務類別(ToS)、區分服務碼點(DSCP)等優先級分類的,復雜的有基于五元組,甚至深度報文檢測(DPI)的流分類;入隊列調度大致有隨機早期檢測(RED)、WRED算法兩種;出隊列調度算法較多,基本的有PQ、效率較高的有加權公平隊列(WFQ)、對某種業務重點保障的LLQ等等,每年還有各種形形色色的新研究成果出現。從宏觀上看,這些隊列技術的性能差距并不是很大,它們都是解決毫秒級以下QoS風險的技術機制[4]。

即使當前設備制造技術可以支持很大的包緩存隊列,但是,調度和主動隊列管理技術仍不能用于解決更大的QoS風險,因為緩存實際上是以降低時延和抖動指標來換取丟包率指標,而業務對QoS的三大指標要求是均衡的,過分的傾斜對于單個指標并不能得到理想的結果。建議數據業務隊列使用5 ms~6 ms緩沖長度,語音和視頻業務隊列使用2 ms以下的緩沖長度[5]。
3 接納控制技術
業務(如IPTV、VoIP)可以允許瞬間較大的丟包率,以及持續較長時間非常小的丟包率,如果長時間持續擁塞,則業務的體驗,如VoIP業務的MOS值,會下降直至不可接受,所以秒級以上的QoS風險需要接納控制技術[6]來應對,如圖3所示。
接納控制有基于業務設備的接納控制和基于IP網絡設備的接納控制兩種。業務層設備的接納控制方案中,IP網絡根據規劃的業務量為業務網絡準備了相應的資源,業務設備則對接續中的業務量作計數,并對超限的業務拒絕接納。而IP網絡設備的接納控制,則是在IP網絡資源控制服務器的參與下,由IP網絡設備拒絕接納超限業務。如圖4示意。

無論是基于業務設備的接納控制還是基于IP網絡設備的接納控制,客觀上都拒絕了業務的接入,增加了“呼損”,即接納控制技術本質是以“呼損”指標損失換取MOS值等業務體驗指標穩定。
4 流量工程和資源預留技術
絕大多數分鐘級的QoS風險是由業務突發流量引起的,如大型慶典、會議、活動等,這些突發業務具有局部性和暫時性的特點,帶寬擴容投入產出比不佳,且建設周期上不能滿足要求。但是長時間的業務被拒絕接納,也是用戶難以接受的。
為了解決這些分鐘級的QoS風險,完成這些大型會議、活動的保障任務,流量工程和資源預留技術是最佳選擇。
流量工程技術是在正常的IP路由之外的另外的包投遞機制,原則上區別于正常的IP路由的技術都可以稱之為流量工程,如IP顯式路由選項技術和通用路由封裝協議(GRE)顯式路由技術,只是這兩種技術顯著影響IP包的轉發效率而被廢棄了。策略路由也可以認為是一種流量工程技術,其優點是可以部署在關鍵節點上,而不必全路由路徑部署。MPLS流量工程(MPLS-TE)是目前最高效的流量工程技術[7],可以顯式路由而不損失轉發效率。MPLS-TE技術還可以和資源預留技術結合使用,進一步改善分鐘級的QoS風險的解決效果。
5 網絡級QoS解決措施
毫秒級及以下QoS風險可以稱之為低階QoS風險,秒級及以上QoS風險可以稱之為高階QoS風險。低階QoS風險可以用設備級的調度和主動隊列管理技術解決,高階QoS風險則需要網絡級的解決方案,網絡級的解決方案有3種:
風險降階;
忽略背景業務的質量;
采用接納控制等技術。
所謂輕載的網絡QoS解決方案實際上就是風險降階的方案,將網絡的QoS風險降低到毫秒級以下,以便用基本設備級QoS技術來解決。中國電信CN2、中國移動、網通、聯通的IP專用承載骨干網都是采用這個思路來建設的[8]。
而在城域網等多業務IP網絡中,往往采用忽略背景業務流量的方案。如圖5所示,在這些網絡中業務可以分為無QoS要求的盡力而為業務、有一定QoS要求的差異化服務業務,以及需要嚴格QoS保證的要求確保的業務,無QoS要求的盡力而為業務就是背景業務,一般占總業務量的大部分,引入進來是為了分擔網絡建設和運營成本。在網絡上部署區分服務結構模型(Diff-Serv)技術之后,差異化服務業務加上要求保證的業務之和,一般情況下其QoS風險總是在毫秒級以下。雖然總體上網絡的QoS風險是高階的,但由于背景業務沒有QoS要求,所以其丟包并不需要做特殊處理。而如果差異化服務業務加上要求保證的業務之和的QoS風險升級到高階風險之后,接納控制等技術也不滿足運營商的運營要求,需要在新的業務量約束下,組織網絡擴容。


因此網絡輕載+Diff-Serv[9]技術仍然是目前運營商網絡建設的優先選擇。近年來下一代網絡(NGN)承載網的研究和實踐表明,在多業務IP骨干網絡中,由于資源相對充足,而且VoIP業務的帶寬比例較小,在采用區分服務并對話音業務進行最高優先級轉發的前提下,可以不施接納控制機制[10]。
輕載程度的選擇與網絡業務的突發性質有關。以城域網為例,平均負荷率40%的業務路由器(SR)上行鏈路,其在5分鐘平均負荷率分時圖上的峰值約為65%,秒平均負荷率分時圖上的峰值約為85%,毫秒負荷率分時圖上的峰值約為110%。控制鏈路平均負荷率40%,其QoS風險主要是低階的,可以用調度和主動隊列管理技術有效化解。部署網絡級QoS技術可以提高帶寬利用率,同樣的業務量下,鏈路帶寬降低20%左右,則網絡中的QoS風險將上升為秒級的QoS風險,這時就需要部署接納控制技術來應對。
采用高階QoS風險應對技術可以節省的帶寬及提高的鏈路負荷率與不同時間顆粒度的負荷率分時圖上的峰值之比有關,電信行業傳統上用業務集中系數的概念來反映不同時間顆粒度的負荷率分時圖峰值之間的關系。如公共交換電話網(PSTN)網絡業務分析理論中,話務量最大的一小時稱為忙時,忙時集中系數的定義為忙時業務與全天業務量之比,則在一小時平均負荷率分時圖上的峰值與全天平均負荷率之比就是24×忙時集中系數。因為大多數數據網絡網管系統的流量采樣周期是5分鐘,所以網管系統上顆粒度最小的分時圖是5分鐘平均流量分時圖,同樣定義最忙5分鐘集中系數為忙時中業務量最大的5分鐘業務量與忙時業務量之比;定義最忙秒集中系數為最忙5分鐘中業務量最大的1秒業務量與該5分鐘業務量之比;定義最忙毫秒集中系數為最忙秒中1毫秒業務量與該秒業務量之比,則:
(1) 5分鐘平均負荷率分時圖上的峰值 = 平均業務量 ÷ 忙時集中系數 ÷ 最忙5分鐘集中系數;
(2)秒平均負荷率分時圖上的峰值 = 5分鐘平均負荷率分時圖上的峰值 ÷ 最忙秒集中系數;
(3)毫秒平均負荷率分時圖上的峰值 = 秒平均負荷率分時圖上的峰值 ÷ 最忙毫秒集中系數;
未部署QoS技術的網絡,其帶寬要求應等于或超過毫秒平均負荷率分時圖上的峰值,部署調度和主動隊列管理技術,網絡帶寬要求大于秒平均負荷率分時圖上的峰值即可,相對于未部署QoS技術的網絡,節省“1/最忙毫秒集中系數”的帶寬;在此基礎上部署接納控制技術,網絡帶寬要求大于5分鐘平均負荷率分時圖上的峰值即可,相當于再節省“1/最忙秒集中系數”的帶寬。
6 結束語
網絡QoS風險可以分為微秒級、毫秒級、秒級、分鐘級,和更長時間級別等5個等級,網絡服務質量包括接通率和業務質量兩部分。IP網絡QoS整體解決方案制定策略是針對IP網絡中至關重要的QoS風險,在呼損、時延、抖動、丟包4項指標中取得均衡。
7 參考文獻
[1] 糜正琨, 徐名海. IP網絡QoS模型及實現技術[J]. 中興通訊技術, 2003, 9(增刊1): 40-43.
[2] 馬秀芳, 時和平.IP網絡中的QoS研究[J]. 現代有線傳輸, 2003 (03): 48-54.
[3] 張立崗, 吳晨. ZXR10系列路由設備的IP QoS特性及相關技術[J]. 中興通訊技術(簡訊), 2003(12).
[4] 姜國臣, 譚賢四, 范照勇. 排隊規則對FTP, Video, VoIP應用的性能影響[J]. 現代電子技術, 2006, 29(5): 50-51, 56.
[5] 李彤. IP網絡實施QoS的策略分析[J]. 郵電設計技術, 2006(6): 43-46.
[6] ITU-T Draft Recommendation Y. RACF Version 9.2 Functional architecture and requirements for resource and admission control functions in next generation networks[S].
[7] Alwayn V. 高級MPLS設計與實施[M]. 劉興初, 等譯. 北京: 人民郵電出版社, 2003.
[8] 韋樂平, 徐建鋒. 下一代互聯網發展趨勢與CN2的設計思路[J]. 中興通訊技術, 2005,11(3): 1-5.
[9] An Architecture for Differentiated Services[R]. IETF RFC2475, 1998.
[10] 紀其進. VoIP網絡接納控制機制必要性探討[J]. 電信網技術. 2007 (2).
收稿日期:2007-11-23
都珂,中興通訊股份有限公司承載網絡產品線主任工程師。碩士畢業于中南大學。研究方向為IP網絡技術應用及網絡規劃。
劉慶良,中興通訊股份有限公司IP網絡產品副總經理兼總工程師。碩士畢業于浙江大學,主要研究方向為數據通信。
李斌,中興通訊股份有限公司數據研發中心主任工程師。碩士畢業于南京郵電學院。從事數據產品的研發,主要研究方向為數據通信。