王意志,王呈炎
(廈門大學信息科學與技術學院,福建廈門 361005)
網絡測量方法及其應用
王意志,王呈炎
(廈門大學信息科學與技術學院,福建廈門 361005)
隨著網絡技術和通信業務的飛速發展,用戶對網絡帶寬等資源需求增加,網絡應用多樣化.網絡服務質量下降往往是由網絡負擔過重、路由交換設備超負荷引起的.因此,管理者需定期對各項運行參數指標進行測量評估.介紹網絡測量體系的功能模塊、常用網絡測量工具、主動測量和被動測量的方法及其應用,并分析了典型測量方法的優缺點.
網絡測量;參數指標;主動測量;被動測量
通常,為提供穩定和高效的網絡環境,管理者需要對網絡的帶寬、丟包率、延時等性能指標進行及時的測量評估并制定有效的管理策略.網絡測量是指遵照一定標準、方法和技術,利用軟硬件工具來測試或驗證表征網絡性能指標的一系列活動[1].性能參數是對網絡性能進行度量和描述的工具,網絡測量的目的在于從實際網絡環境中獲取數據流量有關的性能參數,分析網絡運行的狀態,并尋找故障原因并制定相應的解決辦法,具體包括:
1)性能評價.考察不同網絡協議(及其應用)影響下,網絡性能指標的變化,分析網絡協議及其應用的性能“瓶頸”,提高現有協議性能或設計新協議.通常,性能指標是性能評價的關鍵.
2)協議排錯.網絡測量可為新協議和應用程序提供有效的檢測手段并與現有標準保持一致或兼容.對網絡協議和應用的“最新”版本進行的測試主要通過對接收到的數據包進行協議分析,并從中發現問題,為開發人員提供修改意見.
3)故障診斷.某些網絡部件故障會干擾整個網絡的運行,例如廣播風暴、地址錯誤、安全性攻擊和非法分組長度等,因此有必要對這些故障進行分析和診斷,包括定位故障源,日志分析,監測IP、IPX數據報的流量,實現物理或邏輯鏈路端到端測試等.
4)網絡流量特征化.網絡測量利用統計技術來分析原始流量數據,從而有效地提取網絡應用或協議的具體特征.目前,主流網絡流量監控工具有MRTG[2]和PRTG[3],其使用SNMP協議對流量信息進行監視,并通過數據分析繪制圖表[4].

圖1 網絡測量體系的功能模塊示意圖
通常,網絡測量的體系結構如圖1所示,其主要有4個模塊:數據采集、數據顯示、數據分析和數據管理.其中,數據采集可在TCP/IP的任意層次中進行,采集到的數據提交給數據存儲管理;經過分析的數據在數據管理中重新調整數據結構,最后通過數據顯示模塊提交給用戶.
數據采集的方法分為主動測量和被動測量.主動測量易于控制,但需要合理有效地設計測量分組和測試流程,對被測網絡有一定影響.被動測量則需要適當選擇測量探針的位置,但不影響被測網絡系統.
網絡結構錯綜復雜,數據采集通常在多通道環境下運行,主要方式有:循環采樣、同步采樣和間隔采樣.循環采樣,是指采集設備使用多路開關以某一時鐘頻率將多個通道分別接入A/D循環進行采樣.當通道間的時間關系很重要時,就需要用到同步采樣方式.而間隔采樣通過控制掃描時間,設置2次采集的時間間隔(微秒或納秒級),效果接近同步采集.在實際應用中,通常采用性價比和靈活性較高的間隔采樣方式.目前,WINCAP和SNIFFER工具是常用數據采集工具[5].WINCAP通過網卡獲取用戶接收和發送的數據包,監聽NIC被動收集數據包(見圖2);SNIFFER通過將網卡設置為雜亂模式,從而能夠收集到網卡傳輸的每一個數據包.

圖2 WINCAP層級結構示意圖
數據分析,是對每個行為指標如何定義和計算進行研究,同時分析數據中包含的各種因素,例如算法、測量參數單位和測量誤差來源等.此外,還要考慮網絡測量的環境、方法、工具帶來的誤差和影響,測量后將這些因素進行一定的量化描述.目前,網絡測量的相關性能指標主要是以IETF網絡性能測量(IPPM)工作組制定的建議和草案為主,主要包括丟包率、流量、連通性、時延、鏈路帶寬和容量、連接平均持續時間、網絡拓撲結構等.
WIRESHARK/ETHEREAL和 TCPDUMP是目前較主流的網絡數據分析軟件[6].2者的主要區別是:WIRESHARK/ETHEREAL通過設置過濾規則對獲取的數據進行過濾,使用圖形界面顯示出數據包的協議分析結構;TCPDUMP是一種開源軟件,公開了所有接口,具備很強的擴展功能,主要應用于UNIX/LINUX系統中,它獲取網絡數據包,并對包的字段進行解析,以字符行的形式(Trace files)顯示給用戶,用戶可訂制和編程處理Trace文件,計算性能指標.
網絡測量的原始數據量極大,需要設計恰當的存儲、維護和檢索方法.數據存儲的格式化便于數據分析和檢索.為了解決數據共享問題,一般采用數據庫技術,同時為了靈活性更強,也可應用文件存儲的方式.為提高數據處理能力,通常在數據分析前進行數據預處理.文獻[7]中介紹了數據預處理中數據的清洗過程,通過確定核心數據的要求并對結果進行分類.
原始數據管理的過程中,最重要的一步是建立檢索策略.網絡測量過程中,對各項指標的需求把握明確后,可根據相應的參數指標構造檢索策略過程.關系型數據庫在測量過程中發揮著重大作用,它將網絡測量采集到的數據按照預先的要求存儲,提供給應用程序分析,又將分析結果重新存入數據庫中,然后提供給UI接口顯示給用戶.由于網絡數據流量較快,普通關系型數據無法滿足其性能及容量的要求,因此,可設計 RRDTOOL(Round Robin Database Tool)來解決該問題[4],通過開啟固定大小的空間來存放數據,使用指針指向最新數據的地址位,數據以類似環型結構基于時間存儲,若一輪數據存儲滿,重新開始寫入新數據,從而確保數據文件的大小不變,提高數據訪問效率.
數據顯示可以直觀、形象地顯示網絡測量的結果.目前,MRTG、CACTI及 PRTG 等[8]監測工具都是通過RRDTOOL繪圖引擎將數據繪制成流量圖展現給用戶的,通過處理RRD數據中的參數指標,創建用于在瀏覽器上顯示的PNG格式圖像.一般而言,PNG圖像所顯示的內容就是采集到的數據內容.
根據不同的數據采集方式,網絡測量分為主動測量和被動測量.
主動測量是向被測網絡注入一定量的測試流量數據,觀察其響應結果并分析數據流量的相關參數,進而觀察和測量網絡狀態及其變化[9].這種方法在測量過程中引入了一定的附加流量,會影響網絡的正常運行.因此,測量結果需要根據引入的附加流量進行修正才能夠真實反映網絡實際運行情況.被動測量是通過對網絡流量、數據參數的監視和收集,達到完成網絡測量任務的目的.被動測量機制可以在一定程度上避免對網絡正常運行的干擾和測量誤差的出現,使得網絡性能受影響的程度很小.同時,由于監測位置相對固定,其主要用于網絡流量、吞吐量、時延等具有統計意義的信息收集,進而分析鏈路性能等網絡狀態.
主動探測可動態地獲得鏈路的重要網絡指標,如瓶頸帶寬、瓶頸位置以及拓撲變化等[10]信息.Dovrolis等[11-12]在探測報文間隔模型(PGM)中使用報文對技術來估計鏈路瓶頸帶寬,通過分析這些探測報文進入與離開網絡的時間間隔之間的關系,進而獲得端到端的瓶頸帶寬.該模型具有算法簡單,測量時間短的優點,但受到背景數據流的影響,存在時間擴展和時間壓縮的問題.
Jain等[13]在探測報文速率模型(PRM)中采用自加載的周期性探測流技術(Slops)測量端到端的可用帶寬.PRM模型是建立在自導擁塞思想上的,利用擁塞發生時探測速率接近可用帶寬的特性,通過改變發送端的探測速率,在接收端觀察時延的變化情況,從而判斷擁塞的開始時間,進而獲得可用帶寬的估計值.該模型測量精確,能夠適應不同網絡狀態,但由于注入鏈路的數據相對較大,將影響網絡本身狀態和流量特征,甚至導致網絡不穩定.
Hu等[14]應用遞歸報文隊列技術(RPT)定位端對端鏈路瓶頸位置.該技術其實是融合了報文隊列技術和TRACEROUTE思想.發送端通過構造和發送重復的且TTL從1開始遞增的報文隊列,這樣使得報文隊列每經過一跳便能夠返回兩個連續的ICMP報文,根據這兩個ICMP報文被發送端接收時產生的時間離差,估算發送端到這一路由的瓶頸帶寬,從而獲得整條鏈路瓶頸的具體位置,進而方便管理員進行網絡優化配置與調整.該方法具有注入數據量相對其他同類算法少,定位準確,單端檢測,易于部署等優點,其不足在于對某些影響定位的參數,如注入報文長度、數目以及初始注入速率等,采用人為的經驗設定,不能做到根據網絡環境自適應調整.
此外,Siekkinen等[15]和Maier等[16]研究了在ISP部署被動測量的方法,其主要關注流量模型和應用程序使用網絡情況,同時能獲得RTT和家庭用戶的吞吐量.由于在家庭網絡內部沒有比較有利的監測點,因此無法測量出用戶從ISP處獲得的服務所能達到的真實性能,比如用戶應用程序自身的限速,于ISP處監測到的性能指標將不能反應真實的鏈路性能.Han等[17]在用戶端部署被動測量的方法,在用戶機器上安裝監測軟件,能方便地從用戶角度監測與分析接入網絡的性能,但不適合監測大規模網絡的性能,同時,由于用戶很少長期運行計算機,該方法難以獲得長期持續性的測量結果.Sundaresan等[18]在網關處使用被動測量,既能直接測量ISP接入鏈路的性能,又能了解用戶的使用情況以及用戶行為對網絡性能的影響.應用該方法可以進行長期持續性的測量,并能詳細分析不同ISP的流量模式對吞吐量與時延的影響等.
主動測量方法影響被測網絡的運行,其應用有一定限制,而被動測量方法幾乎不會對網絡運行造成影響,其應用范圍較廣,特別適合于長期網絡監聽.如果需要系統地刻畫網絡的運行特征,就需要合理的結合使用這兩種測量方法,并以此為基礎對網絡進行進一步的分析管理與規劃設計.
基于流的測量與傳統網絡中的測量細節記錄非常相似,都是以流為基準.對于網絡測量的流,可以定義為在同一組特定的源地址和目標地址、源端口號和目標端口號之間傳遞的、有著固定的協議類型,具有開始時間、結束時間的數據包的集合.例如,NSF的Surveyor,在每個參與測量的網點上部署專用的測量設備,通過互相發送和接收主動測試,分組測量并記錄特定路徑的單向延遲和丟包率,中心數據庫設備每隔幾分種就輪詢一次測量設備,如果測量設備有新的性能數據,就上傳到中心數據庫,系統還分析了路徑的不對稱性、丟失率的不對稱性、時延的不對稱性及各地區之間傳輸不對稱性[19];CAIDA的CORALREEF通過在線監視方式監測流狀態,然后通過HTML報告生成工具生成流量測量報告[20].此外,Test Traffic Measurement(TTM-RIS)、IEPM 和CFLOWD也是很好的流測量分析工具[20-22].
網絡測量能夠對每一個網絡元素進行被動測量.例如,NETRAMET通過向測試鏈接或接點發送ICMP包同時以SNMP代理收集網絡接口數據實現測量目的,主要測量參數指標是帶寬[23];CAIDA的IFFINDER主要通過發送UDP包到未使用的端口,測量到各IP接口,并實現連接[24];由NLANR/DAST共同開發的IPERF,通過啟動IPERF服務器監聽進程,監聽客戶端連接,主要用于測量TCP及UDP帶寬,同時測量延遲抖動、丟包率[23];NSF的NAI是目前測量基礎設計中較全面的項目,它通過被動方式收集包頭數據、主動性能數據及用SNMP協議采集網絡路由穩定性的狀態數據等[25].
傳統網絡傳輸中,每一個建立起來的連接都包含一個節點對,而且能夠在每個交換機中為每個節點對維護數據寄存器,用來記錄節點對之間的網絡情況.但IP網絡的類似測量要復雜一些,因為IP是一個數據報協議,中間有許多轉發結點,測量數據往往不能直接獲得.對此,可以通過被動測量得到原始數據進行分析,從而達到獲得數據流的整體信息.但是這種方法需要處理大量數據,而且由于路由配置可能發生一些改變,導致對節點對之間流量的跟蹤會出現丟失的情況.為實現針對節點對的測量,研究者們開發了很多工具:基礎的有PING,可獲得節點對之間網絡往返時延、丟包率與連通性等參數;TRACERT/TRACEPATH,通過向節點對的另一方發送ICMP包,以路由跟蹤方式檢測數據包在網絡上停止的位置,實現節點對之間的測量.此外,CAIDA開發的AUTOFOCUS,通過跟蹤節點對收集數據,使用RRDTOOL形成可視化的數據圖和時間軸;PATH PING也能夠實現為路徑中的每個路由器和鏈路提供網絡延遲和數據丟失信息;Planet Lab可實現各節點對之間的測量[26-27].
路徑就是IP分組從某個源端節點傳送到目標端節點的過程中,所經過的一系列鏈接的集合.基于路徑的網絡測量通常是針對MPLS路由而言的.由于MPLS可以使用相對固定的路徑對網絡流量進行路由,所以能夠在此基礎上進行基于路徑的測量,同時也可以開發基于流量的接入控制機制以及對傳送的特定服務的性能進行跟蹤和評估.
目前,SKITTER通過從幾個源點到成千上萬個目標點收集到的路徑信息,采用斷層攝像技術,動態發現和跟蹤Internet拓撲結構,通過可視化技術實現繪制全球互聯網拓撲結構[28].由NSF和DARPA開發的NIMI則通過主動測量方式,在互聯網上大量部署Paxson研制的網絡探針進程NPD(Network Probe Daemon),監測互聯網絡路徑性能狀況,NIMI由探針、聯系配置中心、數據分析中心和客戶測量端4部分組成[29].另外,TRACEROUTE可測量P2P路由信息;MTRACE可測量P2P多播路由信息;TRENO/CAP/CAPTRENO可測量批傳輸容量;ZING可測量單向延遲和往返延遲及丟包率;MFLECT利用組播方法研究路徑特性;TRAFFICE/DISCARD測量吞吐量;SPAND(Shared Passive Network Performance)使用被動共享測量技術測量網絡帶寬,將結果存貯在各個域的網絡測量性能數據中心共享,域中的主機可以從數據中心獲取信息以預測性能,而不增加網絡負載[30].
網絡測量技術對于網絡發展具有重要意義.網絡測量技術后續的研究工作將針對不同測量工具的協同工作,合理構建大規模網絡測量體系結構,測量和分析結果的可視化研究,測量所造成的網絡安全問題,對未來網絡的發展趨勢分析等方面.隨著對網絡行為的深入研究,網絡開發者和使用者會更加了解網絡自身性質,增加應用種類,將網絡服務質量進一步提高.
:
[1]裴昌幸.現代通訊系統與網絡測量[M].北京:人民郵電出版社,2008.
[2]Oetiker T,Rand D.The Multirouter Traffic Grapher[EB/OL].[2011-02-18].http://oss.oetiker.ch/mrtg/,2012-09-10.
[3]Paessler-the NetworkMonitoring Company.PRTGManuals[EB/OL].[2012-08-10].http://www.paessler.com/support/manuals/,2012-09-10.
[4]Shipway S.Using MRTG with RRDtool and Routers2[M].Cheshire Cat Publishing,2011.
[5]The WinPcap Team.Winpcap documentation[EB/OL].http://www.winpcap.org/.
[6]Graderer G ,Loschmidt P,Sauter T.Real-time Enabled Debugging for Distributed Systems[C]//Proceedings of the ETFA2008IEEE International Conference.Hamburg:IEEE Press,2008.
[7]Zhang S C,Zhang C G ,Yang Q.DataPreparation forData Mining[J].Applied Artificial Intelligence,2003,17(5-6):375-381.
[8]The Cacti Group.Official Cacti Documentation[EB/OL].[2011-01-15].http://docs.cacti.net/,2012-05-10.
[9]Paxson A V.A Reactive Measurement Frame work[C]//Proceedings of the9th International Conference on Passive and Active Network Measurement.Cleveland OH USA:Springer Publisher,2008.
[10]Cunha I,Teixeira R,Veitch D,et al.Predicting and Tracking Internet Path Changes[C]//Proceedings of ACM SIGC OMM'11.Toronto:ACM Press,2011.
[11]Dovrolis C,Ramanathan P,Moore D.What do PacketDispersion Techniques Measure[C]//Proceedings of IEEE INFOC OM'01.Anchorage(Alaska):IEEE Press,2001.
[12]Dovrolis C,Ramanathan P,Moore D.Packet-dispersion Techniques and a Capacity-estimation Methodology[J].IEEE/ACM Transactions onNetworking,2004,12(6):963-977.
[13]Jain M,Dovrolis C.Pathload:A Measurement Tool for end-toend Available Bandwidth[C]//Proceedings of Passive and Active Measurements(PAM)Workshop,2002.Fort Collins,Colorado,USA:CoteSeer,2002.
[14]Hu N ,Li L,Mao Z M,et al.Locating Internet Bottlenecks:Algorithms,Measurements,and Implications[C]//Proceedings of ACM SIGC OMM'04.New York:ACM Press,2004.
[15]Siekkinen M,Collange D,Urvoy-Keller G ,et al.PerformanceLimitations of ADSL Users:a Case Study[C]//8th International Conference,PAM2007.Louvain-la-Neuve:SpringerBerlin Heidelberg,2007.
[16]Maier G ,Feldmann A,Paxson V ,et al.On Dominant Characteristics of ResidentialBroadband Internet Trafficc[C]//Proceedingsof the9th ACMSIGCOMMConference on Internet Measurement Conference.New York:ACM Press,2009.
[17]Han D,Agarwala A,Andersen D G,et al.Mark-and-sweep:getting the inside scoop on neighborhood networks[C]//Proceedingsof the8th ACMSIGCOMMConference on Internet Measurement Conference.New York:ACM Press,2008.
[18]Sundaresan S,Donato W de,Teixeira R,et al.Broadband Internet Performance:A View from the Gateway[C]//Proceedings of ACMSIGCOMM'11.Toronto:ACM Press,2011.
[19]Calyam P,Lee C-G,Ekici E,et al.Orchestration of Networkwide active Measurements for Supporting Distributed Computing Applications[J].IEEE Transactions on Computers,2007,56(12):1629-1642.
[20]The Cooperative Association for Internet Data Analysis.CAIDA Tools-Overview of CAIDA Software Tools[EB/OL].[2011-12-15].http://www.caida.org/tools/,2012-05-11.
[21]RIPE(Reseaux IP Europeens)NCC.Test Traffic Measurement Service[EB/OL].[2012-06-16].http://www.ripe.net/data-tools/stats/ttm/test-traffic-measurement-service,2012-06-21.
[22]Shriraml A,Murray M ,Hyun Y,et al.Comparison of Public end-to-end Bandwidth Estimation Tools on High-speed Links[C]//6th Interneational Workshop,PAM2005.Boston:Springer Berlin Heidelberg,2005.
[23]Nlanr,Dast.Iperf[EB/OL].[2008-03-19].http://iperf.sourceforge.net/,2012-08-10.
[24]Govindam R,Tangmunarunkit H.Heuristics for Internet Map Discovery[C]//Proceedings of IEEE INFOCOM,2000.Tel Aviv:IEEE Xplore,2000.
[25]Gregor T Mc.The Nlamr Network Analysis Infrastructure[J].IEEE Communications Magazine,2000,35(5):122-128.
[26]Estan C,Savage S,Varghese G.Automatically Inferring Patterns of Resource Consumption in Network Traffic[C]//Proceedingsof ACM Sigcomm,2003.New York:ACM Press,2003.
[27]Banerjee S,Grin T,Pias M.The Interdomain Connectivity of Planetlab Nodes[C]//Proceedings of PAM,2004.Antibes:Spinger Berlin Heidelberg,2004.
[28]The Cooperative Association for Internet Data Analysis.Skitter[EB/OL].[2011-12-15].http://www.caida.org/tools/measurement/skitter/,2012-05-11.
[29]Paxson V,Adams A ,Mathis M.Experiences with NIMI[C]//SAINT2000.Proceedings of Applications and the Internet(SAINT)Workshops.Nara:IEEE Conference Publications,2002.
[30]Srinivasan S,Mark S ,Katz R H.SPAND:Shared Passive Network Performance Discovery[C]//USENIX.Proceedings of the1st USITS.Monterey:The Advanced Computing Systems Association,1997.
Network Measurement Methods and Their Applications Summary
WANGYizhi,WANGChengyan
(School of Information Science and Technology,Xiamen University,Xiamen 361005,China)
Abstract:With the rapid development of networks and communication business,users'demands on network bandwidth and other resources increase and network applications become more diversified.In general,that the quality of network service(QoS)degrades is caused by that the burden of network traffic is overweight and the routing equipments are overload.In order to guarantee QoS,administrators have to regularly mea sure various performance metrics to evaluate the status of network.The function modules of network mea surement system,the popular tools of network measurement,some network measurement methods(active and passive)and their applicationswere introduced in this paper.The advantages and disadvantages of typ ical measurement methods were analyzed.
Key words:network measurement;performance metric;active measurement;passive measurement
TP393.06
A
1004-5422(2012)04-0341-05
2012-09-24.
中央高校基本科研業務費專項資金(2010121066)資助項目.
王意志(1982—),男,高級工程師,從事網絡測量技術研究.