周紫陽 魏松杰
(南京理工大學計算機科學與工程學院 江蘇 南京 210094)
移動蜂窩網絡中被動模式時延測量方法
周紫陽1魏松杰2
(南京理工大學計算機科學與工程學院 江蘇 南京 210094)
移動蜂窩網絡與傳統有線網絡在時延模型上有較大的差異。基于移動蜂窩通信的特點,提出一種針對移動蜂窩網絡的時延被動測量方法,依據通信鏈路中RRC(Radio Resource Control)的不同狀態,將網絡時延分為空閑態時延和連接態時延。通過對骨干網測量點的流量分析,計算出RRC不同狀態下的數據往返時延并進行有效性判定,據此對各個終端到測量點之間的空閑態時延和連接態時延分別進行測量。與傳統的測量技術相比,該方法對移動蜂窩網絡的時延測量更加精確細致,過程對用戶無影響,更具實際應用價值。實驗結果表明,提出的方法有較高的測量效率和準確性。
移動蜂窩網絡 RRC 網絡時延 被動測量 流量分析
時延作為網絡服務質量、網絡性能的重要指標,一直受到重視。隨著3G/4G的快速發展,移動蜂窩網絡接入互聯網已經成為越來越多人的選擇,而移動蜂窩網絡開放的無線通信環境,大大制約了終端接入網絡在帶寬、時延等性能方面的提升。因此,移動蜂窩網絡時延的測量和分析對運營商提高服務質量,挖掘移動互聯網市場潛力,有著重要的意義。目前網絡時延的測量方法有很多,但研究對象局限于有線網絡,并沒有考慮移動蜂窩網絡的特點,因此不能完全適用于移動蜂窩網絡流量中的時延測量。例如傳統的測量方法基于交換式以太網的鏈路模型,模型中傳輸鏈路是獨享的,傳輸時延收斂于一個值,并且服從特定分布模型。而在移動蜂窩網絡中,無線鏈路資源是共享的,通信鏈路有建立和釋放的過程,傳輸時延可能有多個收斂區間,不屬于單一的分布模型。移動蜂窩網絡與有線網絡在時延模型上存在較大的差異,因此要對其提出針對性的時延測量方法。
本文分析了移動蜂窩網絡通信鏈路的特點,以及鏈路協議對網絡時延的影響,提出了一種針對移動蜂窩網絡的被動模式時延測量方法:首先依據通信鏈路中RRC處于不同狀態下時延構成因素的不同,將移動蜂窩網絡時延分為空閑態時延和連接態時延;其次通過分析移動蜂窩網絡的流量數據,計算RRC處于不同狀態下的數據傳輸往返時延;最后篩選出有效時延采樣,完成對終端到測量點之間的時延測量。實驗以ping主動測量得到的時延作為對比基準,提出的被動模式測量方法能取得較高的測量效率和準確性。
現有的網絡時延被動測量方法,主要采用分析TCP流量的方式實現,即依據TCP協議的特點,分析不同條件下數據報之間的觸發關系,據此選取特定的數據報計算網絡時延。SYN-ACK方法[1]依據TCP中的三次握手協議,通過定位握手報文,利用不同方向的SYN和ACK報文時間差來估計端到端的網絡時延。PRE算法[2]是在上傳或下載產生的塊流量中,計算數據發送輪次的間隔時間,以此表示網絡數據傳輸的時延。Karn提出的方法[3]是利用TCP有效載荷大于0的數據報和其觸發的ACK報文之間的時間間隔來計算網絡時延,并忽略重傳導致的可疑情形。Timestamp(TS)方法[4]通過觀測TCP數據流中可能出現的時間戳選項來計算數據往返時延。
網絡流量中時延的影響因素較為復雜,傳統的研究方向以有線網絡環境為主,將網絡時延分為兩個部分[5]:鏈路傳輸所需的固定時延dfixed、存儲轉發隊列引起的可變時延dvar。為過濾掉TCP協議實現差異、網絡擁塞等不確定性因素導致的無效時延樣本,擁塞窗口跟蹤方法[6](Running方法)維持一個有限狀態機(FSM)來跟蹤TCP發送方的擁塞控制窗口(congestion window),Gating方法[7]則是以每個終端的最小時延采樣值估計鏈路傳輸導致的固定時延,構建網絡擁塞時延的高斯分布模型,使用門限函數判斷時延采樣的有效性。
上述理論和方法均未考慮移動蜂窩網絡的特殊性,不能完全適用于移動蜂窩網絡流量的時延測量。首先,移動蜂窩網絡不同于有線網絡,其通信鏈路在有數據傳輸時建立,長時間無數據傳輸時釋放,傳輸任務會引起鏈路在帶寬和速率等方面的變化[8],這就導致其鏈路通信的時延并不收斂,鏈路狀態變化導致的時延波動甚至遠超過隊列及擁塞帶來的影響。其次,移動蜂窩網絡終端主要為智能移動終端,操作系統以Android、IOS為主,通信數據主要以交互式數據為主,塊流量較少,且絕大部分的數據報不攜帶時間戳。最后,移動蜂窩網絡的接入側是區域內用戶共享的,引起時延波動的主要因素不僅限于路由隊列,同時鏈路速率及帶寬變化也使時延波動更加復雜[9],時延分布不能用簡單的函數模型或門限函數進行預測判斷。
2.1 基本測量思路
當前,提供互聯網數據服務的移動蜂窩網絡類型主要為3G/4G網絡,本文下述提到的移動蜂窩網絡也主要是指3G/4G網絡。圖1為用戶終端通過移動蜂窩網絡接入互聯網的架構示意圖。用戶終端設備UE(User Equipment)通過空中的無線信號與基站進行交互。基站和運營商的核心網絡負責用戶的接入、計費、數據業務等。

圖1 移動蜂窩網絡架構
被動測量點設置在互聯網的骨干結點或運營商的核心網。用戶終端到測量點之間的網絡可主要分為兩部分:終端到運營商核心網之間的接入網絡、運營商核心網到測量點的傳輸網絡。傳輸網絡一般采用光纖通信,時延主要受網絡隊列(網絡擁塞)的影響,符合傳統的時延分析模型。接入網絡是移動蜂窩網絡和有線網絡區別最大的部分,受無線通信協議、鏈路速率、鏈路負載等因素影響,與有線網絡有較大的差別。移動蜂窩網絡中,接入網絡的屬性是影響時延測量結果的重要因素。
在3G/4G蜂窩網絡中,用戶終端并不是一直處于高速通信狀態,一定范圍內的終端共用有限的無線資源(頻率、時隙)。為了保證無線資源能合理地分配給有數據傳輸需求的用戶,蜂窩網絡的通信協議中包含了一個獨特的模塊——無線電資源控制器Radio Resource Control(RRC)來動態的分配無線鏈路[10]。設備在傳輸數據時建立無線鏈路,在沒有數據傳輸時釋放無線鏈路,這樣既能滿足用戶的通信需求,又可以合理地利用無線通信資源,這就是RRC的設計思路。RRC的主要作用是在無線通信過程中為協議上層提供來自網絡系統的無線資源參數,同時控制下層的參數和行為,對無線資源進行分配并發送相關信令。
在移動蜂窩網絡中,RRC狀態代表著鏈路的狀態,其中對網絡時延有較大影響的RRC狀態有兩種:空閑態(RRC_IDLE)、連接態(RRC_CONNECTED)。空閑態也稱睡眠態,表示終端長時間無數據傳輸時,無線鏈路被釋放后的狀態。此時若上層(TCP/IP)有網絡傳輸需求,需先通過RRC信令建立無線鏈路,轉換成連接態,數據報才能得以傳輸。連接態也稱激活態,用戶占有無線鏈路資源,此時若有網絡傳輸需求,數據可通過無線鏈路正常收發。一些移動蜂窩網絡的連接態還分為高速連接(CELL_DCH)和低速連接(CELL_FACH)等狀態,代表不同數量的鏈路資源和網絡通信速率。RRC處于不同狀態,時延構成不同,測量得到的網絡時延也會有較大的差異。因此,在時延測量過程中,需對RRC處于不同狀態下的網絡時延分別進行測量。
2.2 空閑態時延測量方法
移動蜂窩網絡終端在特定的時間內無數據傳輸時,無線鏈路會被釋放,RRC轉換為空閑態,空閑態時延便是指此時傳輸數據報所產生的時延。空閑態時延由無線鏈路建立過程引起的時延和鏈路傳輸所需的時延構成。不同的運營商網絡,RRC狀態轉換的時間閾值不完全相同。
在終端無其他數據傳輸的條件下,間隔不同的時間,采用主動ping的方法,測量不同運營商網絡終端到某骨干網結點的往返時延。當ping間隔大于某個閾值時,RRC在間隔時間內轉換為空閑態,測量得到的往返時延會明顯增大,這個閾值便是運營商網絡的RRC轉換閾值。ping間隔大于閾值測得的時延即為空閑態時延,小于閾值即為連接態時延,不同運營商網絡的RRC轉換的時間參數并不完全一致。對國內常用的移動蜂窩網絡進行測量,ping發送間隔和往返時延測量值的關系如圖2所示。

圖2 移動蜂窩網絡ping間隔和往返時延關系
圖2中還可以看出實驗過程中測量得到的三大運營商3G/4G網絡的空閑態轉換閾值如表1所示。

表1 RRC狀態轉換閾值
移動蜂窩網絡終端主要以智能手機終端為主,從用戶角度分析,其流量大致可以劃分為用戶操作產生的交互流量和用戶無操作時的背景流量。交互流量主要是指用戶主動打開操作APP應用產生的數據流量,例如用戶瀏覽新聞、觀看視頻產生的流量。背景流量主要是指終端休眠時,后臺APP服務產生的背景業務流量,例如即時通信軟件的消息推送、郵件查詢等行為產生的流量,這類流量具有周期性、離散性等特點。
交互流量中,數據頻繁傳輸,用戶需要高速的數據服務,此時RRC基本處于連接態。背景流量中,終端處于休眠狀態,正常的APP應用需考慮流量資費和手機電量消耗的等因素,會將周期性的傳輸任務間隔至數分鐘,此時RRC大多處于空閑態。空閑態時延測量主要以背景流量為研究對象。日常生活中,手機終端使用愈發頻繁,但終端處于休眠態,無人機交互的時間仍遠遠大于人機交互的時間,因此盡管背景流量較為稀疏,但持續時間相對較長、有一定的周期,被動測量時成功采樣的概率較大。
圖3標識了空閑態時延測量的典型架構,在終端與服務器保持TCP連接,但一段時間內持續無數據傳輸,RRC轉換為空閑態后傳輸第一個數據報的往返時延可表示空閑態時延,其包含了鏈路建立產生的RRC時延和鏈路傳輸時延。

圖3 空閑態時延測量
數據報往返時延的計算主要依據網絡協議中的數據報觸發關系,目前已有較多的研究成果[11],本文不再討論,統一將觸發報文記為pkttigger,其回應數據報記為pktresp,如果其滿足條件:
fretry(pkttigger)=fretry(pktresp)=0
(1)
ftime(pkttigger)-ftime(pkttigger-1)>t
(2)
則可計算空閑態時延采樣為:
Delaypkt=ftime(pktresp)-ftime(pkttigger)
(3)
式中:fretry獲取指定數據報的重傳次數;ftime獲取指定數據報的捕獲時間;pkttigger-1是在傳輸pkttigger數據報前,源地址發送或接收的上一個網絡數據報;t是相應網絡的RRC狀態轉換時間的臨界值。式(1)要求數據報pkttigger與pktresp無重傳,排除可疑采樣,式(2)要求數據報pkttigger與前一個數據報pkttigger-1的間隔時間落在區間(t,+∞)中,即保證pkttigger發送時RRC處于空閑態。
實際網絡測量過程中,并不一定能將終端所有的流量捕獲到,經常會出現漏掉少部分流量的情況,例如局域網通信的數據報等,此時滿足式(2)約束的數據報的RRC狀態可能不是空閑態,而是連接態。因此,需要對結果進行適當的過濾。由于RRC處于空閑狀態的時延會明顯大于處于連接態的時延,這里采用K-means聚類算法,將測量得到的結果分成兩類,過濾掉取值小的一類,將取值較大的一類作為空閑態時延的有效采樣。
2.3 連接態時延測量方法
RRC處于連接態時,占有數據鏈路,數據可以及時發送,但在移動蜂窩網絡共享式的無線環境中,用戶分配得到的無線資源是有限的,這使得接入網絡在上下行速率上都受到一定的限制。如果遇到大量突發的傳輸任務,數據在終端與基站之間就可能產生較大的隊列時延,甚至產生擁塞。與有線網絡不同,移動蜂窩網絡擁塞主要產生在當前用戶分配的無線鏈路上,一般不會對基站連接的其他用戶產生影響。有線網絡擁塞瓶頸在路由轉發設備上,這會對該設備下接入的所有用戶產生影響。有線網絡考慮的擁塞因素是大量網絡用戶的整體行為導致,有較好的統計特征(例如高斯分布),而移動蜂窩網絡的擁塞因素主要有當前終端用戶導致,個體行為影響較大。因此移動蜂窩網絡的中終端連接態時延分布不能使用簡單的函數預測。
移動蜂窩網絡通信的鏈路帶寬瓶頸,使得傳輸需求小于該瓶頸時,測量得到的往返時延接近于通信鏈路時延,反之,如果需求瞬時大于該瓶頸值,則測量得到的時延會受到排隊時延的影響[12]。網絡帶寬和時延是網絡的兩個不同層面的重要指標,在流量分析的過程中,時延的被動式測量要盡量去除網絡帶寬限制(網絡負載變化)的影響,需要對測量得到的時延進行過濾,選擇合適的時延采樣代表通信鏈路時延。本文通過設置閾值N對時延采樣進行有效性判斷,考察觸發報文pkttigger及其回應數據報pktresp之間的一段時間內,源地址傳輸的數據報數量是否小于N,作為此次時延是否有效的條件。
圖4標識了連接態時延測量的典型架構,對于所示流量中包含的觸發數據報pkttigger及對其回應的數據報pktresp,如果其滿足條件:
fretry(pkttigger)=fretry(pktresp)=0
(4)
findex(pktresp-findex(pkttigger)≤N
(5)
則計算空閑態時延采樣為:
Delaypkt-ftime(pktresp)-ftime(pkttigger)
(6)
式中:findex為獲取指定數據報在流量文件中的序號的函數,這里的流量文件是指該特定源地址發送和接收的流量,如果獲取的流量中包含多個源地址,需先將獲得流量依源地址切分成不同的流量文件。fretry獲取指定數據報的重傳次數,ftime獲取指定數據報的捕獲時間,N是一個大于0的常量。
式(5)要求觸發/回應數據報之間該源地址傳輸的報文數量不大于N,此時不僅僅考慮當前連接,而是考慮該終端的所有網絡行為。如果網絡繁忙,觸發/回應包間可能仍會傳輸大量的數據報,否則可能處于等待應答狀態。觸發/回應數據報之間無數據報傳輸,不能表示網絡沒有發生擁塞,但N越小,網絡擁塞的概率越小,樣本的可信度越大,但采樣率較小;反之,N越大,采樣率越大,但網絡擁塞的概率也越大,樣本可信度越小。實驗中選擇合適的N值,獲得可接受的采樣率的同時要盡量排除擁塞的影響。

圖4 連接態時延測量
實驗中的測量點是位于IDC骨干結點上的一臺服務器,為獲取終端產生的移動蜂窩網絡流量,如圖5所示,在服務器上搭建了SOCK代理平臺,手機終端安裝代理軟件,通過代理平臺訪問互聯網。服務器環境為CentOS 6.5,CPU為六核E5-2603(1.6 GHz),100 M獨享帶寬。實驗終端接入中國聯通4G提供的移動蜂窩網絡,采用其他類型的移動蜂窩網絡也能得到一致的結果。

圖5 時延測量實驗架構
實驗終端為真實用戶的手機,手機操作系統類型為Android。連接態時延測量過程中,主動模式和被動模式的測量使用相同的手機終端。空閑態時延測量過程中,主動測量會改變終端的數據鏈路狀態,從而影響被動測量的結果,因此使用不同的手機終端。被動測量的流量來自于用戶實際產生的數據,主動測量的結果來源于構造特定條件下的ping包測得的往返時延。為驗證被動測量方法的準確性,將被動測量結果和同時段的主動測量結果進行比對。
圖6是分別通過主動、被動模式測量得到的空閑態時延累積分布。主動測量中ping包間隔和被動測量中使用閾值t都設為10 s,主動及被動的測量結果都是經過聚類算法過濾后得到的時延值。

圖6 中國聯通4G空閑態時延測量累積分布
當鏈路處于空閑態時,中國聯通4G中使用被動模式測量得到的時延與主動測量得到的時延分布有很高的相似度。同時,被動模式測量得到的時延要略大于主動測量得到的時延,這是由于主動測量時的ICMP包的長度為64 B,要普遍小于被動模式測量所使用的數據報長度。實驗中被動模式測量所用的數據報文約為156 B。較大的數據報在無線傳輸時可能會產生較大的傳輸時延。
圖7顯示,連接態時延被動測量中:取N=1時,采樣率過低,樣本對總體的代表性不足,與主動的測量結果偏離較大;取N=10時,網絡擁塞的影響較大,與主動的測量結果偏離也較大;取N=5時,計算得到的時延分布與主動測量得到的結果有很高的相似度。這說明:N較小時,理論上與主動測量結果的相似度較高,但時延的采樣率相對較小,致使測量結果產生偏差;N較大時,可以獲得較多的時延采樣,但負載影響較大,與主動的測量結果也會有較大的偏差,網絡負載越重時偏差越明顯,因此測量過程中還要依據采樣率來確定合適的N值。

圖7 聯通4G蜂窩網絡連接態時延測量累積分布
圖8可以看出,N值與采樣率成正相關,實驗中還發現,終端用戶產生的網絡流量中,使采樣率保持在15%~30%之間的N值,據此計算出的連接態時延可獲得較高的準確性。

圖8 采樣率與N值關系圖
本文分析了移動蜂窩網絡時延的影響因素,從數據鏈路建立與釋放的角度,將時延分為空閑態時延和連接態時延,并提出了一種被動模式下的測量方法,可分別測量空閑態和連接態的時延。本文提出的被動測量方法可在不影響網絡狀態的情況下,對蜂窩網絡中的時延進行測量,適于在移動蜂窩網絡骨干結點上部署和應用。
[1] Jiang H, Dovrolis C. Passive estimation of TCP round-trip times[J]. ACM SIGCOMM Computer Communication Review, 2002, 32(3): 75-88.
[2] 張軼博, 雷振明. 一種被動式 RTT 測量算法[J]. 北京郵電大學學報, 2004, 27(5): 85-89.
[3] Karn P, Partridge C. Improving round-trip time estimates in reliable transport protocols[J]. ACM SIGCOMM Computer Communication Review, 1987, 17(5): 2-7.
[4] Veal B, Li K, Lowenthal D. New methods for passive estimation of TCP round-trip times[C]//International Workshop on Passive and Active Network Measurement. Springer Berlin Heidelberg, 2005: 121-134.
[5] Choi B Y, Zhang Z L, Du D H C. Analysis of Point-To-Point Delay in an Operational Backbone[M]//Scalable Network Monitoring in High Speed Networks. Springer New York, 2011: 75-110.
[6] Jaiswal S, Iannaccone G, Diot C, et al. Inferring TCP connection characteristics through passive measurements[C]//INFOCOM 2004. Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Societies. IEEE, 2004, 3: 1582-1592.
[7] 黃鸝聲, 周明天, 汪文勇. 骨干網絡中的被動模式RTT測量方法[J]. 計算機應用研究, 2009, 26(8):3086-3089.
[8] Barbera M V, Bronzini S, Mei A, et al. A Needle in the Haystack-Delay Based User Identification in Cellular Networks[C]//International Conference on Passive and Active Network Measurement. Springer International Publishing, 2014: 265-267.
[9] Xu Y, Wang Z, Leong W K, et al. An End-to-End Measurement Study of Modern Cellular Data Networks[M]// Passive and Active Measurement. Springer International Publishing, 2014:34-45.
[10] Kolding T, Wigard J, Dalsgaard L. Balancing power saving and single user experience with discontinuous reception in LTE[C]// IEEE International Symposium on Wireless Communication Systems. IEEE Xplore, 2008:713-717.
[11] Gangam S, Chandrashekar J, ítalo Cunha, et al. Estimating TCP Latency Approximately with Passive Measurements[M]// Passive and Active Measurement. Springer Berlin Heidelberg, 2013:83-93.
[12] Schiavone M, Romirer-Maierhofer P, Ricciato F, et al. Towards Bottleneck Identification in Cellular Networks via Passive TCP Monitoring[M]// Ad-hoc, Mobile, and Wireless Networks. Springer International Publishing, 2014:72-85.
ADELAYMEASUREMENTMETHODFORPASSIVEMODEINMOBILECELLULARNETWORKS
Zhou Ziyang1Wei Songjie2
(SchoolofComputerScienceandEngineering,NanjingUniversityofScienceandTechnology,Nanjing210094,Jiangsu,China)
Mobile cellular network and traditional wired network have great difference in delay model. Based on the characteristics of mobile cellular communication, this paper proposes a delay passive measurement method for mobile cellular networks. According to different states of RRC (Radio Resource Control) in the communication link layer, the network delay was divided into idle state delay and connected state extension. By analyzing the traffic flow of the measurement points in the backbone network, we calculated the round-trip time delay of RRC in different states to determine the validity. We measured the idle state delay and the link state delay between the terminals and the measurement points. Compared with the traditional measurement technology, this method is more precise and detailed for the delay measurement of the mobile cellular network, which has no effect on the user and has more practical application value. Experimental results show that the proposed method has higher measurement efficiency and accuracy.
Mobile cellular network RRC Network with time delay Passive measurement Traffic analysis
2017-03-02。國家自然科學基金面上項目(61472189)。周紫陽,碩士生,主研領域:計算機網絡安全。魏松杰,副教授。
TP393
A
10.3969/j.issn.1000-386x.2017.11.027