唐賓徽 陳睿 周振興



摘? 要: 由于移動通信網和無線傳感網各有特點,且各自的網絡結構和協議棧差別較大,兩網異構融合產生的多業務數據流量將同時具備局部性、周期性、隨機性、突發性等多重特點,結構復雜,對網絡運營能力及安全監測帶來了技術難題。文中針對多業務流的場景,分析各類業務流模型的特點,提出一種基于異構網的融合業務流模型,并對業務流量通過預測算法進行預測。仿真結果表明,該模型算法的預測精度較高,為異構網的多業務融合起到了重要的支撐作用。
關鍵詞: 異構網; 融合業務流模型; 預測算法; 無線傳感網; 移動通信網; 模型分析
中圖分類號: TN92?34? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)05?0014?05
Research on service flow model and prediction algorithm for integration of wireless sensor networks and mobile communication networks
TANG Binhui1, CHEN Rui2, ZHOU Zhenxing3
(1. School of Computer and Software, Jincheng College of Sichuan University, Chengdu 610000, China;
2. School of Humanities, Xihua University, Chengdu 610000, China;
3. A Military Representative Office of PLA Rocket Force, Chengdu 610000, China)
Abstract: Since both the mobile communication networks and the wireless sensor networks have their own characteristics, and their network structures and protocol stacks are quite different, the multi?service data flow generated by the heterogeneous integration of the two networks are of the characteristics of locality, periodicity, randomness and burst property, as well as complex structure, which brings technical problems to network operation capability and security monitoring. In view of the above mentioned, the characteristics of various service flow models are analyzed on the basis of multi?service flow scenarios, and an integrated service flow model based on heterogeneous network is proposed, and the service flow is predicted by the prediction algorithm. The simulation results show that the prediction accuracy of the model algorithm is high, which plays an important supporting role for multi?service integration of heterogeneous networks.
Keywords: heterogeneous network; converged service flow model; prediction algorithm; wireless sensor network; mobile communication network; model analysis
0? 引? 言
隨著新一代移動通信網絡技術和物聯網技術的不斷發展,大力推進無線傳感網與移動通信網的異構融合已是大勢所趨。無線傳感網通過末端感知可為移動通信網提供有效、可靠且實時的前端數據;而移動通信網作為信息傳送的承載網可為無線傳感網提供有效的管理、運營和維護。兩網的異構融合,不僅有助于海量傳感信息的傳輸、分發與共享,還可作為一種全新的增值業務推動移動通信網的發展,為建立無處不在的泛在網絡[1]奠定基礎。本文主要針對異構網融合業務流的特點,建立與之相適應的業務流模型,并使用預測算法對其進行流量預測,為異構網絡性能評估提供解決方案。
泛在網絡就是將通信服務的對象從人擴展到任何一件物品,通信不只發生在人和人之間,還發生在人與物之間、物與物之間,泛在網絡的聯網設備規模將比傳統網絡大得多,它們可像互聯網上的計算機一樣形成機器對機器(Machine to Machine,M2M)的通信方式。無線傳感網與移動通信網融合而成的異構網,就是為滿足上述需求而采用的最現實和最便捷的通信方案。無線傳感器網絡(WSN)將大量微型、有計算能力的傳感器節點部署在監測區域內,以短距離無線低功率的通信方式形成一種多跳自組織網絡系統。在這個系統中,傳感節點將監測到的數據按照約定的路由規則傳輸給匯聚節點,再將接收到的傳感數據發送給管理節點,用戶可通過管理節點對整個傳感網絡進行配置、控制和管理。基于移動通信系統的WSN可以將傳感節點數據通過有限的分層傳輸到匯聚節點[2],再通過具有移動終端功能的傳感網關回傳到移動通信系統,或者直接由移動基站直連具有移動終端能力的傳感器,此時這些傳感器既是傳感節點也是網關,可以最大限度地降低傳輸延遲來支持對實時性要求很高的監控應用。
1? 融合業務流量特性與技術分析
移動通信網與WSN的融合,不僅要考慮基于移動終端的無線傳感節點的網絡通信以及移動基站與無線傳感節點的網絡融合問題,還需要從業務融合角度考慮應用層的開發、承載雙網的移動傳感設備以及網絡資源分配、業務流量分析等。該系統在實現有效數據傳輸基礎上,對移動傳感終端進行合理分配,監視終端的連接狀態、異常告警和業務流量預測,為融合網絡的運營、管理和維護奠定堅實基礎。
傳統的業務流分析模型都是將預測數值和監控數值與歷史數據進行比對分析,業務流的建模方法主要包括半馬爾柯夫模型、Poisson模型、基于自回歸滑動平均ARMA(Auto Regressive Moving Average)模型及ON/OFF模型等[3?6]。這些方法的特點是將業務流數據理解為一個平穩的隨機過程,通過對過往數據建模來分析數據流量的變化。雖然這些方法運算簡單,也取得了良好的預測效果,但基于移動通信網與WSN這種異構網絡融合的業務數據來說,這些方法就過于簡單了。異構網的業務數據流具有局部性、周期性、突發性和隨機性等特點,因此將業務數據簡單理解為平穩的隨機過程是不全面的。基于異構網這些特點,國內外很多研究者引入了小波多尺度分析以及固態模函數分解(Empirical Mode Decomposition,EMD)[7]等手段,將異構網絡信號在特定尺度上建立起ARMA模型,使其分解后的業務流量信號平穩或近似平穩,從而提高模型預測的準確性[8?11]。也有不少研究者基于神經網絡、支持向量機及模糊決策等理論,通過非線性擬合近似的方法來分析業務流量的變化規律,這些方法為解決業務流量預測問題提供了參考。但是,小波分析或者EMD等方法在特定尺度上分析業務數據時有可能丟失其他尺度上的信息,通過神經網絡來分析則存在過擬合問題,即模型對于擬合使用數據的解釋能力強而外展能力差,這是因為基于神經網絡這類方法通常會將部分噪聲也當成信號進行擬合,使得模型過度解釋當前的觀測數據[12?13]。本文針對異構網特點,研究構建基于多傳感節點的融合業務流模型,并通過多元自適應濾波算法對預測數值進行平均,對該業務的數據流量精確預測,這一方法相比傳統的ARMA模型,更能準確地預測業務數據流量。
2? 融合業務流量模型研究
這幾年,隨著物聯網的發展,基于移動通信網與WSN融合的多業務M2M設備將會越來越多。設備里集成的數據流差異較大,在設計業務流量模型時,為了更好地使其在異構網狀態下傳輸,必須對各種不同業務流量模型的特點進行分析,這種多類型傳感集成將會帶來新的業務特性。目前常見的數據流大多數是多媒體數據流和語音流,這類應用延遲要求相對較低,也可以容忍少量丟包,如遠程視頻監控業務;網絡中也存在對實時性要求較高的控制和報警業務,這類業務對時延和可靠性具有苛刻的指標要求。對多業務M2M終端來說,針對突發性的業務分析,可以用指數分布來表征發送數據的長度和突發間隔的概率密度:
[f(x;λ)=λe-λx,? ? ? x>00,? ? ?x<0]
式中:[λ=1t],[t]表示傳輸時間。
突發間隔的均值為:
[EX=1λ]
突發間隔的均值方差為:
[DX=1λ2]
針對周期性的數據流,將[x]設為常數[d],根據周期性業務數據構成的Poisson分布建模可得概率密度函數為:
[f(d)=λ1+λ2+…+λne-λ1+λ2+…+λnd,? ? d>0]
間隔均值為:
[Ed=1(λ1+λ2+…+λn)]
間隔方差為:
[Dd=1(λ1+λ2+…+λn)2]
針對長時間連續發送的數據流量,可以用高斯分布來表征數據長度的概率分布:
[f(x)=1(2λσ)2exp-(x-μ)22σ2]
長度均值為[μ],長度方差為[σ2],隨機變量長度落在[(α,β)]內的概率函數為:
[pα 多種不同的業務數據流由多維高斯分布建模可得,概率密度函數為: [fl1,l2,…,ln=22πnDσ1σ2…σn?exp-12Di=1nk=1nDik(li-ai)σi(lk-ak)σk] 長度方差為[n]階行列式: [D=r11r12r13…r1nr21r22r23…r2nr31r32r33…r3n?????rn1rn2rn3…rnn=1r12r13…r1nr211r23…r2nr31r321…r3n?????rn1rn2rn3…1] 式中:[rii=1],[rik=rki]。 在任意時刻,管理節點可收集到傳感器發送過來的多業務數據,這些業務數據在時間序列上的分布是相似的。假定時間序列是平穩時間序列,為[X1],[X2],…,[XK],其中,[Y]是預測對象的量測值,[Z]為誤差,則: [YT=β1X1+β2X2+…+βPXP+Z] 作為預測對象,[YT]受到自身變化的影響,其規律可由下式體現: [YT=β1XT-1+β2XT-2+…+βPXT-P+ZT] 誤差項在不同時期具有依存關系,由下式表示: [ZT=ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 由此,獲得模型表達式如下: [YT=β0+β1YT-1+β2YT-2+…+βPYT-P+ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 從上式可以看出,這個統計模型的主要缺點是丟失了流量序列中重要的周期信息和趨勢信息,異構網的數據結構復雜,宏觀流量往往多變,業務流量數據中又含有多種周期類波動數據,針對隨機因素的干擾很難用單一的模型來描述。本文采用多元的自適應模型對異構網中的業務流量使用平均誤差估計原理[14?15]來建模。根據多個時刻收集到的樣本數據,對相關系數進行回歸計算,該模型建立的前提是管理節點隨時間推移而收集到的業務數據形成的數據序列看作是一個隨機序列,這組隨機變量所具有的依存關系體現著原始數據在時間上的延續性,假設[f(t)]代表1個測量間隔收集到的樣本流量數據,[fm(k)]表示[m]個測量間隔收集到的流量數據的平均值,如下所示: [fm(k)=1mi=(k-1)m+1kmf(i)] 從上式可得,如果已知[fm(1),fm(2),…,fm(k)],可通過計算前[K]個流量的加權和來預測下一個測量間隔的業務流量[fm(k+1)]。本文研究的業務應用場景中多業務的M2M節點在不同時刻可收集到不同類的業務數據,這些數據之間的表現關系如下所示: [vT=a1v1+a2v2+…+aqvq] 式中:[v1,v2,vq]是各類傳感器的業務數據;[a1,a2,aq]是該任意時刻下各類數據的相關系數。根據多個時刻收集到的多個樣本數據,對相關系數進行回歸計算,可求得各類數據的損失函數[af1,af2,…,afn],當對下一個時刻[fm(k+1)]進行預測時,可得: [fm(k+1)]=[af1,af2,…,afn?fm(1)fm(2)?fm(k)] [af0,af1,af2,…,afn=R(n)? ? …? ? R(1)?R(1)…R(n)R(2)…R(n-1)???R(n)…R(1)-1] 式中[R(n)]為時間序列的協方差函數。從此過程中不難看出,此模型根據預測過程中各類數據所產生的誤差,運用誤差原理,通過多元的自適應模型來建模,提高流量預測的準確性。 3? 仿真驗證及結果 用于流量預測的基本方法都普遍采用事先獲取一段時間的正常(異常)流量,少則1天,多則數月,然后對采集到的歷史流量數據進行模式訓練、正常(異常)行為的刻畫或方差分析等,在得到某個間接統計量后再進行流量預測和異常檢測。 具體步驟如下: 1) 獲取[m]個不同時刻的業務數據流量[FX(t)]; 2) 對[FX(t)]選用[m]個不同時間尺度的線性濾波器對網絡流量信號進行多元的低通濾波,每個時刻的窗體點長為[2m],窗體選擇高斯窗,得到[m]個濾波信號,表示為[FXm(t)]; 3) 對[m]個不同的濾波信號按上文提及的業務流量模型進行預測,從而得到下一個時刻的預測值; 4) 對各個預測值取數值平均值作為異構模型的預測值,并與傳統的ARMA模型的預測值進行對比。 本文使用[σ2]表示[X]時刻以前[M]個原始值和預測值之間的估計誤差的平方和均值,即[σ2=ξ2n(n-1)m],用檢測統計量[τ]表示[n]時刻估計誤差與[σ]的比值,即當[σ>0]時,[σ2=ξ2n(n-1)m,γ=ξ(n+1n)σ],否則,[τ=0]。進行異常檢測時,若當前[τ]值超出容許范圍,則表示異常(為1),否則表示正常(為0)。 為了對算法性能進行評估,本文利用實驗室采集的傳感器數據集在Matlab 10.1平臺上進行仿真實驗[16?17],選取區域集合里1 000個傳感節點作為ARMA流量預測模型的預測數據點,再將這1 000個傳感節點作為異構網業務模型測試算法性能的預測數據點,通過比較兩者之間的誤差值,可以證明后者的算法預測能力更強。本文采用高斯窗,主要考慮其設計簡便,在處理濾波前對原始數據進行標準化,[M]取3,得到3個不同間隔時刻的濾波信號,以及各自的預測值,最后取預測值的平均值。 兩種不同模型在3個不同時刻的對照圖如圖1~圖3所示。 ARMA建模數據平均后的預測值波形圖和頻譜圖如圖4所示。 異構網建模數據平均后的預測值波形圖和頻譜圖如圖5所示。 從以上各圖的對比可以看到,相比ARMA模型,異構網模型的濾波信號波形圖更多地保留了信號變化的趨勢和特點。通過異構網模型進行數值預測,可以將信號在不同時間與能量上的特點看得更清晰,從而進一步得到準確度較高的預測數據。 將異構網的預測模型與實測數據模型進行對比,可以看出,異構網模型的預測數據與實測數據非常接近,誤差基本控制在±0.050之間,預測誤差在10-3量級。 4? 結? 語 本文針對異構網融合將出現的多業務集成場景下的數據流特點,提出與之相匹配的業務流量模型以及有效的流量預測算法,通過數據仿真比對,證實了其預測精度相比傳統的ARMA模型預測算法更優,可廣泛應用于異構網環境下的網絡流量預測。下一步,將充分考慮針對多元業務數據的自適應權重,以期進一步提高流量預測精度。 注:本文通訊作者為陳睿。 參考文獻 [1] 陳智,羅平,岳文靜,等.一種用于無線傳感器網絡絡的能量拓撲控制算法[J].中國傳感器與驅動器學報,2013,23(3):382?387. [2] 潘立強,高慧君,洪高,等.一種基于空間相關的無線傳感器網絡絡自適應缺失數據估計算法[J].國際無線信息網絡雜志,2014,21(4):280?289. [3] 姚萌.網絡流量組合預測模型的研究[D].無錫:江南大學,2008. [4] LEI Jianjun, XIA Ying, ZHAO Kuo. Energy efficient data collection protocol for wireless sensor net?works [J]. Journal of Chongqing University of Posts and Telecommunications (Natural science edition), 2014, 26(5): 582?586. [5] TIAN Haimei, HUANG Nan. Network traffic prediction based on ACO?LSSVM [J]. Computer engineering and applications, 2014, 50(1): 91?95. [6] 顏若愚,鄭慶華,牛國林.自適應濾波實時網絡流量異常檢測方法[J].西安交通大學學報,2009,43(12):1?5. [7] 鄭若金,韓力群,陳天華.基于小波分析和神經網絡的心音信號研究[J].計算機仿真,2010,27(5):170?173. [8] 周強,彭輝.基于自回歸滑動平均的網絡數據流量預測模型[J].計算機科學,2014,41(4):75?79. [9] 段文軒,蔣文賢.無線傳感器網絡中一種ARMA流量預測的擁塞控制算法[J].小型微型計算機系統,2012,33(5):1098?1103. [10] 劉亮,江漢紅,王潔,等.基于小波分析的ARMA?SVR網絡流量預測方法[J].計算機工程與設計,2015,36(8):2021?2025. [11] 朱苗苗.基于結構方程模型改進ARMA模型參數估計[[J].軟件導刊,2016,15(9):6?9. [12] 陳文清.一種基于多標簽學習的網絡流量預測算法[J].科學通報,2016,32(4):147?151. [13] LIU Yang, ZHANG Linfeng, GUAN Yong. A distributed data streaming algorithm for network?wide traffic anomaly detection [J]. ACM SIGMETRICS performance evaluation review, 2009, 37(2): 81. [14] 季琳琳,廖軍,宗先鵬.異方差線性測量誤差模型的平均估計[J].系統科學與數學,2018,38(6):688?701. [15] FENG Feifei, PENG Fenghua, YAN Bo, et al. QoS?based LTE downlink scheduling algorithm for smart grid communication [C]// IEEE 9th International Conference on Communication Software and Networks. Guangzhou, China: IEEE, 2017: 548?552. [16] 溫祥西,孟相如,馬志強,等.小時間尺度網絡流量混沌性分析及趨勢預測[J].電子學報,2012,40(8):1609?1616. [17] 邱婧,夏靖波,吳吉祥.網絡流量預測模型研究進展[J].計算機工程與設計,2012,33(3):865?869.