潘志安,王茂發,陳亞睿
(1. 防災科技學院信息工程學院,河北 三河 065201;2. 桂林電子科技大學計算機與信息安全學院,廣西 桂林 541004)
互聯網的普及,使網絡負載及網絡傳輸效率以及系統容量都面臨巨大考驗。為盡快解決當下面臨的問題,提出一種將LTE網絡與IEEE 802.11網絡相結合的方案,該方案雖然可以解決適當增加系統容量,在一定程度上減輕網絡負載,但仍存在各類流量控制的難題,這也使得大數據流量的實時控制成為當下研究的熱點。
谷保平等人[1]利用SDN控制器實現信息收集,通過構建分類功能,找到一個調度值輸入到TX節點中,以此減少對于lcore的占用,實現流量控制的目的,該方法吞吐量大,但丟失率較高。閆偉等人[2]將網絡傳輸數據分類,提取對時延敏感的數據輸入至最小時延的網絡中,將其余數據依據時延敏感程度分別放入對應時延大小的網絡中,以此達到控制流量的目的,該方法數據傳輸速率較高,但時延較大。王新語等人[3]利用模擬節點的方式構建流量控制復雜模型,并結合迭代算法獲取數據取值集合,結合Agent技術建立控制系統,通過劃分對應區域的方式達到流量管理的目的,該方法具有較高的適應性,但流量輸送總量較少。
為了解決上述問題,提出基于SDN技術的混合云大數據流量實時控制方法。將大數據流量中的噪聲去除,采用SDN網絡實現對數據流量的控制,同時學習并優化流量控制器,達到流量實時控制的目的。
為了對大數據流量精準控制,利用變形檢測數據噪聲分離法對其含有的噪聲分離去除,其過程如下:
將包含噪聲的流量數據y(u)采用改進的完備集合經驗模態分解(ICEEMD)的方式分解[4],通過計算獲取y(u)與各個IMF分量間的相關系數。當處于L1-1階的系數出現局部極小值時,則將位于L1-1階的IMF分量判定為噪聲分量。
對未實施判定的L1-1階分量重構處理,并以此作為虛擬噪聲,假設n為觀測信號,其得到的函數如下所示:

(1)
當重構得到的虛擬噪聲越接近于真實噪聲,則可以分離獲取出的原信號就越準確。但只經過一次分解的分量不可能將原信號完整有效的完全分離出,需要利用ICEEMD方法對分解過后的noise信號二次分解,并剔除其中所含的有效信息,在此基礎上構建二次分解后的噪聲分量,得到更為準確的噪聲信號,其以noise2代表。
將得到的噪聲分量與序列y(u)組合,得到多維觀測通道,并以此作為輸入數據輸入至ICA中,在此基礎上結合FastI-CA算法去噪分離,以此得到含有有效信號的獨立數據分量y′(u)。
據研究表明,ICA中存在三大不確定性的問題,為了解決其三大問題所帶來的影響,需要利用MDP準則與相關系數結合的方法處理其得出的獨立分量[5],其過程如下:
通過計算得到y(u)與y′(u)間的相關系數如下所示:

(2)
通常情況下,0≤σy′y≤1。y(u)與y′(u)的相似度與σy′y值的大小成正比,可以此作為判別ICA分離出的y′(u)是否需要重新排序的依據,從而得到確定的排序,解決其不確定性的問題。
經過上述操作后,并不能完全消除分量與原信號間的不確定性,即相位不確定性,也就是說二者之間可能處于同向或反向位置。當兩者處于反向位置(-1≤σy′y≤0)時,其得到的波形互為鏡像。由此可以得到σy′y不僅可以解決排序不確定性的問題,同時還可以確定相位。綜上所述,反向時y′(u)可直接取負值。

將得到的X2與ICA的輸入觀測信號相乘,獲取幅值確定的y′(u)。在消除流量數據噪音時,不需要對其相位處理,根據上述步驟可以確定y′(u)的準確值。由此可以對噪聲精確提取并消除。
在得到去噪后的流量數據結果后,將得到的精確數據流量輸入至SDN網絡實現對于數據流量的控制。在操作過程中,為滿足不同用戶對于網絡的需求,還需要使SDN的相應時間應盡量縮短[7]。想要縮小控制時延,可以將控制器均勻分布,為此需要得到控制器分布的最遠距離,以求得最優的控制時延。
假設控制器分布的最遠距離為E,E的值越大,表示局部節點與控制器距離較遠,控制器分布集中;反之則分布均勻。由此可以得到E的數學模型如下:

(3)
其中,T表示交換機集合,D為控制器集合,ej,k表示任意兩節點間的最短路徑。將時延用U表示,用Uj,k代表交換機tk與dj之間實行信息交換所需時間,qj表示控制器dj的處理能力,其表達式如下所示:

(4)


(5)
其中,O代表節點總數。Uj值與控制器的控制效果越好。以負載均衡作為前提條件[9],將控制時延U表示為各個dj控制時延之和,若用rj表示dj的負載,則可以得到如下表達式:

(6)
其中,N代表網絡中所有控制節點總數。由上述計算可以得出,控制時延與負載大小成正比。在處理器不同的情況下,當各處理器擁有相同的處理能力,負載的大小決定處理器的時延大小,即負載越大,時延越長,因此在網絡中出現過載現象時,網絡的控制時延將無限增長。綜上所述,負載加權方法不僅降低網絡時延,更平衡了網絡控制器的負載。
在部署控制器實行網絡規劃時,還需要考慮的一個重要因素是控制鏈路的可靠性[10]。將控制鏈路的失效概率記作sf,其與鏈路長度成正比,即鏈路越長,sf越大。由此可以得到sf的數學模型如下所示:
sf=(1-βv)ef
(7)
其中,βv代表單位長度的失效概率,ef表示鏈路長度。由于各鏈路間存在差別,因此不同鏈路所擁有的失效概率βv也不同。位于軌道間的鏈路由于在極點附近時會被衛星關閉,頻繁的開關使得其比軌道內的鏈路的βv要高。
將節點失效概率記作so,其代表的是位于網絡中的節點無法正常工作的概率。將控制節點的失效概率記作ψ。在部署控制器時,需將其放置在so較小處,以此保證網絡可靠性。由此得到ψ的數學模型為:

(8)

假定控制鏈路的可靠系數用S表示,其是由sf與so共同決定的,由此可以得到tk與dj之間的Sj,k的數學模型如下所示:

(9)
其中,Fj,k表示兩節點間最短路徑經過的直連鏈路集合,Wj,k為兩節點間最短路徑經過的節點集合。dj所對應的可靠系數Sj為其所處區域各個可靠系數的平均值。在考慮負載均衡的情況下[11],各個控制域內可靠系數按負載加權的和可以得到整個網絡的可靠系數S,由此可以得到Sj與S的數學模型分別為:
(10)

在明確了最優的控制器部署位置后,便可以對流量控制器部署。在已知的網絡環境H(W,F)中,W代表其中所有節點集合,假設集合中含有o個節點,那么可以得到|W|=o,假定用F∈W×W表示鏈路集合,用邊權重表示網絡時延。想要準確的對流量控制,需要擁有較小的平均時延以及布置較少的控制器數量(用l表示)。網絡中各控制器的平均時延Mb的數學模型如下所示[13]:

(11)
其中,w表示節點,t為控制器,且w,t∈W,則e(w,t)表示w到t的最短路徑。在實現控制器部署之前,需要獲取其部署集合T′,且|T′|=l,其中Mb的大小與l的大小成正比。
將所有節點編號處理,用{D}代表t的集合,且|D|=D。用{T}表示交換機集合,且|T|=o。若控制器與交換機位置重疊,則?j∈{T},?k∈{D},當yjk取值為1時,則表示在k交換機處部署控制器,當yjk取值為0時,則不部署。
利用BPSO算法將各粒子的局部以及全局最優限制為0或1[14],其它不作限制,可以得到粒子Yj=[yj1,yj2,…,yjk,…,yj,o],以此作為部署控制器的一種方案,其中的j表示粒子編號,k代表交換機編號。若在一個交換機位置只能部署一個控制器,并且一個控制器至少要控制一個交換機,那么可以得到的優化目標的數學模型為:

(12)
其中,g1(Yj)和g2(Yj)分別代表控制器總數與各節點到控制器的平均時延。

(13)
式中:rmax表示各交換機到控制器的平均跳數,通常情況下為大概數值,mr代表r跳的物理鏈路[15],ib則表示各節點的平均跳數。由此可以引申出控制器部署的約束條件為:

(14)
假定網絡環境中一個控制器對應一個交換機,且二者間流量流通時延為0,則當?j,k,k=j時,ek,j=e(k,j)=0,由此可以得到:

(15)
反之當網絡中只有一個控制器時,交換機與控制器間的流量流通時延最大,則可以得到:

(16)

根據上述約束條件實現流量控制器的部署,得到最優的流量控制效果,以此實現對網絡云大數據流量實時控制的目的。
為驗證基于SDN技術的混合云大數據流量實時控制方法的整體有效性,需對其測試。選取15臺PC機作為實驗對象,利用所提方法、交換網絡流量控制方法(參考文獻[1]方法)、數據分類和最小時延流量控制方法(參考文獻[2]方法)和復雜網絡的流量控制方法(參考文獻[3]方法)對其流量實時控制的穩定性展開對比實驗,得到的結果如圖1所示。

圖1 各方法流量控制穩定性對比
從上圖可以看出,隨著時間的推移,使用交換網絡流量控制方法、數據分類和最小時延流量控制方法和復雜網絡的流量控制方法控制的網絡流量數據流速均有較大波動,而使用所提方法控制的網絡流量數據流速波動幅度平緩。這是因為所提方法學習并優化了流量控制器布置所需條件,降低控制器時延。因此在實際應用過程中可以有效降低網絡數據流量流速的波動,更好的實現實時控制網絡流量的目的。
采用不同方法對流量控制過程中單位時間內的網絡數據吞吐量對比,每個方法各取1流、3流和5流對比,得到的結果如下所示。

表1 各方法網絡數據吞吐量對比(B/s)
由上表可以看出,在同一流為前提的條件下,所提方法在單位時間內的數據吞吐量均大于其它三種方法在單位時間內的數據吞吐量,因此在實際應用過程中,利用所提方法對網絡云數據流量控制所輸送的數據總量更多,更能滿足大眾需求。
利用不同方法對流量控制過程中數據丟失率展開對比實驗,實驗結果如圖2所示。

圖2 各方法數據丟失率對比
由上圖可以看出,在時間條件相同的情況下,所提方法的數據丟失率低于0.02%,比其它三種方法數據丟失率低且變動較為穩定,因此所提方法可以更好的適用于實際情況下的流量實時控制服務。
為解決網絡大數據吞吐量較低、丟失率較高且對于流量實時控制的穩定性較差的問題,提出基于SDN技術的混合云大數據流量實時控制方法,該方法對現有數據網去噪處理,明確并優化控制器的部署條件,部署控制器以達到控制流量的目的,該方法很好的避免了目前方法存在的問題,能更好的滿足大眾的需求,為互聯網的普及提供保障。