李 棟,蔡 昱
(1.集美大學計算機工程學院,福建 廈門 361000;2.廈門城市職業(yè)學院,福建 廈門 361000)
在萬物互聯(lián)盛行的時代,大數(shù)據(jù)技術推廣實施步伐的不斷加快促進了承載網(wǎng)絡的變革[1-2]。傳統(tǒng)的基于IP網(wǎng)絡架構不再滿足大數(shù)據(jù)對全網(wǎng)帶寬調度能力的要求,取而代之的是一種基于分布式的數(shù)據(jù)中心網(wǎng)絡。該網(wǎng)絡由于具備良好的擴展性,使其被部署在生產(chǎn)實踐的多個領域中,用于實施復雜業(yè)務的承載。然而實踐表明,該網(wǎng)絡在實施復雜數(shù)據(jù)業(yè)務過程中呈現(xiàn)出顯著的突發(fā)特性,并可能因此導致網(wǎng)絡局部重載風險的出現(xiàn)[3]。為此,一種可用于高效化解重載風險的軟件定義網(wǎng)絡架構受到業(yè)界廣泛關注,通過在該架構上部署ECMP算法來實施不均衡環(huán)境下復雜數(shù)據(jù)中心網(wǎng)絡應對重載數(shù)據(jù)流量業(yè)務時的風險調度。然而該算法在面對重載風險時表現(xiàn)出來的流量調度思想總因未能顧及全局實時狀態(tài)而收效甚微。特別在突發(fā)重載數(shù)據(jù)流占主導地位的網(wǎng)絡環(huán)境中,該算法實施風險轉移的效率不盡如人意。基于此,本文結合復雜數(shù)據(jù)中心網(wǎng)絡突發(fā)重載數(shù)據(jù)流占主導地位的特征,探討了一種在軟件定義網(wǎng)絡架構下的風險控制機制,以化解突發(fā)網(wǎng)絡環(huán)境中重載數(shù)據(jù)流量潛在的風險。

通過測試擬定啟動風險控制機制的門限值Pt。當實時平衡度超過該值,控制域中的控制單元將啟動風險控制機制,為重載風險規(guī)劃一條可用的局向,以化解突發(fā)模式下重載流量引發(fā)的業(yè)務失效風險[4]。


根據(jù)上述分析,風險控制思想包含3個作業(yè):(1)分析全局的均衡度;(2)鎖定突發(fā)環(huán)境中具有潛在重載風險的數(shù)據(jù)流對象;(3)計算出合適的局向分解該數(shù)據(jù)流對象以化解風險。
實施風險控制的步驟為:首先,初始化全網(wǎng),并由控制域中的控制單元通過轉發(fā)域來收集與全網(wǎng)載荷相關的多項實時參量。其次,由控制單元為全網(wǎng)局向計算出權值[7],并定位出可用于化解風險的最佳局向選項。然后,計算出全網(wǎng)平衡度B,通過分析其和門限值Pt間的大小關系確定啟動風險控制機制的必要性。最后,結合全網(wǎng)當前載荷狀態(tài)計算出適合用于實施風險轉移的重載數(shù)據(jù)流對象,并在實施風險轉移化解后更新局向權值。
將本研究的風險控制方案運行在Mininet 2.2.1平臺。該平臺上所構建的模擬數(shù)據(jù)中心網(wǎng)絡規(guī)模,由匯聚層中的8個交換器和核心層中的4個控制器組成的一個胖樹結構。為了模擬數(shù)據(jù)中心網(wǎng)絡載荷突發(fā)特性,數(shù)據(jù)流由灌包軟件隨機發(fā)起,每分鐘內(nèi)發(fā)起的數(shù)據(jù)流服從[100 Mb/s,900 Mb/s]分布,并設置103Mb/s的路由帶寬。每3秒監(jiān)視一次全局參量。

根據(jù)風險控制思想,風險控制機制門限值Pt的選取關系到整個復雜數(shù)據(jù)中心網(wǎng)絡的安全性。若選取過小將使全網(wǎng)依然處于業(yè)務失效的風險境況;反之將導致控制域反復對數(shù)據(jù)流對象實施局向調度的情形出現(xiàn)。故開展風險控制算法前需統(tǒng)籌規(guī)劃一個較為合理的門限值Pt。統(tǒng)計不同程度控制門限下的承載度,收集到如圖1所示的數(shù)據(jù)流業(yè)務載荷規(guī)模。不難看出,本次風控門限取值0.6為宜。
對突發(fā)重載業(yè)務高效實施風險控制的重要指標之一便是在部署風控算法后全網(wǎng)局向實施突發(fā)業(yè)務承載所耗費的時間長度均值[9]。若算得節(jié)點對之間承載一次突發(fā)業(yè)務所需時長較小,說明算法具有可行性。圖2所示記錄了傳統(tǒng)算法和本文風控機制在時長指標考察中的走勢。在承載突發(fā)業(yè)務之初,兩種算法在充沛的局向資源上均良好地實施作業(yè),實施業(yè)務承載時長均在0.1 s內(nèi),算法優(yōu)勢不明顯。隨著突發(fā)業(yè)務規(guī)模向重載情形轉變,此時控制域通過本文設計的風險控制機制計算出局向參考閾,選出最優(yōu)的分解局向分配給重載對象。此舉有效地保證了新局向潛在的二次風險,故實施突發(fā)業(yè)務的時長相對傳統(tǒng)算法總體較短。尤其在700 Mb·s-1的業(yè)務規(guī)模之后,風險控制機制下業(yè)務作業(yè)時長表現(xiàn)出了顯著的相對優(yōu)勢。傳統(tǒng)算法由于在計算新局向前未能對新局向開展二次風險測評,導致新局向存在潛在的業(yè)務失效風險,加上重載情形下緊張的帶寬資源,勢必使業(yè)務承載時長總體較大。

圖1 不同風控門限下的載荷規(guī)模

圖2 不同風險調度機制下的突發(fā)業(yè)務實施時長
圖3所示曲線統(tǒng)計了兩種算法下全網(wǎng)局向帶寬在實施突發(fā)業(yè)務承載時的資源平均占用程度。從兩條曲線走勢圖可知,兩種算法在輕載情形下全網(wǎng)局向資源占用程度相差無幾,本文設計的風險控制機制僅保持相對微弱優(yōu)勢。隨著隨機突發(fā)數(shù)據(jù)流規(guī)模擴大至600 Mb·s-1,兩種算法的考察指標開始出現(xiàn)明顯的差異。這是由于傳統(tǒng)算法的風險調度[10]目的僅在于將當前任意重載業(yè)務分解至其他局向,卻未對所選重載業(yè)務對象實施重載等級測評。該算法思想下的風險調度因具有較高的偶然性而不能真正有效地對風險展開控制,甚至導致對任意重載業(yè)務對象開展風險轉移后,全網(wǎng)局向依舊存在較高的業(yè)務失效率。相比之下,本文的風險控制算法在遭遇突發(fā)重載風險情形時能夠有序地計算出風險最高的重載業(yè)務對象,并對其實施風險調度,可有效地進行風險控制。

圖3 不同風險調度機制下的全網(wǎng)承載均度
本文討論的突發(fā)網(wǎng)絡環(huán)境下風險控制算法,通過利用控制域監(jiān)視全網(wǎng)的優(yōu)勢,來實施數(shù)據(jù)中心網(wǎng)絡在遭遇突發(fā)重載業(yè)務時所面臨的業(yè)務失效風險的化解策略。將所研究的化解策略移植到測試平臺Mininet中,與傳統(tǒng)的風險調度算法展開性能對比,能夠驗證本文所提算法的可行性和高效性。