葉成蔭, 井元偉
(1.東北大學信息科學與工程學院,遼寧沈陽 110819;2.遼寧石油化工大學計算機與通信工程學院,遼寧撫順 113001)
隨著傳輸控制協議(transmission control protocol,TCP)應用的快速增長,網絡擁塞越來越頻繁。主動隊列管理(active queue management,AQM))成為擁塞控制的研究熱點。文獻[1]對TCP網絡的非線性動態模型進行了線性化處理后得到了一個線性定常TCP網絡模型,并分析了隨機早期丟棄(random early discard,RED)算法不穩定的原因。然而依據該模型設計的AQM控制器[2]在魯棒性方面遇到了一些困難,因為TCP網絡的高度變化使得網絡參數很難長時間保持在常值。對于時變TCP網絡而言,由于滑??刂葡到y中的滑動模態與系統的攝動和外界干擾無關[3],因此滑??刂圃赥CP網絡擁塞避免方面取得了較好的效果[4]。但以上文獻只適用于線性系統模型。文獻[5]基于非線性TCP網絡動態模型[6]設計了一種滑??刂破鳎鰪娏讼到y的魯棒性,但是這類控制器要求TCP負載和往返時延的界必須事先獲得。然而在實際應用中,由于TCP負載和往返時延具有較大突發性和時變性,它們的界很難確定,從而造成控制器在實際中很難實現。文獻[7]利用擁塞窗口和往返時延信息設計了一種非線性主動隊列管理控制器,但是由于擁塞窗口信息在路由器端很難獲得,使得控制器在實際應用中很難實現。
徑向基函數(radial basis function,RBF)神經網絡具有良好的非線性逼近能力[8],若將滑??刂婆cRBF神經網絡相結合設計控制器,則能進一步提高控制效果。近年來,在電力系統和電機磁鏈等領域取得了一些較好的成果[9-10],但在TCP網絡的擁塞控制方面則鮮有報道。
本文首先將TCP網絡的非線性動態模型轉換成仿射非線性形式。然后基于滑模變結構的控制理論設計了一個滑??刂破鳌H欢捎赥CP負載和往返時延具有較大突發性和時變性,使得網絡系統參數是未知時變的,從而導致滑??刂破髟趯嶋H應用中很難實現。為此,本文使用RBF神經網絡逼近網絡系統參數,依據李雅普諾夫理論設計了RBF神經網絡權值的自適應律,采用RBF神經網絡的輸出作為滑??刂破鞯膮?,從而使得滑??刂破饕子趯崿F。
文獻[6]采用基于速率的流體流分析方法,給出了TCP網絡非線性動態模型為

式中:r(t)為TCP連接的源端發送速率;q(t)為瞬時隊列長度;N(t)為TCP網絡的負載;R(t)為往返時延;Tp為傳播時延;C0為鏈路帶寬;0≤p(t)≤1為分組丟棄/標記概率,可以看作用于調節發送速率和鏈路隊列長度的控制輸入。
令eq=q(t)-qd,qd為期望的隊列長度。記x1=eq,x2=,則有

于是非線性模型(1)可表示為


滑模變結構控制器的設計由兩部分組成。首先,設計具有良好的動態特性的滑動模面為

接著,設計使滑動模態存在的滑??刂破鱱(t),為

其中:ueq為滑模等效控制;us(t)為切換控制,用于實現對網絡系統的攝動和外加干擾的魯棒控制;ρ>0是切換增益。
定理1 系統(4)在控制律(6)、(7)和(8)的作用下能在有限時間內到達滑動模面,并保證滑動模面是漸近穩定的,即使滑動模態存在條件<0成立。
證明:選取Lyapunov函數如下

于是,對V關于時間t求導,得到

將式(6)、式(7)和式(8)代入,得到

當t→∞時,s(t)→0,滑動模面s(t)=0總能在有限時間內到達,而且是漸近穩定的。
在實際應用中,由于TCP負載N(t)和往返時延R(t)具有較大突發性和時變性,所以f(t)和g(x,t)是未知時變的,控制器很難實現??刹捎肦BF網絡的輸出(t)和(x,t)代替f(t)和g(x,t),實現自適應神經滑??刂啤?/p>
RBF神經網絡具有如下形式,即

式中:y(x,ω)是神經 RBF 網絡的輸出;x=[x1,x2]是輸入狀態向量;ω∈Rn是RBF神經網絡的權向量;向量φ(x)∈Rn是高斯型函數,其形式為

式中:ci∈R2n是第i個神經元的中心位置;σi∈R是第i個神經元的寬度。
采用RBF網絡建立(t)和(x,t)的模型,網絡結構如圖1所示。

圖1 RBF網絡結構Fig.1 RBF network structure
為了進一步分析,引進如下假設:
假設1 對于任意給定的逼近精度ε,存在權向量w和v,使得和分別逼近于f和g,即存在權向量w和v,使得

成立。
令wt和vt分別表示權向量w和v在t時刻的估計值,控制律(7)和(8)改寫為

式中:


由中值定理可以得到
則RBF網絡的權值采取自適應機制在線調整為

令Θ=[wv]T,則 RBF網絡的權值誤差為(t)=Θt-Θ,逼近誤差為η(t)=Ο(‖(t)‖2)+Ο(ε)。
定理2 如果假設1成立,且滿足ρ(t)>‖η(t)‖,則系統(4)在控制律(6)、(13)和(14)以及自適應律(19)的作用下能在有限時間內到達滑動模面,并保證滑動模面是漸近穩定的。
證明:考慮如下李雅普諾夫函數:


將控制律(6)、(13)和(14)代入得到

由假設1以及式(17)、式(18)和式(19)得到

當選擇滑模切換增益ρ(t)>‖η(t)‖時,

當t→∞時,s(t)→0,滑動模面s(t)=0總能在有限時間內到達,而且是漸近穩定的。
參照文獻[1],網絡參數的選擇為,N=100,C0=1 250 分組/s,R=0.2 s,qd=100 分組?;C婵刂茀礳=10,切換增益ρ=10。神經元的中心ci在0和1之間隨機取值,神經元的寬度σi都取1。為了便于性能分析,本文對文獻[2]提出的比例積分(proportional-integral,PI)控制器和文獻[5]提出的滑??刂?sliding mode control,SMC)與本文的神經滑模控制器(neural sliding mode control,NSMC)進行了仿真,仿真結果如圖2~圖5所示。
從圖2可以看出,當網絡參數確定時,PI控制器、SMC控制器和NSMC控制器都能使瞬時隊列長度穩定在期望值附近。但是PI控制器產生的波動較大,收斂時間也比較長;NSMC控制器和SMC控制器都具有較好的收斂性能,能較快地收斂到期望值附近。

圖2 網絡參數確定時隊列長度比較Fig.2 Comparison of queue lengths with fixed network parameters
從圖3可以看出,當網絡負載N從100變化到200,其它網絡參數不變時,PI控制器顯示出較大的穩態誤差和較慢的暫態響應;SMC與NSMC相比,在穩態過程中隊列長度變化有較大幅度振蕩。
當往返時延R從0.2 s變化到0.3 s,其它網絡參數不變時的仿真結果如圖4所示。PI控制器經過較大地振蕩之后能夠收斂于期望值,而且在穩態過程中,隊列長度變化比較劇烈;NSMC同SMC相比,能使隊列長度很快收斂于期望值,并且穩態時的隊列長度變化較小而且平緩。

圖3 較大TCP負載時隊列長度比較Fig.3 Comparison under higher TCP loads

圖4 較大往返時延時隊列長度比較Fig.4 Comparison with larger round-trip time
當往返時延R從0.2 s變化到0.3 s,網絡負載N從100變化到200時,仿真結果如圖5所示。PI控制器的收斂速度較慢,隊列長度波動較大;SMC控制器在開始時隊列長度變化比較劇烈,而NSMC控制器的隊列長度變化比較平緩。

圖5 網絡參數變化時隊列長度比較Fig.5 Comparison of queue lengths with variable network parameters
針對TCP網絡的擁塞控制問題,將滑??刂婆cRBF神經網絡相結合設計了一種主動隊列管理算法。該算法具有以下特點:
1)由于TCP負載和往返時延具有較大的突發性和時變性,使得網絡系統參數是未知時變的。為此,使用RBF神經網絡逼近網絡系統參數,從而使得控制器易于實現。
2)基于李雅普諾夫穩定性理論設計了RBF神經網絡權值的自適應律,使得網絡系統參數得到了較好的估計,并且保證了網絡系統的穩定性。
3)采用RBF神經網絡的輸出作為滑??刂破鞯膮翟O計了一種主動隊列管理算法,使得系統狀態能在有限時間內到達滑動模面,并保證滑動模面是漸近穩定的,而且瞬時隊列長度具有較好的暫態和穩態性能。
本文設計控制器時,未考慮到無響應流對系統造成的影響,這將是下一步的研究工作。
[1]HOLLOT C,MISRA V,GONG W B.A control theoretic analysis of RED[C]//Proceedings of IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1510-1519.
[2]HOLLOT C,MISRA V,TOWSLEY D,et a1.On designing improved controllers for AQM routers supporting TCP flows[C]//Proceedings of the IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1726-1734.
[3]WANG S P,GAO W B.Robustness and invariance of variable structure systems with multiple inputs[C]//Proceedings of the A-merican Control Conference,June 21-23,1995,Seattle,USA.1995:1035-1039.
[4]REN F Y,LIN C,YING X H.Design a congestion controller based on sliding mode variable structure control[J].Computer Communications,2005,28(9):1050-1061.
[5]YAN P,GAO Y,?ZBAY H.A variable structure control approach to active queue management for TCP with ECN[J].IEEE Transactions on Control Systems Technology,2005,13(2):203-215.
[6]KELLY F P.Mathematical modeling of the Internet[C]//Mathematics Unlimited-2001 and Beyond,January 25,2001,Berlin,Germany.2001:685-702.
[7]陳瑋,王銀河,井元偉,等.TCP網絡主動隊列管理的非線性狀態反饋跟蹤控制[J].電機與控制學報,2009,13(5):762-765.
CHEN Wei,WANG Yinhe,JING Yuanwei,et al.Nonlinear state feedback tracking control algorithm for active queue management of TCP network[J].Electric Machines and Control,2009,13(5):762-765.
[8]PARK J,SANDBERG I W.Universal approximation using radial basis function networks[J].Neural Computation,1991,3(2):246-257.
[9]徐慶宏,戴先中.基于在線學習RBF神經網絡的汽門開度自適應補償控制方法[J].電機與控制學報,2010,14(2):13-19.
XU Qinghong,DAI Xianzhong.Online learning RBF neural network-based adaptive compensative control scheme for governor system[J].Electric Machines and Control,2010,14(2):13-19.
[10]劉國榮,張道祿.電機磁鏈神經網絡觀測器的研究[J].電機與控制學報,2011,15(8):81-87.
LIU Guorong,ZHANG Daolu.A study of motor flux neural network observer[J].Electric Machines and Control,2011,15(8):81-87.