何 燁,劉建明,李 龍,謝維佳
(1.桂林電子科技大學 計算機科學與工程學院,廣西 桂林541004;2.桂林電子科技大學 機電工程學院,廣西 桂林541004;3.桂林電子科技大學 電子工程與自動化學院,廣西 桂林541004)
當前,高空平臺主要是關于單平臺下的飛艇通信信道建模、通信干擾、天線、傳輸和編碼技術的研究[1-4]。然而關于多平臺下的飛艇部署方面的研究很少[5,6],文獻 [7]提出一種基于k均值聚類的方法,但文章中并沒有關于衛星對其網絡的影響;文獻 [8]提出一種基于遺傳算法的飛艇優化模型,但它的解決方案具有較高的時間復雜度。
本文從提高覆蓋率、縮短通信時延兩個方面著手,開發出一種自適應的飛艇部署策略。同時,為解決飛艇覆蓋下存在的空洞問題,本文在現有通信條件的基礎上,采用由地面層、HAP 層和衛星層共同構成的3 層異構網絡架構[9,10],并基于此網絡環境,進一步將飛艇與用戶間的通信方式分為3種:直接與用戶通信、通過中繼飛艇與用戶進行通信、通過衛星與用戶通信[11]。在實際應用中,為達到最大化飛艇覆蓋范圍同時最小化傳輸時延的部署目標,飛艇部署應以自組織的方式實現相互間的協同工作,為網絡使用者提供最佳無線服務。因此,本文將飛艇部署問題模型化為游戲算法,并使用帶有權重選擇的時延作為移動因子,完成受限空間自適應 (RSAP)學習,該算法能夠保證飛艇根據用戶分布和通信要求以高概率收斂到最佳位置。仿真結果表明,該方案是可行有效的。
本文中異構網絡由陸地層、HAP層和衛星層組成。如圖1所示,該網絡環境使地面用戶與飛艇間的通信更加暢通。

圖1 異構網絡系統
(1)任務層:任務層中包含需要進行通信的用戶,使用U ={u1,…,ui,…,uI}進行表示。Su={s,…,,…,}表示用戶在任務層分布情況,其中表示用戶ui的地理位置。
(2)HAP層:HAP層高度為h,由為用戶提供服務的高空飛艇組成,使用H ={h1,…,hk,…hK}進行表示,其分布情況表示為Sh=,…,…},其中代表飛艇hk的空中位置。
Qk代表飛艇組中飛艇hk的通信范圍,即

式中:Rhh——飛艇間的最大通信距離,shk-shj——飛艇hk和飛艇hj之間的歐幾里得距離。
Ωi代表用戶與飛艇hk間通信范圍,即

(3)衛星層:假定在衛星層只有一個衛星,其通信范圍可覆蓋所有用戶和飛艇。
(4)異構網絡:為簡化建模,本文假設在該異構網絡環境中只存在一跳中繼行為。即對于不能直接被飛艇覆蓋的用戶的情況,可借助于衛星或其它飛艇的中繼將用戶和飛艇相連接,從而使地面所有用戶都能夠被飛艇有效訪問。
用戶間的通信具有3種不同的方式:通過單個飛艇進行通信、通過相鄰的兩個飛艇進行通信、通過飛艇以及中繼衛星進行通信。如圖1所示,若用戶1想要與用戶2進行通信,必須經過飛艇1及作為中繼飛艇的飛艇3;而用戶3只能借助于衛星完成與用戶1間的通信。
Mi代表直接被飛艇hk覆蓋的用戶,即

Vi代表被其它飛艇覆蓋的用戶,即

Si代表既不在飛艇的直接覆蓋范圍也不再其間接覆蓋范圍下,只在衛星覆蓋下的地面用戶,即

通過式 (3)~式 (5)得出

即,Mi、Vi和Si是地面用戶的通信劃分方式。
在衛星-HAP-陸地異構網絡中,飛艇作為中繼為地面用戶提供無線通信服務。本文通過研究其部署結構對通信性能的影響,設計合理的部署模型,以實現通信中高覆蓋率和低時延的綜合優化。
在異構網絡環境下,建立時間模型[12,13],以便提取時延參數。該模型中將飛艇通信時延簡化為飛艇和用戶間距離的函數。
飛艇hk直接與地面用戶通信的時延定義如下

式中:Ak、α——飛艇時延參數;
飛艇hk通過中繼飛艇與地面用戶通信的時延定義如下

式中:Bk、β——飛艇hk的時延參數;
衛星作為中繼連接地面用戶時飛艇hk與地面用戶通信的時延定義如下

由式 (8)~式 (10)可以得到飛艇hk覆蓋地面用戶的總體時延Tk,即

為提高飛艇覆蓋率,減少時延,均衡飛艇間負載,在3種延遲前設置相應權重[14],進一步得出飛艇hk的總時延

由以上分析得出所有飛艇的總時延Φ,如下

飛艇網絡目標是用最少時間完成地面用戶通信需求。給出一組用戶U 及其對應位置Sh,解決下面的優化問題

在限制條件下,Sh代表飛艇hk可達空間位置,其中是離散并且有限的。
飛艇網絡時延由飛艇與用戶距離和HAP傳輸能量共同決定,假設HAP發射功率不變,總時延由飛艇位置Sh={,…,…}和用戶位置Su=,…,…,}決定。
為完成多飛艇的位置優化,將該問題模型化為游戲算法,并將每輪游戲中飛艇的位置選擇歸結為納什均衡問題。
每個飛艇作為個體,不與其它飛艇合作,將該通信場景建模為非合作博弈,其中飛艇是不合作玩家,它們可移動的所有位置構成動作操作集。地面用戶的分布范圍是飛艇進行部署時需要覆蓋的區域。游戲執行過程中,任一次t>0,每個飛艇玩家hk∈H 按照預先規定的學習規則 (非合作博弈)以及與第 (t-1)次的交互,選擇此時的動作(t-1)) Sh。飛艇玩家通過提高對地面用戶的覆蓋率和縮短其通信時延而獲益。
使用uuk代表飛艇玩家hk的利益,是一組動作的獲益之和。一個游戲的納什均衡是當所有玩家不再獲益,則達到均衡。即對任意hk∈H

定義每個高空平臺飛艇玩家hk的收益滿足以下關系式

在介紹完飛艇部署要達到的目的和所要解決的問題后,本節將對飛艇高覆蓋部署中使用的學習算法進行闡述。
若用戶位置已知,飛艇可通過搜索或者遺傳算法等找到自身最佳位置。然而,用戶分布通常未知,甚至隨著飛艇部署過程改變,導致集中式算法在實際應用中效果較差;啟發式算法 (如貪婪算法)雖可應用于游戲,但該類方法只收斂到局部最優。本文采用限制性空間自適應 (RSAP)學習算法,該算法不存在中央控制器,允許飛艇以自組織方式工作,使游戲趨于納什均衡,實現飛艇的最佳部署。
RSAP學習算法:
納什均衡游戲規則在所有玩家眼中是次優選擇。因此,為確保最優解最大化,學習算法以重復博弈的形式工作,以確定各玩家最優位置。
在博弈中,通常允許玩家執行動作操作集中的任一動作。然而飛艇部署過程中,飛艇每次只移動到以當前位置為圓心、半徑固定的圓上某一位置,因此玩家只能根據其現有狀態采取受限制的動作。
基于該受限制的博弈部署活動,引進限制空間自適應學習算法[15],允許每個玩家以現有狀態從一組有限操作集選擇一個動作,保證博弈函數通過迭代收斂于純納什均衡。

表1 RSAP學習算法
該算法可歸納為一個獨特穩態分布的馬爾可夫過程[13]。其中

式中:珒sh——動作配置文件,珝Sh——動作配置文件空間。隨著β趨于無窮大,并且操作次數t足夠多,玩家就能夠選擇動作配置文件中使其勢函數最大化的動作,最終達到使游戲結果收斂于最佳分布。
在飛艇部署游戲中,所有玩家都可以只根據局部用戶分布而非全局用戶分布評估其收益,且所有學習過程由玩家自己完成不需要任何監督。當t和β 足夠大時,通過該學習算法就可得到飛艇最優部署。
仿真環境設置成500km×500km 區域。該片區域中存在400個用戶。為模擬城市人口分布,將該區域中的用戶分布于兩個地域中心,且均服從高斯分布。假設高空飛艇所在高度為20km,衛星所在位置為 (250km,250km,36000km),同時使用通信距離代替時延。
圖2為飛艇分布圖,共有5 個飛艇分布在該片區域,其通信半徑設為100km,移動半徑為50km。圖2 (a)中權重系數取值分別為α =0.93,β =0.01,γ =0.06,圖2(b)中 權 重 系 數 取 值 分 別 為α =0.796,β =0.005,γ =0.199。由該圖可知,對于不同的權重設置,飛艇部署位置不同,進而導致飛艇間的連通率及覆蓋取向的改變。

圖2 飛艇分布
圖3所示為權重系α=0.93,β=0.01,γ=0.06和α=0.796,β=0.005,γ=0.199下5個飛艇移動前后時延對比圖,由該圖可知,飛艇移動后的通信時延顯著減小。

圖3 時延對比
本文主要討論在異構網絡環境下的飛艇部署問題。將帶有權重系數的通信時延作為移動因子,建立限制性游戲算法模型使目標函數趨于納什均衡以達到最優覆蓋。仿真結果顯示,①基于不同的權重系數,飛艇部署策略不同。權重系數改變,飛艇連通率改變,與飛艇直接連接用戶改變。高空平臺下飛艇部署策略可以根據任務性質,設置合理權重系數。②在優化部署后,時延明顯減少。
[1]WANG Yanguang,YAO Wei,LI Yong.Research of stratospheric airships and its application prospects[J].Satellite and Network,2010 (4):18-21 (in Chinese). [王彥廣,姚偉,李勇.平流層飛艇技術發展及其應用前景展望 [J].衛星與網絡,2010 (4):18-21.]
[2]Widiawan AK,Tafazolli R.High altitude platform station(HAPS):A review of new infrastructure development for future wireless communications[J].Wireless Personal Communications,2007,42 (3):387-404.
[3]Mohammed A,Yang Z.Broadband communication and appli-cations from high altitude platform [J].International Journal of Recent Trends in Engineering,2009,1 (3):239-243.
[4]Alejandro AZ,Jose LC,Joss AD.High-altitude platforms for wireless communications[M].United Kingdom:Wiley Press,2008.
[5]Mohammed A,Hult T.Capacity evaluation of a high altitude platform diversity system equipped with compact MIMO antennas[J].International Journal of Recent Trends in Engineering,2009,1 (3):244-247.
[6]Michailidis ET,Kanatas AG.Three-dimensional HAP-MIMO channels:Modeling and analysis of space-time correlation [J].IEEE Transactions on Vehicular Technology,2010,59 (5):2232-2242.
[7]Song HY.A method of mobile base station placement for high altitude platform based network with geographical clustering of mobile ground nodes [J].Journal of Telecommunications and Information Technology,2009 (2):22-33.
[8]Wang X,Gao X,Zong Ru.An optimal model and solution of deployment of airships for high altitude platforms [C]//Proceedings of the International Wireless Communications and Signal Processing,2010.
[9]Nia MM,Rahman TA.Spectrum correlated criteria and their impacts on high altitude platform station (HAPS)and fixed satellite service (FSS)coexistence in frequency range 5,850-7,075 MHz[J].Wireless Personal Communications,2013,69(1):357-372.
[10]Jeon S,Ji C.Randomized and distributed self-configuration of wireless networks:Two-layer Markov random fields and near-optimality[J].IEEE Transactions on Signal Processing,2010,58(9):4859-4864.
[11]Wang X,Gao X,Zong R.Energy-efficient deployment of airships for high altitude platforms:A deterministic annealing approach [C]//Global Telecommunications Conference,2011:1-6.
[12]Sun B,Wang W,Qi Q.Satellites scheduling algorithm based on dynamic constraint satisfaction problem [C]//International Conference on Computer Science and Software Engineering,2008:167-170.
[13]ZHU Zhiliang,YE Ning,LIU Jun,et al.Deployment optimization algorithm for regional MANET containing near space vehicles as a part[J].Journal of Electronics &Information Technology,2011,33 (4):915-921(in Chinese).[朱志良,葉寧,劉軍,等.基于臨近空間飛行器的區域自組網優化部署算法 [J].電子與信息學報,2011,33 (4):915-921.]
[14]ZHOU Ling,YANG Wenyin.QoS supported geography position routing algorithm based on Baidu system [J].Computer Engineering,2012,38 (11):73-76 (in Chinese). [周靈,楊文茵.基于北斗系統的QoS保障地理位置路由算法 [J].計算機工程,2012,38 (11):73-76.]
[15]Marden JR,Arslan G,Shamma JS.Cooperative control and potential games[J].IEEE Transactions on Systems,Man,and Cybernetics.Part B,Cybernetics,2009,39 (6):1393-1407.