周文炯,尚建忠,王文政,吳慶睿
(1.成都工業學院 網絡與通信工程學院,成都 611730;2.西安衛星測控中心,西安 710043;3.中國西南電子技術研究所,成都 610036)
高空氣球是一類特殊的無人機,與普通無人機依靠燃料進行飛行和懸停不同,其升力主要由氦氫等氣體提供,并可以通過繩索系留地面實現指定位置的長時間滯空,其能量消耗主要來自氣球上攜帶的各種載荷[1]。高空氣球ad hoc網絡中普遍存在著相互干擾嚴重、節點能量受限等問題。具體來講,某高空氣球載荷功率過大不但會對其他高空氣球的通信造成嚴重的干擾,還會影響自身作為網絡節點的存活時間;另一方面,發射功率過小則可能導致鏈路的通信質量達不到要求。
針對上述問題,文獻[2]在綜合考慮功率分配、信道分配和路由選擇等因素的基礎上,提出了一種跨層的優化模型以提高網絡的整體性能和生存時間;文獻[3]從提高頻譜利用效率的角度出發,討論了分布式ad hoc網絡中廣泛使用的基于RTS/CTS的接入協議的最佳發射功率;文獻[4]從優化ad hoc網絡中任務配置的角度出發,探討了如何降低整個網絡的功耗;文獻[5]從區分網絡節點重要度的角度出發,研究了分層、多簇網絡結構下的的分布式功率控制方法;文獻[6]通過編隊飛行技術,提升了ad hoc無人機網絡的通信效率和質量;文獻[7]利用ad hoc網絡中節點的位置信息輔助決策,構建了一種合作博弈模型,提升了網絡傳輸數據的能力;文獻[8]利用深度學習理論,通過優化無人機的飛行軌跡,提出了一種適合無人機網絡的功率分配算法,提升了整體網絡容量。
文獻[2-8]在分析分布式網絡中的功率分配問題時,均是圍繞節點通信速率優化、相互干擾的限制和節點電量受限這三個因素中的一個或兩個展開的,而沒有對三個因素進行通盤考慮。本文將綜合考慮這三個因素,建立非合作博弈的模型,把節點的通信速率作為效用函數的基本收益項,保證節點的通信需求;通過在效用函數中引入干擾懲罰項,提升網絡的整體信干噪比;利用將剩余電能引入效用函數,解決節點電量受限的問題。
如圖1所示,假設分布式高空氣球網絡中,所有高空氣球作為通信節點采用自組織方式組網,且不設置任何中心控制節點,系統中存在N條單跳通信鏈路,對應于N個發射節點Si和N個接收節點Ri,其中i∈{1,2,3,…,N}。

圖1 分布式高空氣球網絡示意圖
所有節點共用信道,則接收機Ri處的信干噪比γi可以表示為
(1)

由香農公式可知,第i條通信鏈路對應的信道容量可以表示為
Ci=Blb(1+γi)。
(2)
式中:B為信道帶寬。
如果把所有發射機作為博弈的參與者,而把發射功率的調整作為博弈的策略,可以構建如下博弈模型:
(3)

(4)
式中:p-i=[p1,p2,…,pi-1,pi+1,…,pN]表示除了發射機Si以外其他所有發射機的發射功率矢量。式(4)表示在這個博弈模型中,每個節點都設法使自己的系統效用函數最大化。
從式(2)可知,當接收機處的噪聲相對固定時,用戶可以通過增大發射功率以獲得更大的信噪比和傳輸速率。然而當發射機增加發射功率時,將會對其他用戶造成更大的干擾。可以預見,如果網絡中所有節點都期望通過增加發射功率來獲得更好的性能,那么網絡的整體性能反而將急劇惡化,為此需要在效用函數中增加關于干擾的懲罰項;同時伴隨著功耗的增加,電池可用時間減少,因而可以考慮增加關于電能消耗的懲罰項。綜上所述,整體的效用函數可以表示為
ui=Ci-Ii-Qi。
(5)
式中:Ci為發射機Si的收益項,即第i條通信鏈路對應的信道容量,可由式(2)獲得;Ii為關于干擾的懲罰項;Qi為關于電能消耗的懲罰項。
設計干擾懲罰項Ii滿足
(6)
式中:pi為發射機Si的發射功率,Gii、Gij分別為發射機Si到接收機Ri的信道增益和發射機Si到接收機Rj的信道增益,λ>0為干擾懲罰系數。在干擾懲罰項中,可以通過調節系數λ來調節網絡的整體干擾水平,進而調節網絡的通信質量。
對于電能消耗的懲罰,可以利用節點的剩余電能進行衡量。設計電能消耗懲罰項Qi滿足[9]
(7)

綜合式(1)~(7),可以得到完整的效用函數為
(8)
從式(8)可知,調節干擾懲罰系數λ的大小可以調節網絡的整體干擾水平,λ增大時,發射機將更傾向于減少發射功率以獲取更大的效用;反之當λ減小時,發射機則會傾向于增大發射功率。此外,當λ過大時,干擾懲罰將在本策略中起到絕對主導作用,用戶的電量損耗對于發射功率的影響將被忽視;而當λ過小時,發射功率則會主要由用戶的電池損耗決定,起不到控制整個網絡干擾水平的作用。因而為兼顧考慮上述兩方面因素,λ的選擇應保證式(8)中的后兩項為同一數量級,例如后文仿真中選取了兩者均值相等。
納什均衡是一種策略組合,使得每個網絡節點的策略是對其他網絡節點的最優反應。如果沒有節點能夠單方面偏離此狀態以增加自身收益的話,那么這個策略組合就叫做納什均衡[10]。在求解滿足納什均衡的發射功率前,需要證明模型中納什均衡的存在性和唯一性。

(2)效用函數ui對于pi連續,并在pi上擬凹。

如果干擾方程I(p)同時滿足以下三個條件則納什均衡具有唯一性:
(1)正性,即I(p)>0;
(2)單調性;
(3)擴展性,即?α>1,有αI(p)>I(αp)。

證明:
存在性:
(1)發射功率pi滿足pimin≤pi≤pimax,即策略空間Pi=[pimin,pimax]。顯然引理1的條件(1)是成立的。
(2)由于pi連續,效用函數ui顯然也連續的,只需證明ui是凹函數即可。
ui對pi的一階偏導數為


(9)
ui對pi的二階偏導數為
(10)
顯然引理1的條件(2)也是成立的,因而所提出模型具有納什均衡點。
唯一性:
發射機i的最佳響應功率滿足

(11)
求解可得
(12)
實際發射功率還要滿足pimin≤pi≤pimax,則
(13)
設p是博弈的納什均衡,根據式(13)可知其干擾方程I(p)=p,其中I(p)=(I1(p),I2(p),…,IN(p))。
(1)正性:由于發射機Si的功率范圍滿足關系式pimin≤pi≤pimax,保證了I(p)>0。
(2)單調性:對于任意i∈N,設p>p′,則
顯然I(p)是個單調減函數。
(3)擴展性:?α>1,
αIi(p)-Ii(αp)=
(14)
對于式(14),只需證明
(15)
由于實際的發射功率一定大于0,由式(12)可知,


得證。

Step1 設置初始時刻t=0時的系統發射功率矢量
p(0)=[p1(0),p2(0)…pN(0)],
并定義收斂精度ε>0;發射節點i(1≤i≤N)以功率pi(0)開始工作。
Step2 在時刻t=k,發射節點i,將p1=p1(k-1),p2=p2(k-1),…,pi-1=pi-1(k-1),pi+1=pi+1(k-1),…,pN=pN(k-1)代入式(13),計算并更新當前發射功率pi(k)。
Step3 如果|p(k)-p(k-1)|<ε,則納什均衡達成,否則返回Step 2繼續迭代更新。
從上述迭代過程可以看出,實際應用中上述算法可以分布式進行,即每個發射機分別利用式(13)獨立計算自身的發射功率,并在預設的公用控制信道上交互功率信息即可。而計算過程中,所需的各種狀態信息可以通過以下方式獲取:發射機Si到接收機Rj的信道增益Gij通過發射機Si偵聽接收機Rj的導頻信號獲取;其他所有發射機到接收機Ri的干擾水平∑j≠ipjGji則可以通過接收機Ri感知獲取;剩余電能百分比ηi是發射機Si的本地信息。因此本博弈算法可以分布式實現,具有可操作性。
如圖2所示,假定10架高空氣球構成的ad hoc網絡位于100 km×100 km的空域之中,每架飛艇的滯空高度相同,其中5架作為發射節點(Tx),另外5架作為接收節點(Rx),所有網絡節點共用信道。系統帶寬為1.024 MHz,接收機噪聲為10-7W,天線增益為30 dB。由于飛艇之間屬于視距傳播且多徑效應較小,不失一般性可假設信道增益為d-2,其中d為發射機到接收機之間的距離。每個發射機攜帶的起始電池容量為60 kWh,最大發射功率為1 kW,并假定整個過程中所有節點均一直在傳輸數據,直到電池剩余能量小于20%為止。

圖2 高空氣球位置分布圖
圖3給出了本算法中各節點發射功率的收斂情況。仿真中假定所有發射節點的起始功率為0,干擾懲罰系數λ=109,收斂精度ε=1 μW。仿真結果顯示,本算法的收斂速度很快,只需經過9次迭代系統即可達到均衡狀態,從而得到節點的最佳發射功率,證明了算法的高效性。

圖3 功率算法的收斂情況
圖4給出了ad hoc網絡中各發射機功率隨時間變化的趨勢,整個過程可以分成3個階段:
(1)所有發射機均在工作(階段1,0~90 h)
本階段初期,所有發射機的電池均處于滿電量的狀態,此時發射機將使用較大的發射功率以獲取更高的傳輸速率;但隨著時間的推移,發射機付出的能耗代價將隨著電池的損耗逐步增大,因而各發射機功率都逐步降低。從圖4可知,在t=0時,Tx5的發射功率達到了最大的848 W,而Tx4的發射功率只有410 W,這是因為Tx5距離其他四組通信的接收節點Rxi(i={1,2,3,4})的距離都較遠,對它們的干擾較小,所以可以用較大的功率進行傳輸;而Tx4距離Rx3的距離非常近,只能通過減少功率避免對Rx3造成嚴重干擾。此外,在階段1中,初始發射功率越大的節點其發射功率隨時間減小的趨勢也越明顯,這是由于發射功率越大的節點其電池損耗得也越快,受到的能耗懲罰也越大。

圖4 發射機的發射功率
(2)部分發射機退出工作(階段2,90~112 h)
本階段中,發射機將隨著自身電量的耗盡逐個停止工作,其中在t=90 h和t=96 h時,Tx5和Tx3將依次耗盡電能停止工作,而剩下的三個節點則幾乎同時在t=112 h時停止工作。從圖4可以看到,當Tx5停止工作時,Tx1、Tx2、Tx3和Tx4的發射功率同時增大;而當Tx3停止工作時,Tx1、Tx2和Tx4的發射功率也有明顯提升。這是因為每減少一個用戶時,繼續工作的發射機對其余工作中的接收機的總干擾將會減少,受到的干擾懲罰也會降低,促使了該發射機使用更大的功率工作。
(3)所有發射機電量耗盡(階段3,112 h之后)
本階段所有發射機已經耗盡能量,超過最大生存時間,ad hoc網絡失效。
圖5給出了ad hoc網絡中各發射機剩余電能隨時間變化的趨勢,各條曲線的斜率代表著各發射機電池損耗的速度。隨著時間的推移,各發射機剩余電能逐步減少,且大多數情況下隨著剩余電能的變小,電池損耗的速度也在放緩,只有在有發射機退出工作,剩余發射機增大功率的瞬間,電池損耗會突然加快。

圖5 發射機剩余電量百分比
圖6則給出了ad hoc網絡中5條鏈路的容量隨時間變化的趨勢。在所有發射機均處在工作狀態的0~90 h內,隨著時間的推移,鏈路3和5的容量會逐步減少;而鏈路1、2、4的容量卻逐步增大。對比圖4可以看出:Tx3和Tx5是發射功率減少最快的兩個發射機,發射功率的快速減小將使得這兩條信道上的信干噪比(Signal-to-Interference plus Noise Ratio,SINR)也減少,從而導致容量的變小;另一方面,在鏈路1、2、4中,Tx1、Tx2和Tx4的發射功率減小緩慢,但由Tx3和Tx5造成的干擾卻迅速減小,使得這三條鏈路上的SINR反而會隨著時間增大,從而導致了這三條鏈路的容量不降反增。而在部分發射機停止工作的90~112 h內,鏈路的容量變化則比較復雜,可以看出當有發射機退出網絡時,其余鏈路的容量可能突然增大(比如90 h時的Tx1和Tx2)或減少(比如96 h時的Tx2)。前者主要由于90 h時Tx5退出,使得Rx1和Rx2受到的干擾減少;而后者則是96 h時,雖然Tx3退出工作,但因為Tx4功率增加較大,使得Rx2受到的干擾反而增加。

圖6 各條鏈路容量
圖7給出了采用本文算法、采用RTS/CTS算法[3]和采用HATA算法[4]時,各發射機生存時間的比較。圖7顯示,所有發射機在采用本文算法時生存時間均為最長,各節點的平均生存時間分別為采用 RTS/CTS算法的2倍、采用HATA算法的1.6倍。

圖7 各發射機生存時長對比
圖8給出了各條鏈路以最大傳輸速度進行傳輸時,在整個鏈路存活期間可傳輸的數據量。圖8的結果表明,采用本算法時,每條鏈路的數據量均達到了RTS/CTS算法的3倍以上,5條鏈路的數據總量則達到了RTS/CTS算法的3.5倍;而同HATA算法的對比中,鏈路1、2、5的數據量達到了HATA算法的2倍以上,鏈路3的數據量高出HATA算法6.1%,只有鏈路4的數據量比HATA算法低3.4%,5條鏈路的總數據量則達到了HATA算法的1.81倍。

圖8 各鏈路的數據量對比
本文研究了高空氣球通信網絡中節點通信速率、節點間相互干擾和節點電量三者之間的關系,設計了基于博弈論的分布式ad hoc網絡功率分配算法,通過在效用函數中設置干擾懲罰項避免了節點間的惡性競爭,降低了網絡的整體干擾水平,提高了各通信鏈路的吞吐量;通過在效用函數中設置電能消耗的懲罰項延長了各節點的存活時間,增加了網絡的吞吐量。所提出博弈模型存在納什均衡,且均衡點唯一,算法具有快速的收斂性。仿真結果表明,所提出算法的節點生存時間和傳輸的數據總量比其他算法均具有較為明顯的優勢。