陳媛媛, 王晶晶
(海南工商職業學院,海口 570203)
感知無線電作為未來無線通信的發展方向之一,能充分利用現有頻譜資源實現頻譜共享,提高頻譜利用率,可以實現外部環境認知,信道狀態及容量預測,功率控制和動態頻譜接入等。它能夠使非授權用戶與授權用戶共享頻譜, 且保證不會干擾授權用戶的正常通信。每個感知用戶(非授權用戶)的發射功率是造成其他用戶干擾的主要原因, 因此功率控制是感知無線電系統的關鍵技術之一。
David Goodman等人[2]提出一種非合作博弈功率控制( non-cooperative power control game )的模型,并證明其存在納什均衡。但均衡解并不一定最優,進而研究了基于代價函數和非線性代價函數的博弈功率控制算法[3]。博弈論[4]是一種用于分析決策過程中參與者交互作用的數學工具,并為參與者制定利益最大化決策。早期主要應用在經濟學領域當中,近年來在各個學科中都有廣泛的使用。
本文將非合作博弈的思想應用于感知無線電系統的功率控制中,在考慮主用戶和感知用戶的通信要求前提下,主要研究感知無線電環境下感知用戶功率控制問題,以實現系統資源分配最優,借鑒文獻[2-3,5-6]的研究,提出一種改進的基于非線性代價函數的算法,并對算法進行了仿真分析,實現了對不同用戶發射功率的有效控制,以達到最佳頻譜利用率。
本文擬設計在一個單基站的小區內,有若干個感知用戶共享一段頻譜。這里不考慮感知用戶對主用戶的干擾,因為感知無線電最重要的前提是要保證主用戶的通信質量,假設主用戶一旦需要重新占用自己的授權頻段,感知用戶就必須退出網絡把頻段還給主用戶,因此感知用戶就不會對主用戶造成干擾。所以本文認為只考慮感知用戶之間的功率控制問題是今后研究的主方向。各感知用戶的接入選擇為CDMA制式,因為目前主要的接入方式有3種:CDMA、FDMA和TDMA。而在后2種接入方式中,TDMA方式是在不同的時隙進行信號的傳輸,每個時隙內都只有一個用戶在進行信息傳輸,即各用戶之間的干擾是不存在的,更談不上功率控制問題,而FDMA方式的相鄰信道干擾又比較小,考慮功率控制并無太大實際意義,故選用CDMA系統接入方式。
David Goodman提出了一種無線數據網絡中的非合作功率控制博弈算法。其效用函數如式(1)。

效用函數即為消耗每單位焦耳的能量所能接收到的信息比特數。式(1)中: M為每個數據幀中傳輸的總比特數;L為每個數據幀中的信息比特數;R為信息傳輸速率; pi為第i個用戶的發射功率;γi為第i個用戶的SIR;而第i個用戶的SIR又可定義為式(2):

假設CDMA系統中采用Non-FSK調制方式,那么效率函數f(γi)即接收機接收到的有用信息的效率可表示為式(3),式(4)中 Pe為誤碼率 (BER)。


在非合作功率控制博弈模型中,每個用戶都試圖最大化自己的效用函數,可以表示為式(5),通常pi是用戶i的策略空間集合,p-i表示除了用戶i以外的所有其他用戶功率的策略空間集合。用戶的收益最大化,不僅由用戶自身的發射功率水平所決定,同時也受到其他用戶發射功率的影響,因此所有用戶最大化各自收益的過程就是由一個非合作的博弈過程。研究表明[2],此算法在博弈過程中納什均衡存在的條件下,最終收斂于納什均衡點。
采用NPG方法所獲得的均衡解并不是最優的,因為非合作關系導致每個用戶都致力于通過調整發送功率以實現自身效用的最大化,卻忽視了對系統中其他用戶產生的干擾。于是Goodman等人又提出了一種基于代價函數的NPGP (Noncooperative Power control Game with Pricing)算法。用戶的效用函數可以表示為:

其中,隨線性增長的代價函數ci( pi, p-i) =cpi,c為常數,稱為代價因子。即效用函數可表示為:

那么NPGP的博弈過程就可以表示為:

仿真表明,在引入代價函數以后各用戶穩定工作在相對更低的發送功率下,具有更好的使用性能。
在NPGP模型中, 代價函數只考慮到感知用戶的發射功率。而在感知用戶的接收方,信號質量的好壞還與噪聲、干擾、路徑增益等參數相關。因而線性的發射功率代價函數并不能充分公平地懲罰各感知用戶[7-8]。從式(8)的結構可以看到,代價函數的選用是線性的,而本文則考慮設計一個既能適當體現公平性, 又相對簡單便于數學分析的非線性代價函數(Non-cooperative Power control Game with Non-liner Pricing)算法。用戶在NPGP-NL算法下的效用函數表示為:

從式(9)中可以看出,用戶i的效用函數會隨著自身的發射功率pi的增大而減小,這樣就避免了單個用戶為了提高自身的效用而不斷增大自己的發射功率的目的,從而更好地利用了頻譜資源。研究證明NPGP-NL算法滿足超模博弈中的條件,存在納什均衡點。具體算法步驟如下:
2)令 L=L+1,根據已知條件 pi(L-1),i∈N,計算在給定其他用戶發射功率條件下,所有用戶i∈N使自己效用函數達到最大值時所對應的最優發射功率,表達式為:

3)最后,令pi(L)=min(ri(L)),即為用戶i的最優發射功率。
系統環境為單基站的CDMA小區網絡,假設小區內有6個感知用戶,利用如下的參數進行仿真,結果如圖1、圖2所示。實驗系統參數:每幀總比特數M=40,每幀信息數據比特數L=32,系統擴頻增益G=100,R=10 Kb/s,調制方式為Non-FSK,噪聲功率σ2=5×10-14W,用戶的最大發射功率為2 W,用戶i的鏈路增益hi=9.7×10-3/d-4,仿真工具采用MATLAB。

圖1 各算法的發射功率比較

圖2 各算法的效用比較
從圖1、圖2中可以看出,新的NPGP-NL算法在整體的用戶效用和發射功率控制方面都比NPG和NPGP算法有一定的提高,既降低了感知用戶的發射功率,又相應提高了效用函數的性能,最終實現系統各用戶效益最大化的要求,進而實現系統資源的最優分配。
圖3比較了3種博弈的信干噪比(SINR)。NPG各用戶信干噪比基本相同,保證了接收端的絕對公正。NPGP由于其代價函數的統一性,對距離相對較遠,發射功率較大的用戶懲罰過大,以至其信干噪比呈明顯下降趨勢。而NPGP-NL通過合理的選擇懲罰因子和其他參數以及納什均衡點的唯一性,對各個距離上的感知用戶相對公平,使其性能相近,實現最優功率分配。

圖3 各算法信干噪比的比較
本文主要討論感知無線電系統中基于非合作博弈理論的分布式功率控制算法,在Goodman等人提出的NPG和NPGP模型的基礎上,綜合考慮主要用戶對次要用戶的干擾和次要用戶之間的干擾,提出了一種改進的非線性代價函數的算法。通過仿真分析可以看出本文提出的NPGP-NL算法在提高感知用戶效用的基礎上,還一定程度上兼顧了系統的公平性,提升了感知用戶的性能,實現了對不同用戶發射功率的有效控制,使系統性能明顯提高,達到了預期設計目標。
[1]FCC Spectrum Policy Task Force, Report of the spectrum efficiency working group [EB /OL][2009.09.11].http: // www.fcc.gov /s ptf/reports.html
[2]GOODMAN D, MANDAYAM N.Power Control for w ireless data [J].IEEE Personal CommunMag,2000,7: 48-54.
[3]SARAYDAR C, MANDAYAM N, GOODMAN D.Efficient power control via pricing in w ireless data networks[J].IEEE Trans Commun,2002,50 (2):291-303.
[4]DAMME,ER IC V.Game Theory:The Next Stage[M].Tilburg:Tilburg University,995.
[5]SETOODEN P, HAYK IN S.Robust transmit power control for cognitive radio[J].Proceedings of the IEEE,2009,97(5):915-939.
[6]ZHOU Pan,YUAN Wei.Joint power and rate control in cognitive radio networks: A game theoretical app roach[C].IEEE International Conference on Communications,Piscataway:IEEE,2008:3296-3301.
[7]M ITOLA J.Cognitive radio:An integrated agent architecture for software defined radio [D].The Dissertation for Doctor of Technology,Royal Institute of Technology (KTH),2000.
[8]HAYKIN S.Cognitive radio: Brain-empowered wireless communications[J].IEEE Journal on Selected Areas in Communications,2005,23(2):201-220.