黃麗亞,劉臣,王鎖萍
(南京郵電大學 電子科學與工程學院,江蘇 南京 210003)
頻譜在無線通信中是稀缺的資源。傳統的頻譜分配方式靜態地分配頻譜,頻譜利用率很低,很多時候,頻譜并沒有被完全利用[1],而近年來對無線服務的需求不斷增大,因此頻譜資源日益緊張。認知無線電頻譜共享技術可以有效地解決頻譜資源緊張問題。在認知無線電頻譜共享網絡中,主用戶擁有頻譜授權,而次用戶沒有。具有頻譜認知能力的次用戶可以利用主用戶尚未使用的頻譜,主用戶通過向次用戶出讓暫時不用的頻譜,能夠獲得額外收益[2]。
現有的頻譜共享方法大致分為兩類:一類是針對單個用戶進行研究,不考慮用戶之間的關系;另一類則對多個用戶的合作或競爭關系進行研究[3]。由于實際網絡中大多存在多個用戶,因此后一類的研究更有實際意義。在多用戶競爭的頻譜共享方法中,基于博弈論的頻譜共享方法是研究的熱點。比如Zhao等人提出部分可觀察馬爾可夫決策模型[4],Huang等人提出能夠限制參與者行為的拍賣競爭模型[5],Niyato等人提出基于 Cournot博弈的頻譜共享模型[6]等。
本文對基于Cournot博弈的頻譜共享模型進行了改進。探討改進模型建立的前提,首先從主用戶獲得最大收益的角度分析主用戶制定最佳單位帶寬定價的方法,接著在給定主用戶頻譜帶寬定價的情況下,分析次用戶請求帶寬大小、次用戶相互間的競爭和頻譜效率等因素對次用戶的收益的影響,分析次用戶在靜態博弈、動態博弈和相互合作時,選擇最佳請求帶寬以獲得最大收益的方法,最后給出改進模型的性能仿真結果。
基于Cournot博弈的頻譜共享模型適用于含有單個主用戶和多個次用戶、頻譜資源有限的認知無線電網絡中,博弈存在于各個次用戶之間,博弈的結果是使每個次用戶的收益達到最大。模型給出的主用戶單位帶寬定價缺乏依據,僅考慮次用戶的收益,并且每個次用戶的收益僅受到其向主用戶請求頻譜帶寬和頻譜效率的影響。
本文對該模型進行改進,將研究的含有多個主用戶和多個次用戶的認知無線電網絡進行簡化。首先分析次用戶請求的頻譜帶寬對主用戶收益的影響,主用戶為獲得最大收益該如何選擇最佳單位帶寬定價,主用戶根據預測的次用戶可能的請求帶寬得出最佳單位帶寬定價具有可取性;接著在主用戶給定單位帶寬定價的前提下,分析次用戶收益除受到請求帶寬大小和頻譜效率的影響外,受到來自其他次用戶請求的頻譜帶寬的影響,分析表明,次用戶相互合作比相互競爭能夠使各方得到更大收益,說明考慮次用戶的收益受到次用戶間相互競爭的因素影響是有必要的;最后分析次用戶在靜態博弈、動態博弈和相互合作時選擇最佳請求帶寬以獲得最大收益的方法,分析表明,次用戶在靜態博弈、處于穩定區間的動態博弈或相互合作時,都能使各自的請求帶寬達到納什均衡點,從而使收益達到最大。
認知無線電網絡中大多存在多個主用戶和多個次用戶,主用戶擁有頻譜的使用權,次用戶需要從某一主用戶租借頻譜帶寬。文獻[7]指出,多個主用戶整合各自的頻譜資源,作為一個整體向次級用戶提供帶寬時,主用戶會獲得更多的收益,次用戶得到的服務質量將會提高,頻譜接入費用也會減少。因此,這里將所有主用戶視為一個合作的整體,稱之為主系統,這樣認知無線電網絡就簡化為由一個主系統和多個次用戶組成的系統。
主系統的單位帶寬定價受所有次用戶請求的總帶寬影響,主系統需要根據預測的次用戶請求的總帶寬來制定單位帶寬定價,以獲得最大收益。
所有次用戶的總收益與所獲得的總帶寬呈非線性關系。雖然次用戶得到帶寬越多,傳輸數據得到的收益越多,但是主系統會相應提高單位帶寬定價,使得次用戶的頻譜接入費用提高。次用戶的收益一般是關于其獲得的帶寬的凸函數[8],這里假設次用戶的總收益函數為

其中,p為主系統的單位帶寬定價,b為所有次用戶請求的總帶寬,c為大于0的常數,τ為取值區間為(0,1)的常數,bmax為所有次用戶需要的最大帶寬。次用戶的收益不會小于0,因此Us(b)總是不小于0。

主系統向次用戶租讓帶寬獲得收益的同時,得到的服務質量會下降。設服務質量損失為每單位帶寬w,次用戶請求帶寬B,則主系統的收益函數為

對上式進行一階求導得:


主系統確定單位帶寬定價后,向次用戶提供的總帶寬將保持不變。在這種情況下,每個次用戶請求帶寬的大小要受到其他次用戶請求帶寬大小的影響,這里用參數ν表示影響的程度[9]。ν取值范圍為[0,1],當ν=0時,次用戶不會受其他次用戶請求帶寬的影響,ν=1時,次用戶受其他次用戶請求帶寬的影響達到最大。
作為數據發送方的次用戶i從主系統獲得帶寬bi后,調整數據傳輸速率,如果收益為每單位傳輸速率γi,則次用戶i的頻譜傳輸效率為

其中,K為由接收方誤碼率門限決定的常數[10]。
如果主系統采用最佳單位帶寬定價P,次用戶得到的帶寬間的保護帶寬忽略不計,則次用戶i的收益函數為

具體納什均衡算法見文獻[6],這里給出結論。從式(7)得到次用戶i的最佳請求帶寬為

其中,b由下式求得:

動態博弈開始時,次用戶嘗試請求比較少的帶寬,然后慢慢增加請求帶寬,同時,主系統不斷調整單位帶寬定價,最終,次用戶和主系統的收益都達到博弈時的最大點。
設bi[ t]為次用戶i在時刻t請求的帶寬,Ui[t]為次用戶i在時刻t獲得的收益,以下分2種情況討論。
完全信息動態博弈時,次用戶i根據在上一個時刻t其他次用戶請求的帶寬大小,計算得出時刻t的最佳請求帶寬,把它作為在 t+1時刻的請求帶寬,即:

不完全信息動態博弈時,次用戶i在時刻t試探性地對請求帶寬進行略微變化,得到收益與請求帶寬的變化關系,在t+1時刻的請求帶寬為

其中,參數iα反映次用戶i對觀察到的收益與請求帶寬的變化關系的信任程度[6]。
下面分析不完全信息動態博弈時,次用戶請求的帶寬能夠收斂到穩定狀態的穩定區間。由式(11)得:

將式(12)、式(13)代入雅各布矩陣,得:

令矩陣J的所有特征值的絕對值小于1,得到iα(i=1,2,…,N)的相互關系,即為不完全信息動態博弈的穩定區間[9]。
納什均衡中,次用戶是相互競爭的關系。當次用戶相互合作,以總收益最大為目的時,所得到的結果為帕累托最優。分析帕累托最優的算法見文獻[9],這里給出結論。從式(7)得到帕累托最優時次用戶i的請求帶寬為

其中,b由下式求得:

從式(8)和式(15)可以看出,次用戶在帕累托最優時的請求帶寬比納什均衡時的請求帶寬更大。次用戶互相合作可以獲得更大收益。
本節在 MATLAB環境下,對改進的認知無線電頻譜共享模型的靜態博弈、動態博弈及其穩定性和帕累托最優進行分析。參數設置:認知無線電系統中有一個主系統和2個次用戶,主系統與次用戶共享的帶寬為20MHz,主系統服務質量損失為每單位帶寬 1MHz,2個次用戶的誤碼率門限值為8MHz,每單位傳輸速率所獲得的收益為10dB,參數τ設為0.5,參數ν設為0.4。
圖1是在不同信道質量條件下,2個次用戶最佳請求帶寬的關系。從圖中可以看出,納什均衡點的位置受信道質量和參數ν的影響:信道質量提高時,次用戶會請求更多的帶寬;參數ν增加時,次用戶間的影響變大,次用戶的最佳請求帶寬減少。次用戶數量大于2時,以上結論依然成立。當系統存在3個次用戶時,每個次用戶的最佳請求帶寬函數可以表示為一個平面,3個平面的交點即為納什均衡點。

圖1 最佳請求帶寬和納什均衡點
主系統對參數τ的選取直接影響單位帶寬定價和次用戶請求的總帶寬。圖2反映不同信道質量條件下,參數τ對主系統收益的影響。從圖中可以看出,存在參數τ,使主系統按此制定單位帶寬定價時,能獲得最大收益。信道質量提高時,次用戶會請求更多的帶寬,從而主系統可以獲得更多的收益。

圖2 參數τ不同時主系統的收益
設動態博弈初始時刻次用戶的請求帶寬為1MHz,單位傳輸收益iγ分別為11dB、10dB,次用戶請求的帶寬隨時間的變化如圖3所示。從圖中可以看出,次用戶1和次用戶2穩定時刻的請求帶寬大約分別為4MHz和3MHz。完全信息動態博弈時,次用戶請求的帶寬可以很快達到穩定狀態;不完全信息動態博弈時,次用戶請求帶寬的收斂速度依賴于參數iα:iα越大,收斂到穩定狀態需要的時間越多,iα超過穩定區間范圍時,請求帶寬將無法收斂。由于次用戶1的單位傳輸速率收益大,因此次用戶1請求的帶寬更大。

圖3 動態平衡收斂到納什均衡
圖4是不同信道質量條件下,不完全信息動態博弈的穩定區間。如果1α和2α取值位于穩定區間內,則次用戶在不完全信息動態博弈時,請求的頻譜帶寬最終能夠收斂到穩定狀態,否則次用戶的請求帶寬將一直處于波動狀態,無法收斂。信道質量提高,會使穩定區間變小。

圖4 不完全信息動態博弈的穩定區間

圖5 納什均衡和帕累托最優時的最佳請求帶寬
圖5反映在納什均衡和帕累托最優時,次用戶1的最佳請求帶寬與參數ν的關系。從圖中可以看出,帕累托最優時,由于次用戶進行合作,相互間幾乎沒有影響,次用戶的請求帶寬隨參數ν的變化很小;而納什均衡時,次用戶請求的帶寬隨著參數ν的增大迅速減小;在整個ν區間上,次用戶在帕累托最優時請求的帶寬比納什均衡時請求的帶寬更大,因此次用戶相互合作比相互競爭時能夠獲得更多的收益。
本文對基于Cournot博弈的頻譜共享模型做了改進。改進模型將認知無線電網絡中的多個主用戶視為一個主系統,綜合考慮主系統與次用戶間的博弈關系和次用戶之間博弈關系,分析主系統該如何選擇頻譜帶寬定價才能獲得最大收益,次用戶該如何選擇請求頻譜帶寬才能獲得最大收益。對該博弈模型的靜態博弈、動態博弈及其穩定性和帕累托最優等特性的仿真結果說明改進的博弈模型是合理的。改進的模型適用于頻譜資源有限的認知無線電環境中,前提假設是所有主用戶相互合作。下一步研究工作將致力于將模型擴展到各個主用戶相互競爭,頻譜資源豐富的認知無線電網絡環境中。
[1] AKYILDIZ I,LI W Y,VURAN M,et al.Next generation/dynamic spectrum access/cognitive radio wireless networks: a survey[J].Computer Networks Journal,2006,9(2): 2127-2159.
[2] BRUCE F.Cognitive Radio Technology [M].New York: Academic Press,2007.
[3] 李琳,曾志民,馮春燕等.認知無線電網絡中的非合作頻譜分配算法研究[EB/OL].http://www.paper.edu.cn/downloadpaper.php? serial_number=20081-36,2008-12-1.LI L,ZENG Z M,FENG C Y,et al.Research on non-cooperation spectrum allocation algorithm in cognitive radio network[EB/OL].http://www.paper.edu.cn/downloadpaper.php?serial_number=20081-3 6,2008-12-1.
[4] ZHAO Q,TONG L,SWAMI A,et al.Decentralized cognitive MAC for opportunistic spectrum access in ad-hoc networks: a POMDP framework [J].IEEE Journal on Selected Areas in Communications,2007,25(3):589-600.
[5] HUANG J,BERRY R,HONIG M.Auction-based spectrum sharing[J].Mobil Networks and Applications,2006,11(3): 405-408.
[6] NIYATO D,HOSSAIN E.Competitive spectrum sharing in cognitive radio networks: a dynamic game approach[J].IEEE Transaction on Wireless Communications,2008,7(7): 2651-2660.
[7] ALIREZA A,SASWATI S,CHANDRAMANI S,et al.A coalitional game framework for cooperative secondary spectrum access[A].2008 46th Annual Allerton Conference on Communication,Control,and Computing [C].Urbana-Champaign,IL,USA,2008.1154-1160.
[8] 李廣久.博弈論基礎教程[M].北京: 化學工業出版社,2005.LI G J.The Basic Course of Game Theory[M].Beijing: Chemical Industry Press,2005.
[9] NIYATO D,HOSSAIN E.Competitive pricing for spectrum sharing in cognitive radio networks: dynamic game,inefficiency of nash equilibrium and collision[J].IEEE Journal on Selected Areas in Communications,2008,26(1): 192-202.
[10] GOLDSMITH A J,CHUA S G.Variable rate variable power MQAM for trading channels[J].IEEE Journal on Selected Areas in Communications,1997,45(10): 1218-1230.