孫愛偉 , 張 杭 , 路 威 ,王 萌
(1.解放軍理工大學通信工程學院 研究生3隊,江蘇 南京 210007;2.解放軍理工大學通信工程學院 衛星通信系,江蘇 南京 210007;3.解放軍理工大學通信工程學院 訓練部,江蘇 南京 210007)
電磁頻譜反映了電磁輻射在各個頻段和波段上的分布狀況,作為一種傳遞信息的重要資源,在現代戰爭中往往成為戰爭雙方必爭的焦點之一,而且,隨著軍隊信息化建設的高速發展,它已經成為影響戰爭進程甚至決定戰爭勝負的重要砝碼。未來戰場具有裝備數量多、種類齊全、電臺密度大、程式復雜、電磁環境變化快等特點,如果不加強電磁頻譜管理,勢必會造成設備相互之間的干擾。電磁頻譜作為有限的國家資源和重要的戰略資源,除部分分配給軍隊專用外,大部分是軍民共用的,各國十分重視其利用效率,而據調查世界各國授權頻段的平均頻譜利用率不足5%[1]。
伯克利分校的一項實驗結果表明,在全球授權頻段,即使是信號傳播特性較好、需求非常緊張的300 MHz~3 GHz頻段內,頻譜利用率也不到6%;在3~4 GHz頻段,頻譜利用率降低為0.5%;在4 GHz以上,頻率利用率則更低。因此,如何對頻譜資源進行有效管理和利用,充分提高頻譜利用率成為亟待解決的問題。頻譜利用率低下的現狀對頻譜的軍民統籌管控技術提出了更高的要求,目前靜態的頻譜管理方式已無法滿足要求,在很大程度上限制了頻譜的高效利用,為解決這一問題,人們提出先進的調制技術、編碼技術以及多天線技術、鏈路自適應等新技術。這些技術從不同的角度提高了信道容量,取得了較好的效果。然而,由于受到香農極限的限制,人們不可能無限制地提高信道容量。針對以上狀況,認知無線電技術(CR,Cognitive Radio)應運而生,1999年瑞典皇家學院的Mitola博士提出了認知無線電(CR,Cognitive Radio)的概念旨在實現頻譜的靈活、高效管理,進而提高電磁頻譜的利用率[1-2],CR 技術通過 動態頻譜 共 享 (DSS,Dynamic Spectrum Sharing)來提高無線電頻譜的利用效率。CR系統是一種智能無線通信系統[1-2],它能感知周圍環境,運用“理解一構建”的方法來從周圍環境中獲取信息,并通過實時改變諸如傳輸功率、載頻、調制方式等傳輸參數來適應運行環境的變化,從而達到提高頻譜利用率、緩解頻譜資源緊張的目的[3]。
認知無線電技術能夠為無線電設備提供各種性能,如頻譜靈活性、自適應調制、功率控制等[4-5],其關鍵技術為動態頻譜管理,而作為頻譜管理重要組成部分之一的頻譜分配,在通信領域也得到了廣泛的研究,目前對于頻譜分配的研究主要采用模型化的方法,而常用的模型主要有基于圖論著色理論模型的方法[7-8]、基于干擾溫度模型的方法和基于定價拍賣理論模型的方法[9]。
以上模型為認知無線電中的頻譜分配提出了解決問題的框架。然而,基于圖論模型的頻譜分配完成時間與空閑信道數的多少以及網絡的動態特性有關,不適應認知無線電中空閑頻譜快速時變的要求,也不適應網絡動態變化環境下的頻譜分配研究;基于定價拍賣的模型適合于主次用戶間為租用關系的認知無線電系統,應用范圍具有局限性;基于干擾溫度的頻譜分配模型對于調制方式及干擾門限等要求固定,無法實現動態靈活的頻譜切換及頻譜選擇。一方面,為推動認知無線電頻譜分配技術的發展,提出新的頻譜分配模型已成為迫切需要;另一方面,在頻譜分配算法設計過程中,涉及了大量的策略選擇問題。因此,基于博弈論的頻譜分配模型成為當前認知無線電技術中的研究熱點之一。博弈論最大的特點是能夠為相應的博弈過程找到納什均衡點,而納什均衡點有時也正是策略最優點。這樣,博弈論就可指導和分析我們的算法設計,使我們對某些問題的研究找到最優策略。
認知無線電中有關策略選擇的關鍵問題研究的核心都是相關算法的設計和分析??梢岳貌┺恼搶@些自適應算法進行分析,在分析的過程中,主要需要確定以下4個方面的基本問題:
1)算法是否具有穩定狀態;
2)這些穩定狀態是什么:
3)這些穩定狀態是否是所需要的;
4)算法收斂到穩定狀態所需要的約束條件。
利用博弈論對認知無線電技術進行研究,其中的關鍵是如何將博弈論引入到相應算法的設計和分析中,找到算法的納什均衡點[6]。因此在利用博弈論分析認知無線電的頻譜分配問題之前,我們首先將所研究的問題抽象成博弈論問題模型,認知無線電中的頻譜分配問題是關系到不同用戶頻譜策略選擇的博弈過程,我們假設把頻譜的分配等同于信道的分配,即信道分配問題可以建模成一個博弈的輸出。在這個博弈過程中,參與者是認知無線電用戶,他們的行動策略是對傳輸信道的選擇,并且他們的效用和所選擇的信道質量相聯系。信道質量信息可由認知無線電用戶通過在不同的無線頻率上的測量來獲得。那么,頻譜分配問題的博弈論數學描述的一般形式如下:

這里N是參與者(選擇某個信道來傳輸的認知無線電用戶)的有限集,si是相對于博弈者i的策略集,定義S={s1,s2,s3,…,sn}是策略空間,則Ui:S→R是效用函數集。在博弈中的每一個博弈者i,效用函數Ui是博弈者i的策略si和當前其對手的策略集s-i的效用函數,這里si是博弈者選擇的策略,s-i是其對手的策略。
由于博弈者均獨立進行決策并且受到其他博弈者決策的影響,博弈結果分析的一個關鍵問題是判斷對于自適應信道選擇算法是否存在收斂點,且這個收斂點對于任何用戶都不會偏移,也就是納什均衡。
因此,對于博弈參與者的一組策略,當且僅當

時,這組策略即行動向量就是納什均衡。如果這個納什均衡點也是策略最優點,這樣的算法就是我們所需要的?;诓┺恼摰恼J知無線電頻譜分配模型將頻譜分配問題中的各用戶間競爭博弈過程用博弈論的方法進行了描述,使博弈論在認知無線電頻譜分配問題上的應用成為可能,但是在具體設計基于博弈論的算法時,發現就網絡結構而言,基于博弈論的算法比較適合于分布式網絡,網絡中各節點以協同合作的方式傳遞策略選擇信息,以便于在下一個算法周期中對自身策略進行修改,從而實現自適應的策略收斂。此外,基于博弈論的頻譜分配算法要求系統存在一個初始分配狀態,博弈論算法根據不同的優化目標實現頻譜的重新分配。
認知無線電中進行頻譜分配的目標根據實際要求的不同而有所區別。例如以最大化系統吞吐量為目標、以最大化信道利用率為目標、以最小化系統總干擾水平為目標等。在文中假設頻譜分配算法以最小化系統總干擾水平為目標,如果用信干比描述用戶所受到的干擾情況,在接收機,關于發射機j的信干比可以表示為:

這里pi是發射機i的發射功率,Gij是發射機i和接收機j之間的鏈路增益,f(k,j)是表示由節點k到節點j的干擾方程,定義如下:

因此,使得系統總干擾水平最小即是使各節點用戶所受干擾最小,而用戶之間在同一頻譜上的干擾是互相的,這正符合了博弈論研究問題的特征。在明確了算法設計目標后,如何選取適當的效用函數,從而運用基于博弈論的認知無線電頻譜分配模型設計正確的頻譜分配算法,是我們要致力解決的關鍵問題。
前文明確了基于博弈論的算法設計是以最小化系統總干擾水平為目標,那么如何將小區內各用戶的干擾情況用效用函數進行描述便是接下來要關注的問題。這些效用函數刻畫了用戶對于某個特定的信道的性能。效用函數的選擇不是唯一的,但必須選擇對于某個特定的應用具有實際意義的,并且還要具有某些數學性質,也就是說效用函數的選擇要保證頻譜分配算法能夠達到均衡收斂。通常僅考慮策略的參與者是自私用戶的情況,用戶基于在某個特定信道上感知到的其他用戶的干擾級別來評估信道 。
效用函數U具體表達如下[3]:

在上面的定義中,P={p1,p2,p3,…,pn}是 N 個無線電用戶的發射功率集合,S={s1,s2,s3,…,sn}是策略集合

效用函數U由兩部分組成,第一部分是認知用戶受到其它認知用戶在相應信道上的干擾Id,第二部分是該認知用戶對其它認知用戶在相應信道上產生的干擾Io。

則可以得出效用函數U的另一個表達方式:

其中Id的值在用戶接收端測量得到,而IO的值在用戶發射端計算得出。通常在采用U效用函數的情形下,因為算法需要在公共控制信道上有一個數據包來傳遞用戶對相鄰節點干擾的測量信息,所以算法復雜度會增加。但是,效用函數U的設計能夠反映最小化系統總干擾水平的總目標,只要每個用戶的效用函數值達到最大即可。而對效用函數的博弈論分析,則是頻譜分配問題模型的主要任務,論證效用函數納什均衡的存在,討論這樣的納什均衡是否滿足需要,確定收斂的條件等,這樣,就可以對相應的算法預測其收斂性,論證均衡狀態的最優性[10]。一旦算法的效用函數確定,就可以針對效用函數的數學形式設計相關的信令協議,并搭建仿真平臺進行仿真實驗,驗證仿真結果與算法的博弈論分析的一致性。
在本算法中假設一個場景,在50×50 m2的區域內隨機分配10個用戶,假定初始時刻用戶的發射功率在0~1 W之間,用戶的最大發射功率為1 W,各用戶隨機分布在這個認知無線電小區內,一個收發機在同一時刻只能占用一個信道。初始時刻,將各信道分配給各個用戶(算法中初始定義),開始時刻,通過執行一次算法確定取得競爭機會的用戶在各個信道上的效用函數,并計算初始時刻的SIR,通過柱狀圖形顯示,如圖1所示,一次算法結束,記錄一次結果,在初始值中設計算法共執行40次,記錄每次的信道占用情況通過圖形顯示。


圖1 算法執行前后的用戶的SIR值對比Fig.1 Change of the user’s SIR value when performing the algorithm

圖2 算法執行過程中總的網絡效用的變化情況Fig.2 Change of the net utility when performing the algorithm
則在整個小區中總的網絡效用可以用式(10)來衡量。從圖2仿真結果中算法執行前后各用戶的SIR值對比可以看出,算法執行后各用戶的SIR狀況得到了明顯的改善,整個系統的SIR水平得到了優化,仿真過程還測量了單個用戶的SIR值,目的在于通過對比,驗證以最小化系統干擾水平為目標的頻譜分配算法有助于系統整體性能的提高。從圖2的仿真結果可以看出隨著算法執行過程的進行,整個小區的總的網絡效用值在不斷的增加,而增加到一定的程度,隨后趨于穩定,此時各用戶在其特定的信道位置上不再變化,系統達到一種使信道資源最大化利用的狀態。
綜上所述,利用博弈論設計認知無線電頻譜分配算法,是一種行之有效的方法,理論上實現了靈活的頻譜資源配置和工作狀態調整。文中首先闡述如何利用博弈論對認知無線電進行分析,提出算法設計需要解決的4個方面的基本問題。在此基礎之上進一步提出了基于博弈論的認知無線電頻譜分配問題模型和算法設計的目標,并重點對模型中算法的收斂性及效用函數的選擇做了詳細的探討和仿真,為以后更多基于博弈論的認知無線電頻譜分配算法設計提供一定的參考。
[1]Mitola J,Maguire G,JR.Cognitiveradio:makingsoftwareradios more personal[J].IEEE Pers.Commun,1999,6(6):13-18.
[2]Mitola J.Cognitive radio for flexible mobile multimedia communications[C]//IEEE.(MoMuC'99),1999:3-10.
[3]Haykin S.Cognitive radio:brain-empowered wireless com-munications[J].IEEE J.Select Areas Commun.,2005,23(2):201-220.
[4]Buddhikot M M,Ryan K.Spectrum management in coordinated dynamic spectrum access based cellular networks[C]//Proc.IEEE DySPAN,2005:299-307.
[5]Neel J,Buehrer R M,Reed J,et al.Game theoretic analysis of a network of cognitive radios[C]//Midwest Symposium on Circuits and Systems,2002.
[6]Neel J.How Does Game Theory Apply to Radio Resource Management?[C]//In partial fulfillment of the requirements for qualification for acceptance to the Virginia Tech Doctoral Program,2002.
[7]WANGWei,LIUXin.List-Coloring based Channel Allocation for Open-Spectrum Wireless Networks[C]//In Proc.of IEEE VTC,2005:690-694.
[8]ZHENG Hai-tao,PENG Chun-yi.Collaboration and fairness in opportunistic spectrum access[C]//Proc.IEEE ICC 2005,2005:3132-3136.
[9]徐友云,高林.基于步進拍賣的認知無線電網絡動態頻譜分配[J].中國科學技術大學學報,2009,39(10):1604-1609.XU You-yun,GAO Lin.Dynamic spectrum allocation in cognitive radio networks based on multi-auctioneer progressive auction[J].Journal of University of Science and Technology of China,2009,39(10):1604-1609.
[10]Werbach SK.The End of Spectrum Scarcity[J].IEEE Spectrum,2004,41(3):48-52.