廖云峰,陳 勇,田家強,鮑麗娜
(1.解放軍理工大學 通信工程學院,江蘇 南京 210007;2.南京電訊技術研究所,江蘇 南京 210007;3.中國聯通江蘇分公司,江蘇 南京 210019)
?
基于頻譜數據庫的分布式動態頻譜接入算法*
廖云峰1,2,陳勇2,田家強1,2,鮑麗娜3
(1.解放軍理工大學 通信工程學院,江蘇 南京 210007;2.南京電訊技術研究所,江蘇 南京 210007;3.中國聯通江蘇分公司,江蘇 南京 210019)
摘要:頻譜數據庫是一種直接獲得頻譜信息的方式,針對在復雜多變的網絡環境中用戶之間缺少信息交互,研究了數據庫協助和沒有數據庫情況下的動態頻譜接入算法。一方面,次用戶通過歷史感知數據估計信道的可用性而進行信道選擇,另一方面,次用戶通過數據庫獲得更加可靠的頻譜信息從而做出策略。證明了用戶之間的博弈是一個超模博弈,通過提出的分布式學習算法能收斂到一個純策略納什均衡點。仿真結果表明,提出的聯合數據庫感知算法和數據庫協助算法比依靠感知的結果收斂更快,獲得的系統吞吐量接近最大,減少了用戶決策的時延,提高了頻譜利用率。
關鍵詞:頻譜數據庫;動態頻譜接入;學習算法;納什均衡
0引言
隨著無線技術的飛速發展,可用的電磁頻譜變得日益擁擠。而一系列報告和頻譜測量結果[1-2]卻表明一些授權頻譜(如電視廣播頻段)的利用率很低。近年來,以認識無線電為基礎的動態頻譜接入技術[3-4]已成為研究熱點,為提高頻譜利用率開辟了一條新的途徑。
動態頻譜接入通過獲得頻譜空洞為次用戶提供信息傳輸,即在主用戶不使用信道時讓次用戶接入信道,當主用戶重新占用信道時次用戶必須讓出信道。為了避免對主用戶造成干擾,次用戶接入信道時首先需要獲得頻譜信息,方法包括頻譜感知和接入頻譜數據庫。頻譜感知技術是一種可以直接獲取頻譜信息的方法,在國內外已經有很多研究成果[5-7], 文獻[7]對信道可用性的歷史感知數據進行學習,選擇可用性較好的信道,結合多臂賭博機模型和隨機機器學習算法,降低了用戶沖突,減少了用戶的丟包率。但是頻譜感知技術對于用戶節點來說開銷大且感知的性能有限,而通過接入頻譜數據庫的方式可以獲得可靠的頻譜信息,為動態頻譜接入提供有力的外部支持[8]。文獻[9]提出了聯合本地感知和數據庫協助機制來確定信道條件,提高了探測結果的可靠性。面對多用戶接入信道,博弈論是解決多用戶相互競爭的有效方法,文獻[10]根據次用戶的不同偏好和各自對信道的感知建立了二分圖匹配,提出了加權沖突博弈,相比于隨機接入的方法能獲得更高的系統吞吐量。考慮到網絡中的用戶之間沒有信息交互,而數據庫能提供可靠的頻譜信息,在次用戶知道自己可用信道集而不知道其他用戶是否使用信道的情況下,文獻[11]提出的分布式學習算法能使每個用戶獲得較好的納什均衡解,系統吞吐量接近最大值。
頻譜數據庫存儲了包含信道條件,地理位置,干擾等級,用頻政策等頻譜信息。但之前的工作對基于數據庫的頻譜接入方式研究較少,由于網絡拓撲的復雜性和多變性,用戶自己獲取電磁頻譜信息的方式必然增大用戶端設備的復雜性,并且考慮到動態網絡環境中次用戶之間沒有信息交互。為了解決用戶端開銷大以及用戶在接入信道時的沖突問題。本文研究了基于數據庫的動態頻譜接入方式,用戶之間的競爭構成一個慣序淺博弈,并提出了基于數據庫的分布式學習算法和聯合頻譜感知與數據庫的分布式學習算法,并與文獻[7]中的頻譜接入方法做比較。結果表明所提出的算法均能達到一個納什均衡解,在數據庫的支持下算法收斂速率更快,在加快用戶決策的同時增大了系吞吐量,且獲得的系統吞吐量接近網絡的最大值,即得到的信道選擇方案接近最優納什均衡解。
1系統模型和問題建模
1.1系統模型


圖1 系統模型
1.2問題建模
假設信道j的帶寬為bj。在t時刻,用戶i根據從數據庫獲得的頻譜信息,選擇信道j接入。由于用戶之間沒有信息交互,用戶i不知道其他用戶的信道選擇。因此用戶i獲得的收益可表示為:
(1)

(2)
2博弈分析
由于次用戶只選擇對自己有利的信道接入策略,且相互之間并不知道別人的選擇,因此式(2)可以構建成一個博弈,通過分布式學習算法可以得到納什均衡解。

(3)
式中,ai∈Ai表示用戶i的策略,a-i∈A1×…×An-1×An+1…×AN表示除去用戶i以外的用戶的策略,×表示笛卡爾乘積。

(4)
當用戶的策略組合達到納什均衡時,意味著如果一個用戶單方面的改變策略,其收益不會增加。
定義2:一個博弈是超模博弈當:
(5)
如果一個博弈是超模博弈,則至少存在一個純策略納什均衡[13]。
定理1:博弈G是一個超模博弈。
證明:為了表示方便,用戶i的收益函數表示為
(6)
3算法設計
在第2節的分析中,博弈G是超模博弈,至少存在一個純策略納什均衡,因此本節將提出接入數據庫和聯合數據庫感知的分布式學習算法分別求解博弈的納什均衡解,其結果將在第4節中展開分析。
3.1聯合數據庫感知算法


(7)
引入排序指針對信道進行排序:

(8)

(9)


算法1:



(10)
感知并接入:根據式(10)選出前N個信道,根據式(9)選擇第r條信道感知,可用則接入并保持r不變,否則不傳輸數據,并在下一時刻更新r。
更新信道選擇概率:
(11)
(12)

3.2數據庫協助算法
不同于算法1,在不需要感知的情況下,用戶直接從數據庫獲得信道條件排在前N的信道,算法描述如下。
算法2:

選擇并接入:根據式(9)選擇第r條信道感知,可用則接入并保持r不變,否則不傳輸數據,并在下一時刻更新r
更新信道選擇概率:根據式(10)、式(11)感知信道選擇概率
4仿真結果分析
在本節中,通過數值結果分析系統的性能。在仿真中,可以發現在數據庫的協助下用戶能更快找到納什均衡解,如果直接依靠數據庫進行信道選擇,得到的均衡解更接近最優解。
在一個有3個用戶和4條信道的環境中,用戶的發射功率為P={350,400,200},單位mW。用戶坐標為{(72,70)(76,370)(165,218)},信道可用概率分別為{0.85 0.85 0.8 0.75},帶寬分別為{20,24,21,16},單位MHz。學習步長b=0.1,d=10,α=4,σ=10-10,通過算法1得到圖2所示的結果。經過100次迭代,用戶1選擇4條信道的概率分別為(0 0 1 0),用戶2為(1 0 0 0),用戶3為(0 1 0 0)。最終用戶1選擇信道3,用戶2選擇信道1,用戶3選擇信道2,沒有一個用戶會改變自己的接入策略。

圖2 算法2的收斂性
下面考慮10個用戶和12條信道的分布式網絡場景。用戶的發射功率分別為{350, 400,200, 50, 330, 100, 300, 280, 250, 120, },單位mW。用戶坐標為{(72,70)(76,370)(165,218)(182,450)(242,340)(321,72)(396,422)(405,450)(200,250(175,325)}。信道可用概率分別為{ 0.85 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.63 0.58 0.78 0.9},帶寬分別為{ 20,24,21,16,17,28,23,27,26,30,28,18},單位MHz。其他參數同上。
圖3和圖4是重復了600次試驗后取平均數的結果。最佳納什均衡通過匈牙利算法[14]得到。圖3表明了3種算法在各自達到納什均衡時所需的平均迭代次數,提出的算法1和算法2的平均迭代次數要少于文獻[7]中的算法。因為在獲得了頻譜信息的情況下,用戶能更快做出對自己有利的選擇,使自己能獲得最大的收益。

圖3 比較3種算法在不同用戶數量時收斂的迭代速度

圖4 比較3種算法在不同用戶數量時
在收斂速度更快的同時,所獲得的平均網絡吞吐量也增大了。從圖4可以看出,算法1和算法2所獲得的平均吞吐量較文獻[7]中的算法較好。而算法1 所獲得的平均吞吐量幾乎等于最大值。這表明,通過數據庫用戶排除了感知帶來的誤差干擾,不僅能更快獲知頻譜信息,做出決策,在用戶沒有信息交互的情況下,能使用戶更快做出最好的選擇,減少了感知帶來的時延,提高了頻譜的利用率。
5結語
本文研究了次用戶在沒有信息交互情況下的頻譜接入過程,比較了在有數據庫協助的情況和沒有數據庫情況下不同算法的區別。仿真結果表明,相比于一般的頻譜感知過程,在接入數據庫獲得頻譜信息,用戶之間沒有信息交互的情況,用戶能更快做出接入策略,而本文提出的算法1能使用戶更快收斂到接近最優值的納什均衡點,使系統吞吐量近似最大。其意義在于減少了用戶因感知帶來的時延,增加了用戶的傳輸時間,提高了頻譜的利用率。而在未來更加復雜多變的環境中,數據庫的信息也可能是變化的,在這種環境下如何更加精準地做出接入策略還有待研究。
參考文獻:
[1]Federal Communications Commission. Spectrum Policy Task Force Report[R]. ET Docket No. 02-135, November 2002.
[2]Shared Spectrum Company. www.sharedspectrum.com.
[3]ZHAO Q, Sadler B. A Survey of Dynamic Spectrum Access: Signal Processing, Network, and Regulatory Policy[J]. IEEE Signal Processing,2005,24(3):201-220.
[4]徐迪.動態頻譜接入綜述[J].電子科技,2015,28(03):161-164.XU D. Review of Dynamic Spectrum Access[J]. Electronic Science and Technology, 2015,28(03):161-164.
[5]蘭昆偉,趙杭生,李湘洋等. 認知無線電中基于感知門限的頻譜預測研究[J]. 通信技術,2015,48(02):165-170.
[6]Yasin Y, GUO Z, WANG X. Sequential Joint Spectrum Sensing and Channel Estimation for Dynamic Spectrum Access[J]. IEEE Journal on Selected Areas in Communications,2014,32(11): 2000-2012.
[7]Marjan Z, Min D, Ali G. Distributed Stochastic Learning for Dynamic Spectrum Access Adaptive to Primary Network Conditions[C]// IEEE SPAWC,2014:449-4533.
[8]Murty R, Chandra R, Moscibroda T. Senseless: A Database-Driven White Space Network[J]. IEEE Transactions on Mobile Computing, 2012,11(2): 189-203.
[9]LIU Y, YU R, PAN M, et al. Adaptive Channel Access in Spectrum Database-Driven Cognitive Radio Networks[C]//IEEE ICC, 2014:4933-4938.
[10]ZHANG N, LIANG H, CHENG Nan, et al. Dynamic Spectrum Access in Multi-Channel Cognitive Radio Networks[J]. IEEE Journal on Selected Areas in Communications,2014,32(11):2053-2064.
[11]XU Y, XU Y, Anpalagan A. Database-Assisted Spectrum Access in Dynamic Networks: A Distributed Learning Solution[J]. IEEE Access, 2015,3:1071-1078.
[12]HAN Z, Niyato D, Saad W and Basar T, Game Theory in Wireless and Communication Networks[M]. Cambridge University Press: 2012.
[13]HUANG J, Randall A, Michael L. Distributed Interference Compensation for Wireless Networks[J]. IEEE Journal on Selected Areas in Communications, 2006,24(5):1074-1084.
[14]Papadimitriou C and Steiglitz K. Combinatorial Optimization: Algorithms and Complexity[M]. Dover, 1998.
A Distributed Dynamic Spectrum Access Algorithm based on Spectrum Database
LIAO Yun-feng1,2, CHEN Yong2, TIAN Jia-qiang1,2, BAO Li-na3
(1.Institute of Communications Engineering, PLA University of Science & Technology, Nanjing Jiangsu 210007,China;2.Nanjing Telecommunication Technology Institute, Nanjing Jiangsu 210007,China;3.China Unicom Corporation Limited Jiangsu Branch, Nanjing Jiangsu 210019,China)
Abstract:Spectrum database could directly acquire spectrum information, and in view of the complex network environment Which is lacking information exchange of between the users, dynamic spectrum access algorithm with and without the aid of database is discussed in this paper. On the one hand, secondary users estimate the availability probability and select channels with historically sensed data, on the other, they acquire farly reliable spectrum information from spectrum database and make proper decision.The game of between the users proves to be a supermodular game, and two distributed leaning algorithms are proposed to achieve the pure strategic NE (Nash Equilibrium). Simulation results show that the proposed database-jointed and database-aided perception algorithms could enjoy fairly fast convergence, nearly maximum throughput, and thus decrease the decision time-delay of decision and improve the spectrum utilization.
Key words:spectrum database; dynamic spectrum access; learning algorithm;NE
doi:10.3969/j.issn.1002-0802.2016.04.009
*收稿日期:2015-11-18;修回日期:2016-02-25Received date:2015-11-19;Revised date:2016-02-25
基金項目:國家自然科學基金(No.61301161,No.61471395);江蘇省自然科學基金(No. BK20141070)
Foundation Item:National Natural Science Foundation of China(No.61301161,No.61471395);Natural Science Foundation of Jiangsu Province(No.BK20141070)
中圖分類號:TN929.5
文獻標志碼:A
文章編號:1002-0802(2016)04-0426-05
作者簡介:

廖云峰(1989—),男,碩士研究生,主要研究方向為動態頻譜管理;
陳勇(1975—),男,碩士,高級工程師,主要研究方向為無線網絡,頻譜管理;
田家強(1991—),男,碩士研究生,主要研究方向為動態頻譜管理;
鮑麗娜(1987—),女,碩士,工程師,主要研究方向為認知無線電,網絡管理。