馬永濤,王煜東
(天津大學微電子學院,天津 300072)
近年來,無線通信業務快速增長,造成無線電頻譜資源相對匱乏。無線電波非視距傳播的特性決定了無線設備適合使用3 GHz以下的頻段,頻譜固定分配機制雖然在一定歷史時期保證了通信系統的穩定性能,同時也造成3 GHz以下的頻段被分配殆盡[1]。美國通信聯邦委員會(Federal Communications Commission)的研究表明,已授權頻譜的頻譜利用率只有15%~85%[2]。由于大量授權用戶(Primary User,PU)對于授權頻段的使用不是連續的,因此在許多時間段上存在大量頻譜空穴[3],但是固定的頻譜分配政策使未授權用戶無法使用這些頻譜空穴,造成了授權頻段無線電資源的浪費與公共頻段的擁擠不堪。認知無線電[4-5](Cognitive Radio,CR)是一種通過使SU利用頻譜空穴提高頻譜利用率的技術。
頻譜感知是認知無線電的核心技術,通過頻譜感知,SU能夠檢測頻譜空穴并使用它們,同時也避免對PU產生干擾,是保證高效分配頻譜資源的先決條件。初期頻譜感知基于單節點[6-7]進行,但由于單節點容易受到陰影、衰落等影響導致感知效果急劇降低,協作頻譜感知[7-10]被提出。
在頻譜感知中,能量檢測[11-14]方法由于復雜度低、檢測速度快等優點而受到研究者的青睞。能量檢測方法通過實時計算信號能量,與判決門限進行比較,判斷PU是否占用通信信道。隨著機器學習的興起,研究者們把機器學習[15-19]應用于頻譜感知。文獻[15]中,研究者在協作頻譜感知中采用了K-Mediods聚類算法,通過詳細的數學推理與研究,證明了聚類算法在協作頻譜感知中對于抵抗干擾數據的積極作用。文獻[16]針對多個PU存在的CRN中的信號檢測與識別,研究了基于糾錯輸出碼的多類SVM算法,解決了包含多PU的CRN中頻譜感知問題。文獻[17]針對低信噪比下頻譜感知存在的問題,以信號的協方差矩陣的最大特征值和最小特征值之間的差異作為特征值,采用RBF核函數的SVM算法,提高了頻譜感知的性能。文獻[18]針對規模較大的CRN,提出了一種基于SVM的協作頻譜感知算法,通過對用戶分組,有效降低了協作感知的成本。文獻[19-20]針對頻譜感知中噪聲不確定引起感知效果下降的問題,研究了基于模糊支持向量機的協作頻譜感知算法。

圖1 頻譜感知技術分類
本文提出一種適用于機器學習的二維概率向量,通過對能量向量進行數據處理,將其轉化為主用戶占用頻段的概率,降低數據維數以提高在CRN中進行協作頻譜感知的效果。本文研究了在K-Mediods與FSVM中分別使用能量向量與概率向量的性能表現。實驗結果表明,采用該二維向量,有效降低了機器學習算法中的訓練時間與分類延遲。
本文采用能量檢測感知信號能量,首先對采樣信號x(n)進行模平方得到|x(n)|2,通過求和運算得到信號能量值Y。能量檢測流程如圖2所示。

圖2 能量檢測流程圖

圖3 1個PU與多個SU組成的CRN

(1)

對于帶寬為w的信號,采樣頻率為fs=2w,能量檢測的持續時間為τ,能量檢測采樣的樣本數量為W=fsτ。第j個SU檢測到的原始信號能量Yj′(n)為:
(2)
對Yj′(n)進行處理,使:
(3)
式中:η=E[|wj(n)|2]=σ2。由于接收信號yj(n)具有高斯分布,Yj′(n)遵循卡方分布Yj(n)也遵循卡方分布。設在假設H0中Yj(n)的平均值為μYj|H0,則有:

(4)
相應地,由于E[s(n)w(n)]=0,在假設H1中,Yj(n)的平均值為μYj|H1,有:

(5)


(6)

(7)
當樣本數W足夠大時,可以認為Yj(n)服從高斯分布。N維能量向量表示為Y=(Y1,…,YN)T,具有多元高斯分布,所以具有以下平均向量和協方差矩陣:
μY|Hi=[μY1|Hi,…,μYN|Hi]T,i=0,1
(8)
(9)


(10)
對于向量Y,在H0和H1假設下,分別有
PHi=φ(Y|μY|Hi,∑Y|Hi)i=0,1
(11)
由于PU不活躍時PH0大于的PH1,PU活躍時PH0小于的PH1,因此可以使用二維向量
P=[PH0,PH1]T
(12)
代替Y=(Y1,…,YN)T進行訓練和判斷。由于此時P數值很小,對于區分PH0和PH1帶來不便不便,因此對其進行變換,有
P[-SlnPH0,-SlnPH1]T
(13)
式中:參數S以及對數函數用于縮放。
在“無監督學習”中,通過對無標記的訓練樣本的學習來獲取數據的內在聯系及性質,為進一步的數據分析奠定基礎。在這種學習中應用最廣泛的就是“聚類”。K-Means聚類方法由于其實現算法簡潔、聚類效果良好而被廣泛應用。K-Means聚類方法雖然實現簡潔,在二分類中效果優良,但是由于其算法選擇分類中心的機制所限,會顯著受到異常數據的干擾,因此本文選擇了其改進算法K-Meadiods,一定程度上降低噪聲和孤立樣本對于分類結果的干擾。

(14)
式中:|Hi|是簇Hi中元素的數量。將P分為兩類,則問題轉化為:
(15)
(16)
若fc(P)>λ,則認為P屬于簇H0,否則屬于簇H1,其中λ為算法過程中產生的閾值。
支持向量機(Support Vector Machine,SVM)是一種建立在統計學理論和結構風險最小原理基礎上的模式識別方法,在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢。其核心思想是利用核函數將低維空間數據映射到高維空間,在高維空間中對數據進行統計分析。模糊支持向量機[20](Fuzzy Support Vector Machine,FSVM)作為SVM的改進,引入了隸屬度函數,反映了某個數據對超平面的影響程度,可以降低噪聲和孤立樣本等異常數據對分類效果的影響。

(17)
式中:slξl是FSVM中帶權重的松弛因子。式中C為常數,整體的求解過程和標準的SVM相似,通過構造拉格朗日函數,得到上式的對偶規劃為:
yl≥0l=1,2,…,L
(18)
這是一個二次規劃(QP)問題。該問題可以進一步優化為:
(19)
按照算法二進行運算,可得到分類函數
(20)
式中:K(x,P(l))=φ(x)·φ(P(l))表示核函數。因此,對于測試概率向量Ptest有:
(21)



在本節中,對比了使用能量向量與概率向量在不同機器學習算法下的訓練持續時間與分類延遲。分別考慮由一個PU和二個SU組成的CRN與由一個PU和16個SU組成的CRN。仿真參數設置如下:帶寬w=5 MHz,采樣頻率fs=10 MHz,感知持續時間τ=100 μs,根據路徑損失函數選擇信道系數α=4,1≤j≤N,νj和ψj均為1。PU發射功率為100 mW。
3.1.1 由1個PU和2個SU組成的CRN
在這一CRN中,PU與SU的分布如圖3所示。其中PU坐標為(1,1)km,2個SU坐標分別為(0.5,0.5)km、(2,2)km。在過去的諸多研究中,這種基本情況被廣泛用以形象化地解釋所提出的算法,本文同樣首先以此CRN作為基礎展開研究。

圖4 1個PU與2個SU分布
表1列出了在具有1個PU和2個SU的CRN中,兩種算法分別采用能量向量與概率向量的訓練時間??梢钥吹?隨著訓練樣本的增加,訓練時間也合理地延長。對于同一種算法,采用能量向量與概率向量在這一CRN中的訓練時間非常接近,沒有明顯差別,因為能量向量與概率向量都是二維向量。而對于不同算法,明顯可以看到采用FSVM的時間比K-Mediods大為減少,表明連續聚類比求解凸優化問題耗費更多時間。

表1 訓練持續時間(N=2) 單位:ms
表2列出了兩種算法的分類延遲。根據式(16),K-Mediods分類時間主要取決于測試向量的維度,而不是樣本數量,且質心的計算完成與訓練階段,也不會占用分類時間,因此其分類延遲不受樣本數量的影響。顯然,對于能量向量與概率向量,K-Mediods的分類延遲相同。根據式(20),FSVM的分類延遲不僅受到被分類向量維數的影響,還會受到支持向量數量的影響,而隨著樣本數量的增加,支持向量數量也會增加,因此分類延遲也增加。而對于能量向量和概率向量,與K-Mediods 類似,分類延遲非常接近,并無明顯的差別。

表2 分類延遲(N=2) 單位:ms

圖5 檢測概率與SU個數/PU個數關系(虛警率Pf=0.1)
3.1.2 由1個PU和16個SU組成的CRN
由圖5可以發現,當只有1個PU時,SU數量由9個增加到16個時,檢測概率沒有發生相當明顯的變化,因此本文考慮由1個PU和16個SU的CRN,布局如圖6所示,它們均位于2 km×2 km的正方形中。其中PU在(0.5,0.5)km處,SU均勻分布在正方形中,坐標如圖6所示。
表3列出了在具有1個PU與16個SU的較大規模的CRN中,兩種算法分別采用能量向量與概率向量的訓練時間。與表1相同,隨著訓練樣本的增加,訓練時間也合理地延長。與表1不同的是,對于同一種算法,采用能量向量與概率向量的訓練持續時間隨著樣本數量的增加幅度產生較大的差別。這是因為概率向量是2維向量,對于訓練時間表現出穩定性。當然,在16維能量向量轉換為2維概率向量的過程中不可避免犧牲了一定的時間,因此對于同一種算法,采用概率向量比表1中的時間略有增加。但是這種增加遠低于采用能量向量所導致的訓練時間的巨額提升。

圖6 1個PU與16個SU分布
表4列出了兩種算法分別采用能量向量與概率向量的分類延遲?;谑?15),采用16維能量向量時K-Mediods的分類延遲比表2中增加了許多,但是沒有受到樣本數目增加的影響。采用概率向量的分類延遲與表2中非常接近。類似地,對于FSVM,采用概率向量比采用能量向量有更低的分類延遲。

表4 分類延遲(N=16) 單位:ms

圖7 基于能量向量的K-Mediods分類
仿真結果如圖7~圖12所示。

圖11 不同算法基于能量向量和概率向量的ROC曲線(16SU,-12 dB)

圖8 基于概率向量的K-Mediods分類

圖9 基于能量向量的FSVM分類

圖10 基于概率向量的FSVM分類

圖12 不同算法基于能量向量和概率向量的ROC曲線(16SU,-8 dB)
圖7~圖10分別展示了在圖4分布下觀測到的能量值和相應的概率向量及分類。圖7采用K-Mediods 聚類方法對能量向量進行了分類,分類中心如圖中黑色X標記所示。水平坐標軸與豎直坐標軸分別代表一個SU感知得到的能量數值。明顯看到,對于兩條坐標軸數值都偏低的節點,分類器將其判斷為H0,意味著這些節點中不存在PU用戶;相反,對于兩條坐標軸數值都偏高的節點,分類器將其判斷為H1,這也符合我們的預期,即信道中存在PU信號時能量普遍大于只存在噪聲的情況。圖8,將概率向量應用于K-Mediods聚類,可以看到其數據形成了弧形,且在弧頂聚集了大量數據。同樣地,黑色X標記代表了分類中心。此外,圖7與圖8的坐標數值也有著巨大的差異,這是由于在能量向量變換為概率向量的過程中進行了復雜的數學運算。雖然數值有了較大的改變,但是兩圖中數據對應的意義仍然一致。圖9 與圖10分別表示使采用能量向量與概率向量的FSVM算法。與圖7不同,圖9中分類的依據不是某一個中心點,而是由數量龐大的綠色支持向量作為分類的依據,其帶來的影響之一就是分類精度的提高,但也會導致分類延遲隨著樣本數量的增加而增加,表2 和表4的數據都支持這一判斷。對于圖6中的場景分布,無法直觀地畫出能量向量的分布圖,因此為了更好地對比兩種算法,采用ROC曲線來比較兩算法的性能。圖11表示由1個PU與16個SU組成的CRN在-12 dB時的ROC曲線。顯然,對于同一種算法,兩種向量所對應的曲線性能極為接近,在虛警率較低時,采用概率向量所對應的檢測概率比采用能量向量所對應的檢測概率略低一些,而隨著虛警率提升,兩類曲線逐漸趨于吻合,ROC曲線的非常接近。圖12表示由1個PU與16個SU組成的CRN在-8 dB時的ROC曲線。通過觀察可以發現,對于FSVM算法,采用能量向量與概率向量的兩條ROC曲線吻合度非常高,在虛警率小于0.2的范圍內,兩條曲線近似重合;對于K-Mediods算法,在虛警率小于0.2時采用能量向量時的檢測概率比采用概率向量時的檢測概率略高一些,但是當虛警率提升到0.2后,后者的檢測概率反而比前者更高一些,顯然,在這一情況下ROC曲線的性能有了略微的提高。
本文提出的二維概率向量,適用于在SU較多的CRN中進行協作頻譜感知,通過能量檢測獲取各個SU采集到的能量值,組成高維向量,對此向量進行數據處理,有效降低了數據維數。并且在采用機器學習算法進行驗證后,發現其比能量向量在訓練時間、分類延遲中都具有更加優良的性能表現,而通過ROC曲線可以發現其性能損失很小,甚至在某些情況下會展現出更好的性能表現。