楊 波
(四川文理學院,四川 達州 635000)
隨著無線通信技術在各個行業的應用日趨成熟,并且通信技術對頻譜帶寬的需求也變得越來越高,這均使有限的頻譜資源變得越來越少[1-2]。因此,必須在有效利用無線通信技術的同時,提高寶貴頻譜資源的利用率。認知無線電是解決目前頻譜資源匱乏的有效措施之一,而認知通信網絡的核心是快速、準確地對網絡中主用戶信號頻譜進行檢測,為此,其主用戶信號的頻譜檢測成為了熱點研究問題[3-4]。
針對無線認知網絡中的主用戶頻譜檢測問題,研究人員提出了多種檢測方法。早期頻譜檢測算法主要是在能量域提取信號特征,并將其與預先設定的門限進行比較,當特征值超過門限即判定為主用戶正在使用該頻段[5]。但能量檢測算法對噪聲的適應性不強,難以適應當前低信噪比的無線認知網絡環境。隨著人工智能的發展,基于機器學習的認知網絡頻譜檢測成為主要研究方向[6-8]。文獻[9]直接將機器學習應用于頻譜檢測領域,取得了比傳統能量檢測算法好的檢測性能。文獻[10]基于壓縮感知和線性回歸模型預測無線網絡信號的稀疏參數,然后對接收信號進行稀疏恢復,實現主用戶信號的頻譜檢測。文獻[11]提出了一種基于蜂窩認知定位的頻譜檢測算法,該算法利用歷史數據作為訓練數據,基于支持向量機預測主用戶頻段預測。文獻[12]基于蜂群算法對神經網絡進行優化,有效解決了傳統神經網絡易陷入局部最優的問題,并同時在能量域和循環譜域提取參數,實現頻譜檢測。
在已有研究基礎上,通過分析現在算法的優勢和存在的不足,提出了一種基于循環譜和隨機森林的無線認知網絡主用戶頻譜檢測方法。該方法利用循環譜提取無線網絡信號的特征參數,構成特征向量,然后采用隨機森林作為分類器實現主用戶信號頻譜檢測,仿真實驗結果驗證了該頻譜檢測算法良好的檢測性能和有效性。
通常情況下,無線認知網絡均是假設網絡環境中存在1 個主用戶和G 個次用戶,并且各個用戶之間的信號不存在相互干擾。針對主用戶頻譜檢測的特點,可以將主用戶頻譜檢測的問題轉化為一個二元假設檢驗模型,具體模型可以表示為:

式中:H0—認知網絡環境中不存在主用戶信號;H1—認知網絡環境中存在主用戶信號;sg(t)—均值為零的循環平穩信號,即主用戶信號;n(t)—無線認知網絡中的零均值加性高斯白噪聲,方差為n,采樣時間為T(0≤t≤T)。

以上述特征向量作為隨機森林分類器的輸入,構建用于實現無線認知網絡的自適應頻譜檢測模型。隨機森林是由決策樹集合構成的,隨機森林中的任意一顆決策樹可以表示為:

式中:gk(yi)—隨機森林中決策樹的傳遞函數(決策函數);K—隨機森林中的決策樹個數。隨機森林就是綜合各顆決策樹給出的決策結果,得出最終的無線認知網絡頻譜檢測結果。
假設信號s(t)為均值為零的循環平穩信號,其循環周期為T0,則按照循環譜理論,信號的循環自相關函數可以表示為:

式中:α—循環頻率;R(t,τ)—信號s(t)的自相關函數,則信號s(t)的循環譜可以表示為:

在實際無線認知網絡頻譜檢測的過程中,信號均為有限長信號。因此,信號s(t)的循環譜可以表示為如下估計形式:

式中:Y(tn,f)—各分段信號的離散傅里葉變換(DFT)。上述循環譜估計過程中,將信號劃分為采樣點數相等的N 段,每段采樣點數為T。
決策樹是一種十分典型的若分類器,隨機森林的基本思想就是將多個決策樹組合形成一個強分類器,本質上是一種融合分類方法。決策樹分類結果過于單一,不能很好體現數據多樣性。隨機森林融合多個決策樹的分類結果,能夠有效反映出數據的多樣性,顯著提升分類性能。并且,通過將多個決策樹融合還能有效消除異常特征值對分類結果的影響,具有很強的泛化能力,且不容易出現分類器過擬合現象。
隨機森林中決策樹的決策過程與常規決策樹具有十分顯著區別。隨機森林并不是像常規決策樹訓練一樣,選擇全局最優的特征實現決策樹節點分裂,而是首先隨機確定樣本特征,然后基于局部特征最優實現決策樹的節點分裂,因此其模型泛化能力優于常規決策樹方法。
隨機森林分類器需要根據輸入特征構建決策樹集合。假設隨機森林中決策樹的數量為M,首先需要根據輸入特征生成M個獨立同分布的隨機向量θ1,θ2,L,θM。給定一個隨機向量θi,即可生成一顆對應的決策樹h(x,θi)。由此,可以構建出隨機森林的決策樹集合{h(x,θi)}表示構成隨機森林的決策樹集合。
決策樹集合構建完成后,隨機森林是基于屬性對樣本分類之后的基尼指數實現特征選擇的。在隨機森林分類過程中,經過分類后集合X 的基尼指數定義為:

式中:pi、pj—樣本數據集中第i 類樣本和j 類樣本占總樣本的比例值。由式(8)可知,經過隨機森林分類后,某一個類別的純度越高,該類別的基尼指數越小?;嶂笖的軌蛴行Х磻鰳颖炯腥我鈨蓚€成員不屬于同類別的概率。參照樣本基尼指數,可以定義如下形式的特征基尼指數:

式中:Xm—特征a 的第m 種取值時生成的樣本集合。基于基尼指數作為隨機森林決策樹最優特征劃分原則時,通過不斷選擇基尼指數小的特征作為決策樹節點分裂的依據,能夠獲得集中性能好的樣本分類結果。
針對無線認知網絡的主用戶頻譜檢測問題,本節基于循環譜理論和隨機森林分類器設計了一個頻譜感知算法。該算法主要包括兩個過程,首先是利用循環譜實現無線認知網絡中信號特征參數的提取,然后基于隨機森林構建一個識別主用戶信號的分類器。
假設無線認知網絡中任意一個非主用戶的接收信號為y(t),信號的循環周期為T0,則y(t)的瞬時自相關函數估計值可以表示為:

信號y(t)的循環譜密度函數可以表示為:

采用頻域平滑法對接收信號y(t)的循環譜密度進行估計,估計過程可以表示為:

式中:k=1,2,L,K,L—頻域平滑估計循環譜密度的樣本點數;Y(k)—信號y(t)的DFT。
無線認知網絡中,如果不存在主用戶信號,即H0假設下,接收信號循環譜的期望值為:

式中:N(k)—噪聲的DFT。H0假設下信號循環譜的方差可以表示為:

同理,可以推導得出,當無線認知網絡中存在主用戶時,即H1假設下,接收信號循環譜的期望和方差分別為:

分別構建正樣本和負樣本組成的訓練樣本號集Q,樣本個數為N,提取訓練樣本集Q 中的信號循環譜均值和方差,生成特征向量,特征向量維度為M,作為隨機森林的訓練特征集。具體隨機森林構建與訓練過程如下。
步驟1:Bagging。在訓練樣本集中隨機有放回地選擇n 個樣本信號,作為一個決策樹的訓練樣本。
步驟2:特征分裂選擇。在樣本集特征向量中選擇m 個特征作為決策樹節點的分類特征?;跊Q策樹訓練原則,選出分類效果最佳的特征作為決策樹節點的分裂特征。
步驟3:決策樹生長。為了確保每一棵決策樹的最大限度生長,基于基尼指數計算,當決策樹節點的分類純度滿足預先設置的比例要求時,決策樹停止生長。
步驟4:隨機森林生成。不斷重復步驟1 到步驟3,直到所有的決策樹均完成訓練,將這些決策樹組合生成一個分類能力強的隨機森林。

圖1 隨機森林頻譜檢測過程Fig.1 Spectrum Detection Based on Random Forest
提出的基于循環譜和隨機森林的無線認知網絡頻譜檢測算法訓練過程,如圖1 所示。首先,構建包含H0假設和H1假設的訓練樣本集,并采用隨機有放回抽樣選擇單次訓練樣本;然后基于循環譜提取訓練信號的特征參數,生成特征向量;最后,將特征向量導入隨機森林模型,經過訓練后得出分類模型。
為了驗證文中提出的基于循環譜和隨機森林的無線認知網絡頻譜檢測算法性能,本節以目前常用的BPSK 信號和OFDM 信號為例,測試算法對主用戶信號頻譜的檢測性能。信號仿真參數設置如下:信號采樣頻率為400MHz,采樣點數為8000 點,信號載波頻率(3.1~4.8)GHz 范圍內呈均勻分布,其中BPSK 信號數據率為1.2Mbit/s,信號帶寬為5MHz,OFDM 信號數據率為5Mbit/s,信號帶寬為7.5MHz。為了測試文中提出的檢測算法性能,在相同的仿真條件下,將其與文獻[12]提出的蜂群優化神經網絡檢測算法和文獻[13]提出的對數預處理支持向量機檢測算法進行對比分析,信噪比范圍為(-24)dB 到0dB,信噪比步進3dB,每個信噪比下進行500 次蒙特卡洛仿真實驗,三種頻譜檢測算法的檢測性能,如圖2、圖3 所示。

圖2 BPSK 信號頻譜檢測性能對比結果Fig.2 Spectrum Detection Performance Comparison of BPSK Signal

圖3 OFDM 信號頻譜檢測性能對比結果Fig.3 OFDM Signal Spectrum Detection Performance Comparison Results
三種頻譜檢測算法對BPSK 信號和OFDM 信號在不同信噪比下的檢測性能,如圖2、圖3 所示。仿真實驗結果表明,隨著信噪比的增加,各種頻譜檢測算法在BPSK 信號和OFDM 信號上的檢測性能均呈現出上升的態勢。對比三種頻譜檢測算法的仿真實驗結果可知,文中提出基于循環譜和隨機森林的頻譜檢測算法的檢測性能優于文獻[12]算法和文獻[13]算法。例如,當信噪比為(-12)dB時,文獻[12]算法和文獻[13]算法對BPSK 信號的檢測正確率分別為69%和81%,而文中算法對BPSK 信號的檢測正確率為92%,檢測性能上分別提升了23%和11%;而對于OFDM 信號,文獻[12]算法和文獻[13]算法對OFDM 信號的檢測正確率分別為73%和76%,而文中算法對BPSK 信號的檢測正確率為86%,檢測性能上分別提升了13%和10%。
研究了無線認知網絡主用戶頻譜檢測問題,首先在循環譜域提取信號特征,然后利用隨機森林實現信號頻譜檢測。對比仿真實驗結果表明,所提方法能夠實現較低信噪比下的主用戶信號頻譜檢測,且檢測性能優于常用算法。研究內容為無線網絡頻譜檢測提供了一種新方法,下一步的研究方向是如何將該方法擴展到多用戶無線認知網絡的頻譜檢測中。