楊 波
(四川文理學(xué)院,四川 達(dá)州 635000)
隨著無(wú)線通信技術(shù)在各個(gè)行業(yè)的應(yīng)用日趨成熟,并且通信技術(shù)對(duì)頻譜帶寬的需求也變得越來(lái)越高,這均使有限的頻譜資源變得越來(lái)越少[1-2]。因此,必須在有效利用無(wú)線通信技術(shù)的同時(shí),提高寶貴頻譜資源的利用率。認(rèn)知無(wú)線電是解決目前頻譜資源匱乏的有效措施之一,而認(rèn)知通信網(wǎng)絡(luò)的核心是快速、準(zhǔn)確地對(duì)網(wǎng)絡(luò)中主用戶信號(hào)頻譜進(jìn)行檢測(cè),為此,其主用戶信號(hào)的頻譜檢測(cè)成為了熱點(diǎn)研究問(wèn)題[3-4]。
針對(duì)無(wú)線認(rèn)知網(wǎng)絡(luò)中的主用戶頻譜檢測(cè)問(wèn)題,研究人員提出了多種檢測(cè)方法。早期頻譜檢測(cè)算法主要是在能量域提取信號(hào)特征,并將其與預(yù)先設(shè)定的門(mén)限進(jìn)行比較,當(dāng)特征值超過(guò)門(mén)限即判定為主用戶正在使用該頻段[5]。但能量檢測(cè)算法對(duì)噪聲的適應(yīng)性不強(qiáng),難以適應(yīng)當(dāng)前低信噪比的無(wú)線認(rèn)知網(wǎng)絡(luò)環(huán)境。隨著人工智能的發(fā)展,基于機(jī)器學(xué)習(xí)的認(rèn)知網(wǎng)絡(luò)頻譜檢測(cè)成為主要研究方向[6-8]。文獻(xiàn)[9]直接將機(jī)器學(xué)習(xí)應(yīng)用于頻譜檢測(cè)領(lǐng)域,取得了比傳統(tǒng)能量檢測(cè)算法好的檢測(cè)性能。文獻(xiàn)[10]基于壓縮感知和線性回歸模型預(yù)測(cè)無(wú)線網(wǎng)絡(luò)信號(hào)的稀疏參數(shù),然后對(duì)接收信號(hào)進(jìn)行稀疏恢復(fù),實(shí)現(xiàn)主用戶信號(hào)的頻譜檢測(cè)。文獻(xiàn)[11]提出了一種基于蜂窩認(rèn)知定位的頻譜檢測(cè)算法,該算法利用歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),基于支持向量機(jī)預(yù)測(cè)主用戶頻段預(yù)測(cè)。文獻(xiàn)[12]基于蜂群算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,有效解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)的問(wèn)題,并同時(shí)在能量域和循環(huán)譜域提取參數(shù),實(shí)現(xiàn)頻譜檢測(cè)。
在已有研究基礎(chǔ)上,通過(guò)分析現(xiàn)在算法的優(yōu)勢(shì)和存在的不足,提出了一種基于循環(huán)譜和隨機(jī)森林的無(wú)線認(rèn)知網(wǎng)絡(luò)主用戶頻譜檢測(cè)方法。該方法利用循環(huán)譜提取無(wú)線網(wǎng)絡(luò)信號(hào)的特征參數(shù),構(gòu)成特征向量,然后采用隨機(jī)森林作為分類器實(shí)現(xiàn)主用戶信號(hào)頻譜檢測(cè),仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了該頻譜檢測(cè)算法良好的檢測(cè)性能和有效性。
通常情況下,無(wú)線認(rèn)知網(wǎng)絡(luò)均是假設(shè)網(wǎng)絡(luò)環(huán)境中存在1 個(gè)主用戶和G 個(gè)次用戶,并且各個(gè)用戶之間的信號(hào)不存在相互干擾。針對(duì)主用戶頻譜檢測(cè)的特點(diǎn),可以將主用戶頻譜檢測(cè)的問(wèn)題轉(zhuǎn)化為一個(gè)二元假設(shè)檢驗(yàn)?zāi)P停唧w模型可以表示為:

式中:H0—認(rèn)知網(wǎng)絡(luò)環(huán)境中不存在主用戶信號(hào);H1—認(rèn)知網(wǎng)絡(luò)環(huán)境中存在主用戶信號(hào);sg(t)—均值為零的循環(huán)平穩(wěn)信號(hào),即主用戶信號(hào);n(t)—無(wú)線認(rèn)知網(wǎng)絡(luò)中的零均值加性高斯白噪聲,方差為n,采樣時(shí)間為T(mén)(0≤t≤T)。

以上述特征向量作為隨機(jī)森林分類器的輸入,構(gòu)建用于實(shí)現(xiàn)無(wú)線認(rèn)知網(wǎng)絡(luò)的自適應(yīng)頻譜檢測(cè)模型。隨機(jī)森林是由決策樹(shù)集合構(gòu)成的,隨機(jī)森林中的任意一顆決策樹(shù)可以表示為:

式中:gk(yi)—隨機(jī)森林中決策樹(shù)的傳遞函數(shù)(決策函數(shù));K—隨機(jī)森林中的決策樹(shù)個(gè)數(shù)。隨機(jī)森林就是綜合各顆決策樹(shù)給出的決策結(jié)果,得出最終的無(wú)線認(rèn)知網(wǎng)絡(luò)頻譜檢測(cè)結(jié)果。
假設(shè)信號(hào)s(t)為均值為零的循環(huán)平穩(wěn)信號(hào),其循環(huán)周期為T(mén)0,則按照循環(huán)譜理論,信號(hào)的循環(huán)自相關(guān)函數(shù)可以表示為:

式中:α—循環(huán)頻率;R(t,τ)—信號(hào)s(t)的自相關(guān)函數(shù),則信號(hào)s(t)的循環(huán)譜可以表示為:

在實(shí)際無(wú)線認(rèn)知網(wǎng)絡(luò)頻譜檢測(cè)的過(guò)程中,信號(hào)均為有限長(zhǎng)信號(hào)。因此,信號(hào)s(t)的循環(huán)譜可以表示為如下估計(jì)形式:

式中:Y(tn,f)—各分段信號(hào)的離散傅里葉變換(DFT)。上述循環(huán)譜估計(jì)過(guò)程中,將信號(hào)劃分為采樣點(diǎn)數(shù)相等的N 段,每段采樣點(diǎn)數(shù)為T(mén)。
決策樹(shù)是一種十分典型的若分類器,隨機(jī)森林的基本思想就是將多個(gè)決策樹(shù)組合形成一個(gè)強(qiáng)分類器,本質(zhì)上是一種融合分類方法。決策樹(shù)分類結(jié)果過(guò)于單一,不能很好體現(xiàn)數(shù)據(jù)多樣性。隨機(jī)森林融合多個(gè)決策樹(shù)的分類結(jié)果,能夠有效反映出數(shù)據(jù)的多樣性,顯著提升分類性能。并且,通過(guò)將多個(gè)決策樹(shù)融合還能有效消除異常特征值對(duì)分類結(jié)果的影響,具有很強(qiáng)的泛化能力,且不容易出現(xiàn)分類器過(guò)擬合現(xiàn)象。
隨機(jī)森林中決策樹(shù)的決策過(guò)程與常規(guī)決策樹(shù)具有十分顯著區(qū)別。隨機(jī)森林并不是像常規(guī)決策樹(shù)訓(xùn)練一樣,選擇全局最優(yōu)的特征實(shí)現(xiàn)決策樹(shù)節(jié)點(diǎn)分裂,而是首先隨機(jī)確定樣本特征,然后基于局部特征最優(yōu)實(shí)現(xiàn)決策樹(shù)的節(jié)點(diǎn)分裂,因此其模型泛化能力優(yōu)于常規(guī)決策樹(shù)方法。
隨機(jī)森林分類器需要根據(jù)輸入特征構(gòu)建決策樹(shù)集合。假設(shè)隨機(jī)森林中決策樹(shù)的數(shù)量為M,首先需要根據(jù)輸入特征生成M個(gè)獨(dú)立同分布的隨機(jī)向量θ1,θ2,L,θM。給定一個(gè)隨機(jī)向量θi,即可生成一顆對(duì)應(yīng)的決策樹(shù)h(x,θi)。由此,可以構(gòu)建出隨機(jī)森林的決策樹(shù)集合{h(x,θi)}表示構(gòu)成隨機(jī)森林的決策樹(shù)集合。
決策樹(shù)集合構(gòu)建完成后,隨機(jī)森林是基于屬性對(duì)樣本分類之后的基尼指數(shù)實(shí)現(xiàn)特征選擇的。在隨機(jī)森林分類過(guò)程中,經(jīng)過(guò)分類后集合X 的基尼指數(shù)定義為:

式中:pi、pj—樣本數(shù)據(jù)集中第i 類樣本和j 類樣本占總樣本的比例值。由式(8)可知,經(jīng)過(guò)隨機(jī)森林分類后,某一個(gè)類別的純度越高,該類別的基尼指數(shù)越小。基尼指數(shù)能夠有效反應(yīng)出樣本集中任意兩個(gè)成員不屬于同類別的概率。參照樣本基尼指數(shù),可以定義如下形式的特征基尼指數(shù):

式中:Xm—特征a 的第m 種取值時(shí)生成的樣本集合。基于基尼指數(shù)作為隨機(jī)森林決策樹(shù)最優(yōu)特征劃分原則時(shí),通過(guò)不斷選擇基尼指數(shù)小的特征作為決策樹(shù)節(jié)點(diǎn)分裂的依據(jù),能夠獲得集中性能好的樣本分類結(jié)果。
針對(duì)無(wú)線認(rèn)知網(wǎng)絡(luò)的主用戶頻譜檢測(cè)問(wèn)題,本節(jié)基于循環(huán)譜理論和隨機(jī)森林分類器設(shè)計(jì)了一個(gè)頻譜感知算法。該算法主要包括兩個(gè)過(guò)程,首先是利用循環(huán)譜實(shí)現(xiàn)無(wú)線認(rèn)知網(wǎng)絡(luò)中信號(hào)特征參數(shù)的提取,然后基于隨機(jī)森林構(gòu)建一個(gè)識(shí)別主用戶信號(hào)的分類器。
假設(shè)無(wú)線認(rèn)知網(wǎng)絡(luò)中任意一個(gè)非主用戶的接收信號(hào)為y(t),信號(hào)的循環(huán)周期為T(mén)0,則y(t)的瞬時(shí)自相關(guān)函數(shù)估計(jì)值可以表示為:

信號(hào)y(t)的循環(huán)譜密度函數(shù)可以表示為:

采用頻域平滑法對(duì)接收信號(hào)y(t)的循環(huán)譜密度進(jìn)行估計(jì),估計(jì)過(guò)程可以表示為:

式中:k=1,2,L,K,L—頻域平滑估計(jì)循環(huán)譜密度的樣本點(diǎn)數(shù);Y(k)—信號(hào)y(t)的DFT。
無(wú)線認(rèn)知網(wǎng)絡(luò)中,如果不存在主用戶信號(hào),即H0假設(shè)下,接收信號(hào)循環(huán)譜的期望值為:

式中:N(k)—噪聲的DFT。H0假設(shè)下信號(hào)循環(huán)譜的方差可以表示為:

同理,可以推導(dǎo)得出,當(dāng)無(wú)線認(rèn)知網(wǎng)絡(luò)中存在主用戶時(shí),即H1假設(shè)下,接收信號(hào)循環(huán)譜的期望和方差分別為:

分別構(gòu)建正樣本和負(fù)樣本組成的訓(xùn)練樣本號(hào)集Q,樣本個(gè)數(shù)為N,提取訓(xùn)練樣本集Q 中的信號(hào)循環(huán)譜均值和方差,生成特征向量,特征向量維度為M,作為隨機(jī)森林的訓(xùn)練特征集。具體隨機(jī)森林構(gòu)建與訓(xùn)練過(guò)程如下。
步驟1:Bagging。在訓(xùn)練樣本集中隨機(jī)有放回地選擇n 個(gè)樣本信號(hào),作為一個(gè)決策樹(shù)的訓(xùn)練樣本。
步驟2:特征分裂選擇。在樣本集特征向量中選擇m 個(gè)特征作為決策樹(shù)節(jié)點(diǎn)的分類特征。基于決策樹(shù)訓(xùn)練原則,選出分類效果最佳的特征作為決策樹(shù)節(jié)點(diǎn)的分裂特征。
步驟3:決策樹(shù)生長(zhǎng)。為了確保每一棵決策樹(shù)的最大限度生長(zhǎng),基于基尼指數(shù)計(jì)算,當(dāng)決策樹(shù)節(jié)點(diǎn)的分類純度滿足預(yù)先設(shè)置的比例要求時(shí),決策樹(shù)停止生長(zhǎng)。
步驟4:隨機(jī)森林生成。不斷重復(fù)步驟1 到步驟3,直到所有的決策樹(shù)均完成訓(xùn)練,將這些決策樹(shù)組合生成一個(gè)分類能力強(qiáng)的隨機(jī)森林。

圖1 隨機(jī)森林頻譜檢測(cè)過(guò)程Fig.1 Spectrum Detection Based on Random Forest
提出的基于循環(huán)譜和隨機(jī)森林的無(wú)線認(rèn)知網(wǎng)絡(luò)頻譜檢測(cè)算法訓(xùn)練過(guò)程,如圖1 所示。首先,構(gòu)建包含H0假設(shè)和H1假設(shè)的訓(xùn)練樣本集,并采用隨機(jī)有放回抽樣選擇單次訓(xùn)練樣本;然后基于循環(huán)譜提取訓(xùn)練信號(hào)的特征參數(shù),生成特征向量;最后,將特征向量導(dǎo)入隨機(jī)森林模型,經(jīng)過(guò)訓(xùn)練后得出分類模型。
為了驗(yàn)證文中提出的基于循環(huán)譜和隨機(jī)森林的無(wú)線認(rèn)知網(wǎng)絡(luò)頻譜檢測(cè)算法性能,本節(jié)以目前常用的BPSK 信號(hào)和OFDM 信號(hào)為例,測(cè)試算法對(duì)主用戶信號(hào)頻譜的檢測(cè)性能。信號(hào)仿真參數(shù)設(shè)置如下:信號(hào)采樣頻率為400MHz,采樣點(diǎn)數(shù)為8000 點(diǎn),信號(hào)載波頻率(3.1~4.8)GHz 范圍內(nèi)呈均勻分布,其中BPSK 信號(hào)數(shù)據(jù)率為1.2Mbit/s,信號(hào)帶寬為5MHz,OFDM 信號(hào)數(shù)據(jù)率為5Mbit/s,信號(hào)帶寬為7.5MHz。為了測(cè)試文中提出的檢測(cè)算法性能,在相同的仿真條件下,將其與文獻(xiàn)[12]提出的蜂群優(yōu)化神經(jīng)網(wǎng)絡(luò)檢測(cè)算法和文獻(xiàn)[13]提出的對(duì)數(shù)預(yù)處理支持向量機(jī)檢測(cè)算法進(jìn)行對(duì)比分析,信噪比范圍為(-24)dB 到0dB,信噪比步進(jìn)3dB,每個(gè)信噪比下進(jìn)行500 次蒙特卡洛仿真實(shí)驗(yàn),三種頻譜檢測(cè)算法的檢測(cè)性能,如圖2、圖3 所示。

圖2 BPSK 信號(hào)頻譜檢測(cè)性能對(duì)比結(jié)果Fig.2 Spectrum Detection Performance Comparison of BPSK Signal

圖3 OFDM 信號(hào)頻譜檢測(cè)性能對(duì)比結(jié)果Fig.3 OFDM Signal Spectrum Detection Performance Comparison Results
三種頻譜檢測(cè)算法對(duì)BPSK 信號(hào)和OFDM 信號(hào)在不同信噪比下的檢測(cè)性能,如圖2、圖3 所示。仿真實(shí)驗(yàn)結(jié)果表明,隨著信噪比的增加,各種頻譜檢測(cè)算法在BPSK 信號(hào)和OFDM 信號(hào)上的檢測(cè)性能均呈現(xiàn)出上升的態(tài)勢(shì)。對(duì)比三種頻譜檢測(cè)算法的仿真實(shí)驗(yàn)結(jié)果可知,文中提出基于循環(huán)譜和隨機(jī)森林的頻譜檢測(cè)算法的檢測(cè)性能優(yōu)于文獻(xiàn)[12]算法和文獻(xiàn)[13]算法。例如,當(dāng)信噪比為(-12)dB時(shí),文獻(xiàn)[12]算法和文獻(xiàn)[13]算法對(duì)BPSK 信號(hào)的檢測(cè)正確率分別為69%和81%,而文中算法對(duì)BPSK 信號(hào)的檢測(cè)正確率為92%,檢測(cè)性能上分別提升了23%和11%;而對(duì)于OFDM 信號(hào),文獻(xiàn)[12]算法和文獻(xiàn)[13]算法對(duì)OFDM 信號(hào)的檢測(cè)正確率分別為73%和76%,而文中算法對(duì)BPSK 信號(hào)的檢測(cè)正確率為86%,檢測(cè)性能上分別提升了13%和10%。
研究了無(wú)線認(rèn)知網(wǎng)絡(luò)主用戶頻譜檢測(cè)問(wèn)題,首先在循環(huán)譜域提取信號(hào)特征,然后利用隨機(jī)森林實(shí)現(xiàn)信號(hào)頻譜檢測(cè)。對(duì)比仿真實(shí)驗(yàn)結(jié)果表明,所提方法能夠?qū)崿F(xiàn)較低信噪比下的主用戶信號(hào)頻譜檢測(cè),且檢測(cè)性能優(yōu)于常用算法。研究?jī)?nèi)容為無(wú)線網(wǎng)絡(luò)頻譜檢測(cè)提供了一種新方法,下一步的研究方向是如何將該方法擴(kuò)展到多用戶無(wú)線認(rèn)知網(wǎng)絡(luò)的頻譜檢測(cè)中。