徐逸群,張邦寧,張曉凱,郭道省
(陸軍工程大學通信工程學院,江蘇 南京 210007)
無線環境地圖(Radio Environment Map,REM)能夠為認知無線電系統提供多域環境信息和先驗知識[1-2],可以用于解決網絡規劃、干擾協調、功率控制和動態頻譜接入等問題。REM構建的基本任務是從空間離散分布的頻譜感知設備獲取的無線電監測數據,推理沒有感知節點位置的信號強度。
現有研究中REM構建的算法主要有近鄰(Nearest Neighbor,NN)插值法、逆距離加權近鄰(Inverse Distance Weighted Nearest Neighbor,IDW-NN)插值法[3-5]和基于空間統計學的克里金(Kriging)插值法[3,5-10]。其中,NN和IDW-NN沒有嚴密的數學理論支持,但是算法的實現較為簡單,易于理解且計算量較小;克里金算法有嚴密的數學推導,保證了其最佳線性無偏性,但該算法基于平穩性假設,即感知數據之間的相關性僅僅與2點之間的距離相關,該假設是對現實世界的極大簡化。這些構建算法都沒有考慮復雜環境對電波傳播的影響。
近年來,群智頻譜感知(Crowd-sourced Spectrum Sensing,CSS)技術受到廣范關注[11-12],該技術利用現有移動通信網絡中的移動通信終端來執行頻譜感知任務。NN能夠提供海量數據,如何從這些數據中提取有用信息,提升REM構建的準確性,值得深入研究。
REM構建的準確性,受到2個重要因素的制約:一是所研究的環境的復雜性,復雜的地形地物對電波傳播的影響較大,待估計位置的信號與已測量位置的信號之間的相關性受到不同環境的影響呈現出空間異構的相互關系;二是采集數據的位置和數據量,一方面需要更多的數據以提升準確性,另一方面在實際監測系統中,采集更多數據帶來額外的系統開銷,提升了數據處理分析難度。因此,需對數據采集的位置進行優化,在提升準確率的同時盡可能減少冗余數據。
本文提出一種新穎的基于變換核高斯回歸模型的REM構建算法,該算法以高斯過程(Gaussian Processes,GP)為基本框架,考慮了環境異構性對REM構建的影響,能夠從群智感知數據中學習環境異構性信息。此環境異構性信息是進行空間數據選擇的重要前提,因此在所提模型基礎上,利用獲取的空間異構性信息,提出了2種無線電頻譜監測空間選點方案,進一步提升REM構建的準確性,并通過數據選擇降低系統開銷和數據冗余。
對某二維平面空間內群智感知設備的數據進行研究,不失一般性,假設此二維平面區域為1 km×1 km的范圍。區域內的感知設備將其位置和測量的接收信號強度上報給融合中心。
REM構建的主要任務是推理沒有感知設備位置的信號強度,進而繪制該區域的功率譜密度圖。在實際信號強度測量過程中,采用長期測量的方法以消除小尺度衰落和噪聲的影響,得到的平均接收信號強度可分解為3個部分,分別為自由空間傳播路徑損耗、陰影效應和測量設備導致的誤差,如式(1)所示:
(1)
式中,Pt為發送功率;d0為參考單位距離;λ為波長;η為自由空間傳播損耗因子;Lt為信號源位置;lj為第j個感知設備的位置;Sj為信號源至第j個感知設備的陰影衰落分量;Nj為第j個感知設備的測量誤差。
自由空間傳播損耗可以通過鏈路計算得到,因此REM構建的困難在于陰影效應引起的電波傳播變化。在無線通信系統中,考察單個接收點的陰影效應時,通常將其建模為一個服從對數正態分布的變量。文獻[13]針對空間陰影效應的空間相關性進行了詳細的研究,通過將構建的空間損耗場模型與實測數據對比,證明了發射源相同而接收點接近時,空間陰影效應有較強的相關性。有學者將這種相關性運用于REM的構建中[8-9],以提升REM構建的準確性。
以前的研究中,空間相關陰影效應被建模為一個各向同性且平穩的過程,此假設可以等同為假設電波在空間中傳播受到的影響是相同的,即傳播環境是勻質性的。而實際上,電波傳播環境十分復雜,特別是在城市區域,由于信號傳播的陰影效應影響,不同位置數據之間的相關性不僅僅取決于二者之間的距離。復雜的環境提升了空間推理的難度,由于環境的異構性,要提升REM構建的準確性,應將空間內陰影效應分量建模為各向異性和非平穩的過程。本文研究的算法旨在表征環境的異構性,以進一步提升空間頻譜推理的準確性。
此外,由于數據的空間相關性,某一點的數據可以提供其臨近點的信息。從信息熵的角度考慮,在空間內每增加一個感知節點,即可降低該區域的不確定性。然而,當區域內感知節點密集到一定程度時,新增節點提供的信息熵越來越小,增加感知節點的性價比逐漸降低。同時,由于環境的非勻質性,在某些地形、地物環境不太復雜的區域內,只需要少量的感知設備即可表征該區域內的信息;而在地形、地物環境較為復雜的區域內,則需要布置更多的感知設備。由于空間環境的復雜性,實際應用中,監測數據的空間位置也會對REM構建結果產生影響。因此,應根據環境異構性信息設計相應的頻譜監測設備的選點方案。
REM構建的本質是一個復雜的回歸任務,而GP由于其靈活性,特別適用于此類任務。作為機器學習領域的一個重要工具,GP近來年得到了廣泛的研究[14-18]。
GP回歸參數的訓練通過最大化邊際似然函數來完成。邊際似然函數表示為:

N(y|0,Σθ),
(2)
則負邊緣對數似然函數(Negative Log Marginal Likelihood,NLML)表示為:
L(θ)=-lnp(y|X,θ)=
(3)
式中,det(·)表示矩陣的行列式。
GP訓練過程被構建為下列非凸優化問題:
(4)
通常,使用基于梯度下降的優化算法,尋找NLML的最優解。
GP的核函數隱含了關于建模的函數f所屬類別的假設[17],等同于學習算法中的“歸納偏好”。在此意義上,關于模型的先驗知識,可以通過GP的核函數嵌入到GP回歸模型中。有一些常用的基礎核函數,如線性核函數、徑向基函數核函數、周期核函數、Matern核函數和譜混合核函數等[18]。核函數的設計和選擇對GP回歸模型的性能有很大的影響。例如,線性核函數推斷出的模型函數f為線性函數,周期核函數推斷出的模型函數f具有周期化的結構。
Wilson提出的深度核學習(Deep Kernel Learning,DKL)將深度架構的表示能力封裝到GP中,具有利用數據學習核函數的能力。DKL從一個參數為θ的基本核函數k(xi,xj|θ)開始,利用權重參數為w的深度神經網絡(Deep Neural Network,DNN)對原輸入進行非線性變換,將基礎核函數轉化為:
k(xi,xj|θ)→k(h(xi,w),h(xj,w)|θ,w),
(5)
式中,h(·)為DNN的非線性變換。DKL大幅度提升了GP的表示能力,并通過優化GP的邊際似然函數為核函數提供自動學習功能。但是,在某些情況下,DKL算法的穩定性較差,GP會嘗試利用DNN的靈活性在所有的輸入數據之間建立相關性,同時DKL中的DNN容易產生過擬合[19]。
在GP中引入非平穩性的一種方法是引入一個非線性變換h(x),將空間D中的輸入x變換到一個新的空間D′中[14]。在DKL中,DNN是用于變換輸入空間的非線性變換,且該線性變換由DNN的權重參數表征。然而,在空間頻譜推理問題中,模型的輸入是感知設備的位置信息,所表示的空間是實際的物理空間。用DNN對該空間進行非線性變換易引起空間折疊效應,不適用于本節研究問題中的物理量。因此,DKL雖然有強大的表示力和從數據中學習核函數的能力,但不適用于REM構建問題。
受到DKL的優缺點的啟發,解決REM構建問題應設計一個具有以下特性的非線性變換:
① 非線性變換能夠通過一些參數來表征,通過變化參數值可以改變非線性變化的形態,以使其具有一定的表示能力,可以靈活地表示各向異性和非平穩性;
② 非線性變換應是單射,具有拓撲同胚性,從而不會引起空間折疊效應。
通過設計3種簡單的具有上述特性的非線性變換,并將這3種簡單的非線性變換組合起來,可以構造一個靈活的非線性變換來表征空間異質性。下文將詳細說明這3種變換。
為了清楚表述,某一點在二維空間的位置表示為s=(s1,s2);α,β和γ表示非線性變換的超參數,超參數的值在模型設計時根據具體研究問題的范圍和復雜度選擇確定;用w和w,或二者加下標表示的權重參數決定非線性變換的具體形態,權重參數的取值在模型訓練過程從感知數據中學習獲得。
坐標軸變換單元(Axial Transformation Unit,ATU)是指對多維數據的其中一個維度(即其中一個坐標軸)進行獨立的非線性變換,通過一下步驟實現:
① 以二維空間為例,將輸入數據的位置坐標信息歸一化至[0,1]或[-1,0],為方便區分,可以將橫軸歸一化至[0,1],縱軸歸一化至[-1,0]。
② 對某個維度的ATU通過一系列基函數φ(sk)的加權和來實現,ATU的基函數如圖1(a)所示,分別對2個維度進行坐標軸變換的示例如圖1(b)和圖1(c)所示。其中,第一個基函數斜率為1的線性變換函數φ1(sk)=sk,其余基函數為平移的Sigmoid函數:

(a)ATU的基函數
(6)
式中,參數αi1決定了Sigmoid函數的梯度;αi2決定了Sigmoid函數的偏移位置;r為Sigmoid函數的數量,決定了在[0,1]內非線性變換的分辨率,該分辨率也決定了非線性變換的表示能力,當環境較為復雜、局部特征較多時,可以增大該分辨率,用更多的Sigmoid函數構成非線性變換。
③ 將變換后的值歸一化至[0,1]或[-1,0]。
由于Sigmoid函數的單調性,如果將所有權重參數限制為正值,則可以保證ATU是由[0,1]→[0,1]或[-1,0]→[-1,0]的單射非線性變換,且該變化具有一定的靈活性,可以通過權重參數控制變換的具體形態。維度1的ATU計算結構如圖2所示,其中表示歸一化。

圖2 維度1的ATU計算結構
綜上,將對輸入向量的第k維的ATU定義為:
(7)
(8)
式中,
(9)

徑向基函數變換單元(Radial Basis Function Transformation Unit,RBFTU)是對原空間局部擴展或者壓縮,該變換定義為:
fr(s;wr,β,γ)=s+wr(s-γ)e-β‖s-γ‖,
(10)
式中,超參數γ=(γ1,γ2)是局部擴張或者壓縮的中心點;超參數β可以控制局部擴展或者壓縮的邊界;權重參數wr決定擴張或者壓縮的程度。若將權重參數wr限制在(-1,e3/2/2),則可確保該變換為單射[20]。RBFTU的計算結構如圖3所示。

圖3 RBFTU的計算結構
中心位置在(0.25,-0.125)的RBFTU示例如圖4(a)所示,通過選擇不同的超參數γ和β,并將不同的RBFTU級聯在一起,可以構造整個空間范圍內不同局部壓縮和擴張的非線性變換,如圖 4(b)所示。研究環境較復雜時,可以增加級聯的RBFTU的分布密度。

(a)單個徑向基函數變換的影響區域范圍
莫比烏斯變換是在復平面上的一對一的可以映射到自身的保角變換[21]。令z=s1+s2j,(j2=-1),莫比烏斯變換單元(Mobius Transformation Unit,MTU)可以定義為:
fm(s;wm)=(R[gm(z)],I[gm(z)]),
(11)
式中,
(12)
a,b,c,d是滿足ad-bc≠0的復數。MTU的權重參數為:
wm=[R(a),I(a),R(b),I(b),R(c),I(c),
R(d),I(d)]。
(13)
MTU的計算結構如圖5所示。

圖5 MTU的計算結構
MTU變換一個二維空間D2=[0,1]×[0,1]內的一個正方形棋盤形狀的示例如圖6所示。從式(12)可以推導出gm(-d/c)=∞,因此,為了確保D2內的點不會映射至∞,必須將-d/c限制在復平面上由點[0+0j,0+1j,1+1j,1+0j]包圍的區域內。

圖6 MTU示例
上述3種基本變換單元都滿足本節提出的2種基本性質,可以作為構建二維空間內的復雜非線性單射同胚變換的基本模塊。可以根據實際應用場景的不同,設計并選擇這些變換的不同組合對原空間內的核函數進行變換。同時,所有的權重參數:
(14)
可以與GP的基礎核函數的參數一起,通過最小化GP的NLML,從數據中學習得到參數的具體取值。
變換核高斯回歸(Transformed Kernel Gaussian Process Regression,TKGPR)模型如圖7所示。構建的TKGPR模型包含維度1的ATU、維度2的ATU、一系列的RBFTU的級聯和一個MTU,這些基礎變換一起構建出對原始二維空間的單射非線性變換,最后,將變換后的結果輸入GP得到輸入點的信號強度的概率分布。

圖7 TKGPR模型
組合成的非線性變換可以用復合函數表示為:
(15)
從僅有參數σ2和l的基礎核函數:
(16)
開始,用非線性變換轉換原始核函數:
k(si,sj;σ,l)→k(h(si;W),h(sj;W);σ,l,W),
(17)
式中,h(s;W)為由參數W決定的合成的非線性映射。
將此算法命名為變換核學習(Transformed Kernel Learning,TKL)。在實際應用中,可以根據研究區域的情況選擇基本變換的組合方式以及每個基本變換單元的超參數的數量,使得模型的復雜度與待研究區域內環境的復雜度相一致。
使用群智感知數據進行REM構建主要存在以下幾點問題:① 群智感知終端是利用用戶移動通信設備進行數據采集,設備能力較弱、數據精確度不高;② 大量群智感知設備提供了大量的冗余數據,在模型訓練階段大量的數據可以更好地訓練GP模型,而在REM預測階段冗余數據提供的信息量有限,帶來了數據處理的計算壓力;③ 由于用于終端運行感知任務會帶來額外的電量消耗,用戶不愿意長期運行于數據感知狀態,雖然有學者針對群智感知設備的運行成本進行優化設計,但利用大量用戶長期進行感知還是會產生額外的經濟消耗。
針對上述問題,本節研究的場景為:在模型訓練階段,通過利用N個群智感知節點的數據結合TKGPR模型獲取當前研究區域內的環境異構性信息,即該區域內的變換核函數參數。由于區域內的地形、地物短時間內變化較小,可以近似為不變。因此,估計出的變換核函數參數可以繼續用于REM的構建過程。在構建階段,考慮采用2種方式:一種是設置專用的頻譜采集設備獲取更高精度的測量數據,在此區域內布置k(k?N)個專用的監測節點以取代群智監測的方法;另一種是在大量群智感知中選擇k(k?N)個點的數據用于空間推理,獲取實時的REM狀態,以降低數據獲取成本和需處理的數據量。
本節提出2種基于TKGPR模型的頻譜監測空間選點算法,分別為基于貪婪算法的互信息最大化(Greedy-based Mutual Information Maximum,GMIM)空間選點算法和基于變分推斷(Variational Inference,VI)的空間選點算法。
2種選點算法同樣基于GP,GMIM利用GP模型的核函數進行選點,將訓練產生的核函數作為算法的輸入條件。GMIM算法流程如圖8所示。VI算法是通過改變GP回歸模型的優化目標進行選點,將TKGPR模型訓練過程和空間選點過程結合起來,以證據下界(Evidence Lower Bound,ELBO)作為算法優化目標以自動完成空間選點,基于VI的選點算法流程如圖9所示。下面詳細闡述2種空間選點算法。

圖8 GMIM算法流程

圖9 基于VI的選點算法流程
首先,將研究區域網格狀離散化,并將選點問題定義為:在R2空間內的有限大小的子集V內選取k個最優的位置,其中V為離散化得到的可能選擇的位置,假設選擇的最優的k個點組成集合A,則沒有感知設備的點表示為VA。網格狀離散化點集示意如圖10所示,空間離散化的所有點構成點集V,紅色點為點集A,藍色點為點集VA。

圖10 網格狀離散化點集示意
將空間選點的優化目標定義為選擇的k個點能夠盡可能預測沒有感知節點位置處的數據,即尋找一個A*能夠最大程度降低沒有感知設備位置處數據的熵:
(18)
式中,H(·)為隨機變量的熵。式(18)等同于最大化點集A處的隨機變量和點集VA處隨機變量的互信息量I(yA;yVA),為簡化表示,定義選擇點集A后的互信息量為:
MI(A)=I(yA;yVA)。
(19)
對互信息量進行優化是一個NP-完全問題,無法在多項式時間內找到最優解,因此,考慮采用貪婪算法逐個增加監測點以獲取此問題的次優解。假設下一個選取的點為z,最大化增加該點后提升的互信息量:
MI(A∪z)-MI(A)=H(yA∪z)-H(yA∪z|yV(A∪z))-
[H(yA)-H(yA|yVA)]=
H(yA∪z)-H(yV)+H(yV(A∪z))-
[H(yA)-H(yV)+H(yVA)]=
H(yz|yA)-H(yz|yV(A∪z))。
(20)

(21)
基于貪婪算法的互信息最大化監測設備選點算法如算法1所示。

算法1:基于貪婪算法的互信息最大化監測點選擇算法輸入:協方差矩陣ΣVV,監測點數目k,可選位置集合V輸出:選擇的監測點位置集合A1:將集合A設置為空集?2:for j=1→k do3: for z∈VA do 4: δz←σ2z-ΣzAΣAAAA-1ΣAzσ2z-ΣzA-ΣA-A--1ΣA-z5: end for6: z?←argmax7: A←A∪z?8:end for
在研究空間內需要選擇M個點,假設這些選擇的測量點組成的向量為:
Z=[z1,z2,…,zM],
(22)
這M個點的取值可以表示為:
u=f(Z)。
(23)
為了使從這M個點的數據得出的高斯過程f的后驗分布盡可能接近利用所有的數據得到后驗分布,假設qφ,θ(f)為通過數據(Z,u)得出的f的后驗概率分布,φ為引入的變分參數,該參數包括分布qφ,θ(f)的均值、方差,以及M個點的位置信息。為了使得qφ,θ(f)盡可能接近利用所有數據獲取的后驗概率分布,使用KL散度表征其與所有數據的后驗概率分布pθ(f|y,X)的距離:
KL(qφ,θ(f)‖pθ(f))-lnpθ(y|X)。
(24)
調整式(24)兩邊各項位置可得:
KL(qφ,θ(f)‖pθ(f)),
(25)
式(25)左邊第1項為GP的對數邊緣似然函數(Log Marginal Likelihood,LML),第2項為從m個數據得到的f的后驗概率分布與所有數據得到的f的后驗概率分布的KL散度;式右側定義為ELBO[14]。由于KL散度的取值為非負值,當:
qφ,θ(f)=pθ(f|y,X),
(26)
時,左側的KL散度取值為0,ELBO的值等于對數邊緣似然分布,因此ELBO為LML的下界。在GP中,通常設置LML為優化目標,將問題轉化為優化對數邊緣分布的下界,即:
(27)

(28)
式中,第I部分可以通過下列推導表示為:
(29)
因此,式(28)可表示為:
KL(qφ(u)‖pφ,θ(u))。
(30)
假設變分分布為多元高斯分布:
qφ(u)~N(μu,Suu),
(31)
則式(30)右側可以用閉式表達式表示。同時,式(30)表明,可以使用批量梯度下降算法,完成模型的訓練。在優化ELBO的同時,可以得到TKGPR模型各個參數的取值,以及變分參數的取值,其中包括各個點的位置信息。
4.1.1 模型構建
選擇TKGPR模型的超參數如下:2個ATU的分辨率取值都為20,級聯的RBFTU以9×9的方式均勻分布在二維空間內,每個RBFTU的邊界與臨近RBFTU的中心點相交以確保變換對整個區域的覆蓋,選擇徑向基函數(Radial Basis Function,RBF)為GP的基礎核函數。按此方法構建的TKGPR模型有133個控制參數。每個ATU有21個參數,級聯的RBFTU共有81個參數,MTU有8個參數,RBF核函數有2個參數。在實際使用中,可以根據研究問題的復雜度選擇構建空間非線性變換的參數數量。
4.1.2 訓練和推理過程
TKGPR模型的訓練集為{X,y},X為群智感知設備的位置,y為接收信號強度。利用反向傳播算法進行模型訓練,并借助“PyTorch”用GPU加速訓練模型訓練過程。根據式(3)和式(17),將TKGPR的NLML作為損失函數,可以表示為:
(32)
通過鏈式法則得到參數的梯度:
(33)
最后,利用訓練好的模型參數,可以得到無感知終端位置處的接收信號強度的預測分布。該預測分布不僅僅得到預測的結果,同時還提供了結果的不確定性度量,這是GP優勢之一。
4.1.3 性能分析對比
在仿真分析中,模擬了區域為1 km×1 km范圍內180×180個點的陰影效應分量,并選擇該區域內均勻隨機分布的若干點作為群智感知設備的感知數據。利用感知數據,采用NN、IDWNN、普通克里金(Ordinary Kriging,OK)、GP和本節提出的TKL算法,恢復了該區域內陰影效應分量。實驗表明,當NN和IDWNN算法參與計算的鄰居節點數量大約為20時,其估計性能較好,因此選擇鄰居節點數為20與其他算法進行對比。OK算法的性能由選擇的變差函數形式決定,本文參考文獻[8]使用指數半變差函數。
使用500個群智感知設備,用不同算法恢復的區域內的陰影效應及真實陰影效應的對比如圖 11所示,圖11(a)為群智感知設備的觀測值,圖11(b)為真實的陰影效應分量,圖11(c)~圖11(g)分別為NN,IDWNN,OK,GP及本節提出的TKL算法的恢復結果,該圖提供了不同算法空間推理結果的直觀印象。

(a)測量點數據
進一步,通過與實際陰影效應分量進行對比,用4個指標衡量算法的性能,分別為均方根誤差(Root Mean Square Error,RMSE)、連續分級概率評分(Continuous Ranked Probability Score,CRPS)[22]、正確檢測區域比例(Correct Detection Zone Ratio,CDZR)和虛警區域比例(False Alarm Zone Ratio,FAZR)[1]。
RMSE用于評估點估計的結果,CRPS將平均絕對誤差推廣至概率預測場景下,是一種廣泛應用于當預測結果為概率分布而觀測結果為確定值時的評價指標,可以理解為預測分布與在真實確定值點處的退化分布之間(單位階躍函數)的平方積分距離:

(34)

不同算法RMSE和CRPS隨群智感知設備數量變化的曲線如圖 12和圖 13所示。

圖12 不同算法RMSE隨群智感知設備數量變化的曲線

圖13 不同算法CRPS隨群智感知設備數量變化的曲線
可以看出,GP和OK算法的RMSE大致相同,而GP有更好的CRPS。由于GP和OK算法都基于環境同質性的假設,因此預測分布的平均值大致相同。當群智傳感器的數量大于 400 時,所提出的 TKL算法優于所有其他算法。TKL 算法可以從感知數據中學習環境信息,并將此信息隱含在非線性變換的參數中,為其準確性提供了性能增益。當群智感知設備的數量較少時,TKL算法性能較差,這是因為局部區域內的感知設備太少,導致算法無法捕捉到環境的異質性。
CDZR和FAZR的對比分析如圖 14和圖 15所示,分別展示了不同算法的CDZR和FAZR隨研究區域內群智感知數量變化的曲線。同樣,當研究區內的群智感知設備的數量超過400,算法可以捕捉到局部環境的異質性時,提出的TKL算法的CDZR高于其他算法。TKL算法的FAZR略低于OK和GP算法,但若將FAZR和CDZR聯合起來進行評估,可以發現,算法以較小的FAZR損失換取了較大的CDZR的提升。這也符合認知通信系統的設計原則,即避免對主用戶的影響比頻譜利用機會的提升更加重要。

圖14 不同算法CDZR隨群智感知設備數量變化的曲線

圖15 不同算法FAZR隨群智感知設備數量變化的曲線
同時,在模型訓練過程中發現TKL算法不易過擬合,它保留了GP不易過擬合的固有特性[14]。另外,與DKL中的DNN不同,TKL算法中的非線性變換受限于幾種單射映射,增加了GPR模型的靈活性,而不會引起DKL中的病態效應[19]。在這些算法中,TKL 的復雜度最高,但由于網絡和數據采集技術的發展,可以獲取的數據量呈爆炸式增長,且計算機的算力也在不斷得到提升。因此,此類算法的實現成為可能,具有很好的應用前景。
4.2.1 仿真實驗設置
在GMIM算法中,需要從有限的點集內選擇頻譜監測點,因此將研究空間離散化為40×40的柵格狀點陣,作為待選擇的頻譜監測點集V,從中選擇100個監測點。在模型訓練階段,使用2 000組群智感知數據,訓練TKGPR模型,以獲取研究區域內的1 600個柵格點的協方差矩陣,作為GMIM算法的輸入條件。
在VI算法中,使用同樣的2 000組群智感知數據,將待選點的初始位置設為10×10矩形柵格狀均勻分布的點,通過優化ELBO在訓練TKGPR模型的同時,優化這100個點的位置變量。
區分2種應用場景,將所提算法與均勻隨機選點進行分析對比。2種應用場景分別為:① 監測點和待估計點為有限個離散點集時;② 監測點選擇的自由度較高,而需要使得整個區域內推理的平均誤差較低時。
對5種情況進行了仿真實驗,分別為:
① GMIM算法選擇點集A后,對點集VA處的數據進行推理;
② 在點集V中均勻隨機選點選擇點集A后,對點集V/A處的數據進行推理;
③ GMIM算法選點后,對整個區域進行推理;
④ VI算法選點后,對整個區域進行推理;
⑤ 在整個區域內均勻隨機選點后,對整個區域進行推理。
4.2.2 選點結果和性能對比
圖 16為真實陰影效應,可用于與不同算法的頻譜推理結果進行對比。圖 17~圖 21為上述5種場景下的選點和空間頻譜推理結果。通過與區域內真實的陰影效應分量進行對比,發現:① 幾種選點方案的預測均值與真實值相比都損失了部分細節成分,但都能大體恢復出區域內的陰影效應分量的真實值;② 當需推理點附近有監測數據時,則該位置的預測方差較小;反之,當距離最近的監測點較遠時,預測方差較大;③ VI選點算法得到預測均值最接近真實值,且區域內方差整體較小。

圖16 真實陰影效應

(a)GMIM選點及預測均值

(a)均勻隨機選點及預測均值

(a)GMIM選點及預測均值

(a)VI選點及預測均值

(a)均勻隨機選點及預測均值
為了對比不同場景下的算法性能,在使用RMSE和CRPS兩種評價指標對上述5種場景的空間頻譜推理性能進行了量化對比分析,如圖22所示。仿真結果表明,在有限個可數點集范圍內進行選點,GMIM空間選點算法與均勻隨機選點相比,REM構建的RMSE可以降低1.23 dB,CRPS值降低0.64;對整個空間任意位置進行選點時,VI空間選點算法與均勻隨機選點相比,REM構建的RMSE可以降低1.56 dB,CRPS值降低0.73。GMIM是針對有限個點的點集設計的優化方案,當待預測點不在GMIM算法研究的點集V內時,其性能不能得到明顯提升,而VI選點方案對整個區域進行頻譜推理時性能提升明顯。

圖22 不同選點算法的REM構建性能
綜上,GMIM選點算法適用于可選點集和待預測點集為已知的離散點。在實際REM系統建設中,某一區域內設置頻譜感知終端往往受到其他因素的限制(如建筑物的位置、設備網絡接入等),僅能在有限個待選點中選擇,結合系統需關注的待預測點,可以采用GMIM算法進行感知設備的選點規劃。而VI選點算法能夠大幅度提升整個區域內頻譜推理的平均性能,但在實際系統建設實踐中,VI算法得到選點位置可能會因為其他因素而無法設置感知節點。
本文提出了一種考慮環境異質性的TKL算法來處理空間頻譜推理問題。主要思想是構造由參數表征的非線性單射變換來表示空間各向異性和非平穩性,結合GP建立TKGPR模型,利用梯度下降算法學習非線性映射和GP的參數,然后將訓練好的模型用于空間頻譜推理。受DKL啟發的 TKL算法具有以下優點:首先,不同于DKL中DNN的非線性變換,構造的單射變換可以保持空間的拓撲結構。其次,在訓練過程中不容易過擬合。結果表明,當群智感知設備的數量較多,局部空間內分布的采樣數據密度較高時,空間頻譜推理的性能得到顯著提高。
在利用本文所提模型表征環境異構性的基礎上,同樣基于GP,提出了2種感知設備選點算法:基于貪婪算法的互信息最大化選點算法和基于變分推斷的頻譜感知設備空間選點算法。仿真表明,采用這2種選點算法與均勻隨機設置監測點相比得到的空間頻譜推理性能有所提高,其中VI算法推理的誤差最小。2種算法都基于合理的數學分析和理論推導,有各自不同的應用場景,為REM構建中頻譜監測設備空間選點問題提供了新的研究思路。
本文研究表明,GP方法適用于解決REM構建中的空間頻譜推理問題。當前,將GP與深度學習算法相結合成為新的研究熱點,將二者結合用于REM構建值得進一步深入研究。此外,本文重點圍繞空間維度頻譜數據進行分析,空時維度聯合的頻譜數據已經受到廣泛關注,如何聯合多維度的信息進行聯合推理將成為本領域相關課題研究的重點。