趙偉豪,張君毅,2,李 淳
(1.中國電子科技集團公司 第五十四研究所,石家莊 050081;2.河北省電磁頻譜認知與管控重點實驗室,石家莊 050081)
波達方向(direction of arrival,DOA)定位技術是天線陣列信號處理領域內的重要分支,利用天線陣列接收到的來波信號就能夠有效實現準確的定位。在現有的測向方法中,以多重信號分類(multiple signal classification,MUSIC)為代表的算法具有較高的分辨力、估計精度、穩定性等優點[1]。但需要對陣列矩陣進行數學分解,如特征值分解或奇異值分解。但矩陣分解計算復雜,且運算量大,不適合實時處理,在不同陣列誤差環境下或缺少陣列流型誤差的先驗信息時進行DOA估計魯棒性較差。而相關干涉儀等算法抗干擾能力一般,在低信噪比與高幅相誤差條件下的DOA估計精度較差[2]。
基于模型的DOA估計算法性能依賴于輸入數據的響應準確程度,而基于深度學習的數據驅動架構已顯示出具有更高的估計精度,并且顯示出更低計算復雜性,增強在不同信噪比(SNR)、幅相誤差的環境下適應性。Wen lizhu等人提出了基于卷積神經網絡(convolutional neutral network,CNN)寬帶信號DOA估計模型,比DNN結構的估計時間更少,但對低信噪比信號的估計效果有待提高[3]。Ahmet M.Elbir提出了一種用于多重信號分類的深度學習框架(DeepMUSIC),設計了多個CNN,具有更高的估計精度,并且顯示出更低計算復雜性[4],但對于幅相誤差較高條件下的DOA估計的性能較差。B.Shi等人提出了一種復值卷積神經網絡(CCNN)來更好地擬合具有復雜包絡的電磁無人機信號。利用量子概率構造了一些映射函數,并進一步分析了一些可能影響復值神經網絡收斂性的因素。數值仿真表明,所提出的CCNN比卷積神經網絡收斂更快,DOA估計結果更準確、更穩健[5]。H.Huang等人通過離線學習和在線學習,提出了一種新的超分辨率DOA估計和信道估計的DNN框架。其中離線學習是利用不同信道條件下的模擬數據進行訓練,在線學習是基于當前輸入數據得到相應的輸出數據。實驗證實,基于深度學習的方法可以獲得比傳統方法更好的DOA估計。肖等人提出了一種類似于深度殘差網絡的DeepFPC網絡結構。DeepFPC在低信噪比下具有較高的稀疏信號恢復性能和良好的DOA估計性能[6]。
對于非理想的傳感器設計和制造工藝、陣列安裝誤差和傳感器間相互干擾、背景輻射等原因,以及信號接收環境和寬帶信號等苛刻條件的時候,陣列系統中存在各種缺陷,建立分析信號傳播的模型復雜困難,對DOA估計的性能產生顯著的負面影響。基于數據驅動、不需要對復雜場景和各種缺陷進行人為假設和簡化。為解決現有陣列測向方法計算復雜度高、存在陣列誤差條件下測向性能惡化嚴重等問題,提出一種基于深度學習高精度快速的DOA估計算法。設計了基于卷積神經網絡的PhaseDOA-Net網絡模型,基于深度學習的數據驅動架構通過神經網絡學習輸入和輸出數據之間的非線性關系,學習不同環境條件下信號數據與DOA之間的映射關系,將DOA預測問題轉化為回歸擬合問題,通過回歸算法找到最優擬合,提高低信噪比與存在陣列誤差時測向模型的泛化能力和容錯能力,達到更高的測向精度和更快的處理速度[5-6]。
設空間遠場有一個窄帶信號s(t)入射到天線陣列上,由M個單元組成,窄帶信號的入射角度為θ。信號接收陣列模型如圖1所示,假設參考點收到的入射波信號為:
x0(t)=s(t)ejωt
(1)
式中,ω是信號的角頻率,s(t)為信號的復振幅。設τm是陣元m收到的入射波相對于參考信號點收到的延時,有:
xm(t)=s(t-τm)ejω(t-τm)
(2)

圖1 信號接收陣列模型
對于窄帶信號,時間上慢變化,所以有:
s(t-τm)≈s(t)
(3)
同時考慮復基帶信號,可表示為:
xm(t)=s(t)e-jωτm
(4)
將M個全向陣元收到的信號數字化表示,可得到矢量表示為:
(5)
式中,
a=[e-jωτ0,…,e-jωτM-1]T
(6)
它被稱為陣列對信號源的方向矢量或導向矢量,與入射波到達方向和陣列單元的幾何位置有關[7]。
信號到達方向為θl,l=1,2,…,L,L為信號源數目。陣列接收數據模型為:
X(t)=A(θ)S(t)+n(t)
(7)
式中,陣列的接收數據X(t)=[x0(t),x1(t),…,xM-1(t)]T,信號數據矩陣S(t)=[s1(t),s2(t),…,sL(t)]T,導向矢量矩陣A(θ)=[a(θ1),a(θ2),…,a(θL)],以均勻線陣為例,式中a(θl) = [1 ,e(-j2πdsin(θl )/λ),…,e(-j2πd(M-1)sin(θl )/λ)]T,λ為信號波長,d為陣元間距,噪聲數據矩陣為n(t)=[n0(t),n2(t),…,nM-1(t)]T[8]。
為模擬真實的信號接收環境,在接收模型中引入陣列誤差。存陣列誤差在于不同的接收通道,可引用一個通道誤差矢量r,
r=[(1+ε0)ej?0(1+ε1)ej?1… (1+εM-1)ej?M-1]T
(8)
ε0,ε1,…,εM-1表示通道幅度誤差,?0,?1,…,?M-1表示通道相位誤差。
引入幅相誤差后的陣列接收數據改寫為:
X′(t)=X(t)r
(9)
針對復雜環境下對高精度快速測向的需求,提出使用卷積神經網絡方法提取信號數據的內在特征,以智能化的方法來學習不同環境條件下信號數據與DOA之間的映射關系。
分類網絡模型通常將連續值預測為屬于每個輸出類的給最高概率的類標簽,可以將預測概率轉化為類值。分類是預測離散類標簽的任務,分類模型將角度劃為不同類值,所預測的角度劃入分好的區間,并對劃分的準確度進行評估,對角度進行了“定性輸出”,模型的性能與DOA精度受限于所劃分區間。回歸模型是將輸入變量x的映射函數f近似為連續輸出變量y的任務。是預測連續數量的任務。對角度進行“定量輸出”,輸出連續性變量。顯然回歸模型更適合DOA預測任務。
本文中,我們可以將問題表述為在給定陣列接收數據時,估計目標到達角θ。為此,我們引入了如圖2所示的模型處理流程圖,該網絡模型以陣列相位差矩陣φM為輸入,以DOA為輸出。

圖2 模型處理流程圖

圖3 PhaseDOA-Net網絡結構
為學習不同環境條件下信號數據與DOA之間的映射關系,并通過模型擬合出信號角度,在本研究中提出了一個回歸網絡模型PhaseDOA-Net。測向系統性能的好壞取決于特征提取的充分程度以及系統學習效率的高低,故針對測向精度與效率的需求,通過網絡結構模塊化的設計優化上述問題。模型的網絡結構由一個過濾器大小為5*5的卷積層和兩個模塊IdentifityBlock、FPB(feature pyramid block)組成。Conv1是核大小為5*5卷積層,允許網絡以成本密集型的方式從輸入信號陣列中提取低級特征。模塊IdentifityBlock、FPB被設計用于處理從上層卷積層單元接收到的輸出特征圖,通過創建更深層的網絡來提取多維糾纏特征,提高學習效率與性能。在圖像問題中,某個區域在進行卷積運算后得到的特征可能同樣存在于其他區域。對一個特征圖中的不同區域,利用其統計學特征來替代該區域的總體特征。利用統計特征代替總體特征的做法可以顯著地減少網絡參數,降低運算量,這種操作被稱為池化。由于池化層通過壓縮數據與參數量以減少過擬合,而對于神經網絡測向問題來說,池化操作會造成多路接收信號中細微特征的丟失,故網絡沒有使用池化層。網絡模型結構如圖3所示。
圖3中IdentifityBlock用于處理從卷積層中接收到的輸出特征圖。IdentifityBlock的原理是通過創建深層次的網絡來提取多維糾纏特征,提高學習效率,它由兩個卷積層組成,每個卷積層中濾波器個數為64,大小為3*3,步幅(Padding)為2,每個卷積層之后是批歸一化層(Batch_Normalization,BN)和修正線性單元層(ReLU),BN層加速了網絡訓練的收斂性,降低了輸入信號的初始化靈敏度,修正線性單元層定義為ReLU(x)=max(0,x),解決了正區間梯度消失的問題,易于計算。隨著網絡層數的增加,梯度消失的現象會加重,且網絡訓練的效果不會很好,網絡退化等問題嚴重,故引入殘差網絡結構。在兩層或兩層以上的節點兩端短路連接,添加了一條“捷徑”,原網絡輸出的F(x)就變成了F(x)+x。當神經網絡無法再學習到高一維度特征時,該模塊的輸出變為上一層的輸入。這一改動用傳統反向傳播訓練法對深層網絡進行訓練的收斂速度快,效果更好[9]。
圖3中FPB由兩個卷積層組成,每個卷積層中濾波器個數為256,大小為3*3,步幅為1,在不犧牲特征學習效率的情況下,顯著減少可訓練參數的數量和計算成本。在FPB中采用相同的殘差連通結構,防止網絡深入時消失梯度問題。殘差結構中加入一個卷積層,濾波器個數為128,大小為1*1,步幅為1,此卷積層對特征映射進行線性投影,通過1*1的卷積得到與上一層特征層相同的通道數,發揮了通道級特征對齊和降維的作用。
兩個模塊線性連接,通過連接(串聯)層組合沿深度(或通道)維度的所有導出特征。后經過全連接(full connection,FC)層與線性(Linear)層并輸出。FC層結合了前一層學習到的所有輸入特征,以連接該層中所有預定義的神經元(或節點)。線性層將特征回歸為所期望的信號到達方向角。引入特定模塊對輸入信號進行特征提取和處理,提高網絡模型的擬合效果,用所提網絡模型自主學習相位差矩陣與DOA之間的映射關系;引入殘差網絡結構,解決了卷積神經網絡層數加深導致網絡退化的問題。
對陣列接收數據進行離散傅里葉變換,即:
(10)
在頻域內通過被測信號所在頻點處對應的相位值可得到通道相位的估計值,進而求得各通道相位差的估計值。
對于數據生成,設定信號源數目L=1,信號頻率為1 200 MHz,估計接收信號的方向為[-35°,35°],步長為0.5°,信號由間距d=0.085 m,陣元數M=16線性陣接收,快拍數為1 024。為了盡可能地仿真模擬真實的無線信號環境,在信號數據中加入高斯白噪聲,信噪比范圍[-20,20]dB,步進為5 dB,引入相位誤差,范圍[-20°,20°],幅度誤差2 dB,且服從均勻分布。該數據集包含141×9×100個信號,覆蓋141個DOA角度,9個不同的信噪比層級,其中每個信號有100個樣本,每個樣本由輸入數據數組I∈φ2×16組成。數據集被隨機分割,其中80%用于訓練,其余的用于測試。
網絡訓練的主要配置如下:優化器為Adam優化器,最大訓練輪數(epochs)為100,批大小(Batchsize)為1 024,初始學習率為0.01,并設置動態下降學習率Patience為5(當網絡訓練的損失值連續5個epochs不再下降后,學習率減少90%,保證模型在訓練后期不會有太大的波動,從而更加接近最優解,以實現更好的學習收斂)。數據集的生成和模擬是使用MATLAB R2016a完成仿真,本文提出的深度網絡在Python3.7中實現和訓練。計算服務器具有Inter Xeon Gold 6 144 CPU和兩個NVIDIA Quadro RTX 6 000 GPU。

圖5 DOA測向均方根誤差隨信噪比變化對比圖
在訓練神經網絡的過程中,一般都是先將神經網絡前向傳播,在進行反向梯度傳播更新參數。在處理多維矩陣數據時,采用傳統的神經網絡可能會由于參數過多而無法計算,而CNN通過局部感受野和權值共享減少了參數的數量以及冗余,簡化了網絡結構。網絡訓練過程中將損失函數(Loss)設置為均方誤差函數(MSE),將網絡結構輸出的θpredict和相應的標簽θlable之間的MSE通過最小化目標函數來優化網絡參數。
該過程可以用如下公式表示:
(11)
式中,len為輸出層特征長度,W和b為神經網絡層中各個連接權重與神經元偏置。采用反向傳播算法(error back propagation,BP)對進行微調。為防止網絡訓練出現過擬合,在訓練中加入了提前終止算法(Early Stop),即模型在測試集上權重的更新低于所設定的閾值,則提前終止訓練,使用上一次迭代結果中的參數作為訓練結果。
損失函數以及所預測DOA的均方根誤差隨訓練輪數變化曲線如圖4所示。在設置了動態下降學習率以及提前終止法后,初始學習率設置為0.01的學習效果最佳,Loss隨訓練輪數下降明顯,且回歸網絡收斂較快。

圖4 Loss及均方根誤差隨訓練輪數變化曲線
驗證集選用的信號方向為[-35°,35°],步長為0.1°,其他條件與訓練集相同,用于對不同算法在均勻陣列條件下DOA估計精度對比驗證。按照上面描述的算法構建PhaseDOA-Net神經網絡DOA估計模型。DeepMUSIC測向算法采用文獻[3]中介紹的方法,在其他條件相同的情況下對不同方法所測得的DOA均方根誤差(RMSE)進行對比。
DOA均方根誤差隨信噪比[-20,20]dB范圍變化對比如圖5(a)所示。在信噪比[0,20]dB范圍內,PhaseDOA-Net神經網絡算法的性能優于DeepMUSIC與MUSIC算法,干涉儀算法的DOA估計性能最差。如圖5(b)所示,在較高信噪比條件下,4種算法的RMSE波動不大趨于平穩。DeepMUSIC的性能損失是由于深度網絡中的精度損失所致。這是因為其深層網絡作為有偏估計器,無法提供更加準確的測向結果[10]。而PhaseDOA-Net神經網絡通過增加各個網絡層中的單元數、網絡層數以及改變網絡結構來緩解此問題。
在其他條件不變的情況下,在訓練過程中將輸入更改為信噪比為[-20,-5]dB數據集,來觀察網絡在低信噪比條件下對損壞輸入的泛化能力。如圖5(c)所示,可以看出PhaseDOA-Net在低SNR情況下(-20 dB)的性能優于MUSIC算法。MUSIC算法在低信噪比的條件下噪聲子空間與信號子空間劃分不準確情況下,前者與陣列流型導向矢量的正交性會受到影響,降低DOA估計精度。
在提出的PhaseDOA-Net中,所設計的IdentifityBlock和FPB模塊提高了特征學習效率,提取數據信息并建立有效的映射關系,提高了模型對不同信號條件的泛化能力,從而在多個信噪比水平回歸擬合出高精度DOA。PhaseDOA-Net在不同信噪比水平上優于所有其他模型,尤其在低信噪比情況下測向精度的提升更加明顯。
隨著無線頻譜資源的大規模使用,甚至大量采用跳頻、擴頻信號來保證信號的加密傳輸和抗干擾能力,故所提模型需適應多種頻段的測向需求,以在多頻帶場景下使用。
在信噪比30 dB的條件下,將輸入信號頻率更改為[1 000,2 000]MHz數據集作為訓練集,其中頻率步進為200 MHz,共11個頻點的窄帶數據,每個頻點的信號方向集合為[-35°,35°],步長為0.5°,并引入與2.2節相同的幅相誤差。訓練集包含141×11×100個信號,覆蓋141類DOA角度,11個不同的頻率層級,其中每個信號有100個樣本。驗證集中信號方向集合[-35°,35°],步長為0.1°,其他條件與訓練集相同,計算DOA均方根誤差來驗證網絡對輸入信號頻率的泛化能力。
DOA預測均方根誤差隨頻率變化對比圖如圖6所示,可以看出所測信號頻率越高,DOA預測均方根誤差越小。所提出的PhaseDOA-Net在寬頻帶DOA估計性能優于其他幾種測向算法。

圖6 DOA預測均方根誤差隨頻率變化對比圖
測向時間與算法的計算量相關。對于神經網絡模型的計算量可以用浮點運算數FLOPs(floating-point operations)來衡量[11]。在卷積層中,采用滑動窗實現卷積且忽略非線性計算開銷,則卷積核的FLOPs為:
Fconv=2HW(CinK2+1)Cout
(12)
其中:H、W為輸入特征的高度和寬度,K為核大小,Cin和Cout為輸入輸出通道數。全連接層網絡FLOPs為:
Ffc=(2I-1)O
(13)
其中:I為輸入維度,O為輸出維度。
而經典MUSIC算法中計算開銷主要來源于M×M的二階矩陣計算、矩陣的特征分解以及一維譜峰搜索。在Python3.7環境下分別實現PhaseDOA-Net與MUSIC算法,經計算PhaseDOA-Net的FLOPs為2.47 M,參數量為0.18 M,乘加次數MAC(multiply accumulate)是FLOPs的一半約為1.24 M次,而MUSIC算法的MAC約為2.717 M次。可以看出PhaseDOA-Net模型降低了計算復雜度。
在其他條件不變的情況下,比較了PhaseDOA-Net模型與其他DOA估計算法的計算時間。將驗證樣本數設置為3 000個,樣本角度范圍為[-30°,30°],得出各模型算法單個樣本DOA預測時間如表1所示。

表1 PhaseDOA-Net與其他算法測向時間對比 ms
由仿真結果可知,基于PhaseDOA-Net模型的DOA測向時間低于MUSIC與干涉儀算法,略優于其他智能算法。
本節通過采集實際數據來對比驗證網絡的DOA估計性能。暗室實際采集數據流程圖如圖7所示。發射天線與槽線接收天線間距為22米,符合信號采集遠場條件。發射天線采用對軸發射天線。信號源發射單音信號,發射功率0 dB。所采信號數據頻點范圍為1~2 GHz,頻率步進為200 MHz。角度范圍-35°~35°,步進為2°作為訓練與測試數據,步進1°作為驗證數據。

圖7 暗室實際采集數據流程圖
暗室數據采集環境如圖8所示。接收天線為槽線天線,陣列形式為均勻線陣,陣元個數為6陣元,陣元間距為0.085 m。多通道超短波接收存儲單元所存儲信號數據為6路I/Q數據。

圖8 暗室數據采集環境
關于信號和噪聲、陣列流型、以及信號處理環境均同時理想的假設,在現實中是較難滿足和實現的。盡管信號和噪聲條件、陣列條件、以及信號處理時所處需求條件都盡可能地追求理想,但是并不能達到最完美的狀態,可能因素包括:
1)噪聲干擾、噪聲相關性和雜波等環境復雜性的影響;
2)傳感器老化、陣元間干擾、以及陣列校正存在誤差;
3)信號處理過程需要滿足現實應用中的高速度等需求。此時,某種非理想情況的發生,會致使理想條件下提出的DOA估計算法受到現實環境和約束的相應影響與干擾,在精度或速度方面無法滿足現實需求。通過分析幅相誤差陣元位置誤差、場地誤差和噪聲等因素導致的陣列誤差,驗證智能網絡的泛化能力和容錯能力。
3.2.1 通道幅相誤差
通道誤差是影響DOA性能的一種重要因素,這里考慮角度獨立的通道誤差,主要是由于各個通道的傳輸函數的不一致導致的。由所用多通道超短波接收機的設備技術指標可知,在常溫條件下,6路通道的幅度誤差為1 dB,相位抖動為2°。
3.2.2 陣元位置誤差
由于陣列中陣元的位置存在偏差,引入的不一致性稱之為陣元位置誤差,陣元位置誤差在一般文獻中不針對性進行研究,主要是由于陣元位置誤差可歸結為通道的相位誤差[12-13]。
假設陣元模型中該陣元的位置被認為是dxn,而在實際加工的天線單元上,該陣元的實際位置為dxn+Δdxn,所以相位誤差可表示為:
(14)
由上式可得本系統中接收天線陣元位置造成的相位誤差為3°。
3.2.3 多徑效應與信噪比
暗室環境中墻壁由吸波材料填充,大幅減小了多徑效應對系統模型的影響,信源與陣列接收器之間不存在任何障礙,直接被陣列接收器接收。通過對環境噪聲的測量與對信號發射源發射功率的調整,信噪比保持在[10 dB,20 dB]范圍內。
在空域角度范圍中,把空間角度均勻劃分,形成離散角度集合。對于一維陣列,把空域角度范圍均勻劃分為離散的角度,角度間隔劃分過小會增大訓練難度,并且使實際采集的工作量急劇增大,而劃分過大會降低網絡的DOA估計精度。實采數據集角度范圍設置為[35°,35°],間隔為2°,包含36×11×100個信號,覆蓋36個DOA角度,11個不同的頻率層級,將實際采集存儲的6路I/Q數據進行數字信號處理。首先對數據進行采樣,采樣點設為1 024,得到信號數據X6×1 024,可得到相位差數據φx作為算法訓練與驗證數據。數據集被隨機分割,其中80%用于訓練,其余的用于測試。
網絡訓練的主要配置如下:優化器為Adam優化器,最大訓練輪數(epochs)為80,批大小(Batchsize)為1 024,初始學習率為0.01,并設置動態下降學習率Patience為5。基于實采數據的深度網絡在Python3.7中實現和訓練。
驗證實驗一:將驗證集中信號頻率設置為1 200 MHz,快拍數為1 024,信噪比為15 dB。角度范圍設置為-35°~35°,角度間隔設置為1°為了避免實驗的偶然結果,采用100次蒙特卡洛仿真實驗,包含71×100個信號,覆蓋71個DOA角度。在100次蒙特卡洛仿真實驗后得到的估計角度與實際角度的平均誤差作為最終驗證的角度誤差結果。
基于實采數據的DOA精度驗證結果如圖9所示,圖中根據DOA真實值與預測值的誤差進行對比,查看估計結果與真實位置之間的差距。

圖9 基于實采數據的DOA精度驗證結果
上述實驗條件下,干涉儀方法的預測結果與真實值的位置差距較大,估計結果與真實角度的差值范圍在0.09和0.94之間,且波動較大,多個位置預測角度嚴重偏離正確位置,DOA估計精度較差。通過MUSIC方法預測的角度雖然也有部分預測值位置遠遠偏離真實位置,但對比干涉儀方法,數量上有所減少。DeepMUSIC、DNN測向誤差較傳統方法較小,而使用PhaseDOA-Net神經網絡模型預測的結果誤差最小,估計結果與真實角度的差值范圍大多集中在0.02和0.47之間,準確度優于其他方法。
驗證實驗二:將驗證集中信號頻率設置為[1 000,2 000]MHz,頻率步進為200 MHz,每個頻點下快拍數為1 024。角度范圍設置為-35°~35°,角度間隔設置為1°,同樣采用100次蒙特卡洛仿真實驗,統計各個頻點下DOA估計均方根誤差,對網絡性能進行驗證。通過驗證得到各算法隨頻率的均方根誤差如圖10所示。

圖10 實采信號測向均方根誤差隨頻率變化對比圖
由圖10可以觀察到,PhaseDOA-Net網絡模型在各個頻率范圍的DOA估計精度均優于其他方法,且頻點頻率越高,所測得的均方根誤差越小,與仿真得出結果一致。
針對復雜環境下對高精度快速測向的需求,為解決現有陣列測向體制計算復雜度高、存在陣列誤差條件下測向性能惡化嚴重等問題,開展基于智能方法的高精度測向技術研究。本文提出基于PhaseDOA-Net網絡模型的高精度快速DOA估計算法,提高了低信噪比環境下DOA估計方法的魯棒性,改善了神經網絡的泛化能力。通過實際驗證比對,所提算法性能在低信噪比環境中不僅優于現有的MUSIC算法與相關干涉儀算法,與其他基于深度學習的DOA估計算法相比也具有一定優勢。而且在陣列誤差條件下也表現出了很強的魯棒性,驗證了PhaseDOA-Net測向方法對陣列誤差的泛化能力和容錯能力,在保證了測向精度的同時,在測向時間上也表現出優異的性能。