汪家興,寧宇航,洪洋
(電子科技大學物理學院,四川成都,611731)
天線作為接收和發射電磁波的裝置,在地面通信、衛星通信、遙感遙測和電子對抗等領域起到了十分重要的作用。但隨著通信電子設備的結構和設計日益復雜,需要尋找一些快速高效的電磁設計方法。傳統的天線設計過程往往需要將全波電磁仿真軟件(如CST、HFSS)和智能優化算法相結,并能得到十分精準的結果[1-3]。但是,在該過程中通常需要上千次地進行電磁仿真,對計算機資源和時間成本的巨大消耗限制了該方法的運用。
近年來,神經網絡(NN)為微波元件的建模、仿真和優化提供了一個快速和準確的模型,成為了電磁仿真軟件的一種優良替代模型[4-5]。神經網絡能對訓練樣本數據進行學習,從而逼近輸入參數和輸出參數間的非線性映射關系。對于神經網絡的訓練問題,需要使用一些特殊的算法。其中應用最為廣泛使用的是反向傳播(BP)算法[6],[7],但是卻有著容易陷入局部極小的缺點。彈性反向傳播(RP)算法的提出在一定程度上改善了這個問題[8]。此外,有學者提出將粒子群優化(PSO)算法和遺傳算法(GA)等全局尋優算法用于神經網絡的訓練以改善陷入局部最優的問題[9-11],取得了一定效果。
為了加快神經網絡訓練過程中的收斂速度、避免陷入局部極小并獲得良好的泛化能力,本文提出了一種基于梯度粒子群(GPSO)算法優化的神經網絡模型并用于了寬帶E形天線的建模和優化問題。所提出GPSO 算法是一種結合了梯度下降(GD)算法和PSO算法的混合算法,被用于前期的訓練中以獲得網絡的初始結構參量,接著用RP算法進行更加細致的網絡參量優化。本文提出的GPSO-RPNN模型與RP算法訓練的神經網絡模型(RPNN)和基于PSO-RP算法訓練的神經網絡模型(PSO-RPNN)進行了對比,驗證了GPSO-RPNN具有更快的收斂速度和更好的預測精度。
本論文采用了一個三層結構的神經網絡模型對天線問題進行建模(大多數電磁建模問題采用3層或4層的網絡結構)。該網絡拓撲模型由一個輸入層、一個隱藏層以及一個輸出層構成,每層結構之間的神經元通過權值進行連接。假設輸入層、隱藏層和輸出層的神經元個數分別m、n和l,WEn×m和WSm×l分別是輸入層到隱藏層、隱藏層到輸出層間的連接權值所構成的矩陣,bn×1、dl×1分別是隱藏層和輸出層神經元的閾值構成的矩陣,整個網絡的輸出可表示為:

其中,f1和f2分別是隱藏層和輸出層的激勵函數,X是輸入樣本矢量。通常使用Sigmoid函數作為隱藏層神經元的激勵函數,輸入層和輸出層神經元則采用一次函數作為激勵函數。在神經網絡的訓練過程中和檢測其預測精度時需要構建一個誤差評判標準,也即是需要構造一個代價函數。這里用平均絕對誤差(MAE)作為誤差評判標準,其表達式為:

其中,YSij、Yij分別是第i個樣本的第j個真實值和網絡的輸出值,M是樣本的總數量。
1.2.1 粒子群優化算法
PSO算法是一種模擬鳥群覓食行為的智能優化算法,由多個粒子集合成的群體組成,其中的每個粒子代表著一個潛在的最優解。PSO算法在尋優過程中,群中粒子在超空間中飛行,每個粒子均具有記憶性,即能記錄下自身的最優位置PB和整個群體的最優位置GB。每個粒子在每次迭代中的速度和位置由以下公式進行更新:

其中,Vi(t)和Xi(t)是第i個粒子在第t次迭代中的速度和位置,r1和r2是0和1間的隨機數,ω是慣性權重,它在整個迭代過程中是線性遞減的,采用如下公式進行更新:

其中ωmax、ωmin和T均為常數,可以根據實際優化問題進行靈活定義。
1.2.2 梯度粒子群算法
本文提出的梯度粒子群算法是梯度下降算法和PSO算法相結合所構成的混合算法。梯度下降算法(GD)對不同的線性系統優化問題表現出了高效的收斂速度和良好的精度,但對于非線性系統的優化問題則十分容易陷入局部最小,這是因為GD對非線性問題進行優化時十分依賴于初始點的選取。解決這個問題的一種方法是啟用多個初值點,將諸如PSO、GA、差分進化算法等隨機優化算法與梯度下降算法進行結合。這些隨機算法在進行優化的初始階段能夠迅速收斂,但是當收斂到最優值附近時收斂又會變得十分緩慢,將兩者有效的結合能夠發揮各自的優點。梯度下降算法對神經網中第i層第j個神經元的權值βij和閾值θij的更新規則是:

其中:YSij是該神經元的輸出,λ是學習速率。
1.2.3 GPSO-RP算法訓練神經網絡流程
本文的算法流程均在MATLAB中編寫程序實現,并利用了MATLAB調用電磁仿真軟件CST進行天線仿真和樣本采集,從而使得整個過程能夠自動完成。具體步驟如下:
(1) 確定天線的結構,在CST中進行建模并用MATLAB調用CST完成訓練樣本的采集。
(2) 確定神經網絡的結構,包括輸入層、隱藏層和輸出層的神經元個數。
(3) 初始化優化參數和確定優化問題,包括以下三個方面:第一點,確定PSO中的種群規模,最大迭代次數T以及速度、位置的上下限。第二點,采用隨機賦值的方式對神經網絡中每層神經元之間的權值WE、WS和神經元的閥值b、d進行賦值,將結果儲存在粒子中完成初始種群的構建。第三點,明確優化問題和代價函數。在優化過程中,不斷更新WE、WS、b和d,使得代價函數逐漸降低。
(4) 計算每個粒子的損失函數,更新個體最優位置PB和全局最優位置GB。
(5) 根據公式(1)和(2)計算出下一代粒子的速度和位置,產生新一代粒子。
(6) 根據公式(7)和(8)更新粒子的位置。這里可以采用并行計算的方法加快運算速度。
(7) 重復(4)~(7),直到達到最大迭代次數T。
(8) 確定RP算法的最大迭代次U,將GPSO算法優化得到的WE、WS、b和d賦給神經網絡。
(9) 用RP算法優化網絡的權值和閥值,直到達到最大迭代次數U時停止。RP算法的具體內容可以參見文獻[8],這里不再贅述。
本文提出的梯度粒子群神經網絡將被用于一種E形寬帶貼片天線[12]的建模和優化問題中,其幾何結構如圖1所示。該貼片天線是在厚度h=3.175mm的Rogers 5880介質基板上制作的,其相對介電常數為2.2,損耗正切角為0.0009。天線由同軸線饋電,饋電點距離貼片中心點的距離為dp。WR和Ps的長度已經確定,分別為WR=21mm、Ps=5.2mm。在用神經網絡進行建模時,四個設計參數dp、LS、LR、WS以及頻率f作為網絡輸入,回波損耗(S11)作為輸出。頻率范圍為4.8~6.4GHz,每組幾何結構有65個頻點。采用部分組合正交實驗設計的方法對四個設計參數進行取樣,獲得64組訓練樣本和12組測試樣本(包括65×64個訓練樣本和12×64個測試樣本),樣本中每個參數的范圍和取樣步長如表1所示。

表1 設計參數的取樣范圍和取樣步長(單位均為mm)

圖1 E形貼片天線的結構
在確定網絡結構時,輸入層和輸出層的神經元個數可以根據樣本數據的維度進行確定,而隱藏層神經元個數的選取卻缺乏理論支持。隱藏層神經元數量過多會發生過擬合,數量過少會發生欠擬合。在對該天線進行建模時,通過多次試探,最終確定當隱藏層神經元個數為12時能取得較好的預測精度。訓練過程中,種群的粒子數量為60,學習速率 λ=0.7,GPSO算法的最大迭代次數為200次,RP算法的最大迭代次數為1000次。圖2給出了用GPSO算法、PSO算法和GD算法進行200次迭代后的誤差收斂圖。由圖2可以明顯發現,GPSO算法比另外兩種單一算法訓練的神經網絡有更快的收斂速度和更低的訓練誤差,驗證了所提出的GPSO算法的有效性。經過初步訓練后,將GPSO算法優化的權值和閥值傳遞給RP算法,再進行更為細致的訓練。圖3給出了一組測試樣本的預測結果,由GPSO-RP算法訓練的神經網絡所預測的S11曲線與CST仿真得到的曲線十分一致。表2給出了RP算法、PSO-RP算法和GPSO-RP算法對相同結構的神經網絡進行了1200迭代后的訓練誤差和測試誤差(訓練樣本經過歸一化處理,輸出的預測數據反歸一化處理)。由表2可以發現,相對于單一的RP算法而言,PSO-RP算法訓練的神經網絡能夠很大程度上降低訓練誤差并提高網絡的預測精度,而本文提出GPSO-RP神經網絡能夠更進一步地降低訓練誤差和提高網絡的泛化能力。這說明GPSO-RP算法具有良好的收斂速度并有助于提高網絡的泛化能力,十分適用于天線多目標參數建模。

圖2 三種算法的誤差收斂對比

圖3 測試樣本的預測結果和仿真結果對比

表2 三種算法的訓練誤差和測試誤差對比
當神經網絡訓練完畢并獲得良好的泛化能力后,就可以用于天線的高效優化。對于算例中的E型貼片天線,用PSO算法進行設計參數的優化,最終滿足的設計指標是S11在5.3~5.85GHz內小于-10d B。粒子群算法中的粒子規模為20,最大迭代次數設置為100次,構造的代價度函數為:

優化后得到的設計參數為dp=3.575mm、LS=31.168mm、LR=2.598mm、WS=1.543mm。圖4給出了優化后的天線S11結果,并在CST中進行了仿真驗證。兩者結果基本一致,且都滿足設計指標。本文的仿真過程和算法實現過程均在一臺處理器為Intel(R) Core(TM) i7-8750H CPU, 2.20 GHz、運行內存為32GB的計算機上完成。用該設備調用CST進行一次天線仿真的平均時間為112.64s,表3給出了利用GPSO-RP算法訓練的神經網絡進行優化和直接使用CST進行優化所消耗的時間對比。由表3知,相對于直接使用電磁仿真軟件結合優化算法進行天線設計的方式,用神經網絡代替電磁仿真軟件能節約96.6%的時間,進而實現天線的多目標參數快速設計。

圖4 優化結果

表3 兩種優化方法的時間對比
本文提出了一種GPSO-RP算法訓練神經網絡并實現了對天線的建模和快速設計。所提出的算法相對于RP算法和PSO-RP算法訓練的神經網絡有更低的訓練誤差和更好的泛化能力,對實現高精度和高效的微波設計有一定價值。