劉文進, 許馨水, 南敬昌, 高明明
(遼寧工程技術大學 電子與信息工程學院,遼寧 葫蘆島 125105)
由于超寬帶(ultra-wideband,UWB)系統傳輸信號的頻寬很寬(3.1~10.6 GHz),覆蓋了其他窄帶信號頻段[1,2],學者通過在UWB天線的輻射單元上開槽[3,4]等方法引入了陷波功能,來避免窄帶信號產生的電磁干擾。然而依靠傳統的計算機輔助設計(computer aided design,CAD)輔助軟件設計優化UWB天線計算量大、耗時長,因此借助神經網絡建立天線行為模型具有重要的研究意義。Elman神經網絡作為一種典型的動態遞歸神經網絡[5],既能實現靜態系統的建模,也能實現動態系統的映射并直接反映系統的動態特性,被廣泛應用于各個領域。量子粒子群優化(quantum particle swarm optimization,QPSO)算法是孫俊等人[6,7]通過建立量子勢阱的粒子群模型提出的一種群智能優化算法,能夠有效優化神經網絡的參數。為了實現更加快速高效建模,本文基于引入維數搜索策略(search for dimension policies,SD)的QPSO(SDQPSO)算法,建立SDQPSO-IElman神經網絡智能模型,并應用到一種雙陷波UWB天線中實現精確建模。
粒子群優化(particle swarm optimization,PSO)算法是將待優化問題可能產生的K個解表述為N維目標搜索空間中飛行的粒子,每個粒子根據其他粒子和自身飛行經驗動態調整飛行狀態,不斷靠近種群中當前位置最優的粒子,并通過軌道模型[8]的形式實現收斂,在此過程中粒子的最大速度會限制每次的運動面積,不能保證粒子的運動范圍覆蓋整個可行空間。QPSO算法是一種基于PSO算法框架的隨機并行概率搜索算法,受量子計算原理中的概率優化算法的啟發,認為粒子具有量子行為,粒子在量子化的吸引勢場中,受引力的作用產生束縛態,形成種群聚集性,使每個粒子收斂到它的吸引點
pi=[pi,1,pi,2,…,pi,N],i=1,2,…,K
(1)
第i個粒子的位置為
Xi(T)=[Xi,1(T),Xi,2(T),…,Xi,N(T)],
i=1,2,…,K
(2)
種群中粒子能夠搜索到的個體最優位置為
Pi(T)=[Pi,1(T),Pi,2(T),…,Pi,N(T)],
i=1,2,…,K
(3)
群體的全局最好位置為
G(T)=[G1(T),G2(T),…,GN(T)]
(4)
在T時刻勢阱中第i個粒子的中心位置坐標為
pi=φ×Pi(T)+(1-φ)×Gs(T),s=1,2,…,N
(5)
產生的束縛態確保運動中的粒子在整個可行解空間中進行搜索,由波函數ψ模的平方來確定粒子在空間中出現的概率,利用Schr?dinger方程求解得到勢阱中每一個粒子的束縛態函數
(6)
利用Monte Carlo算法求得第i個粒子在勢阱中T+1時刻的位置
(7)
勢阱的特征長度表達式為
Li(T)=2α|C(T)-Xi(T)|
(8)
為了更好控制Li(T)使其收斂,選擇在算法中引入平均最好位置變量方法,即
(9)
將式(8)代入式(7)中,則得到QPSO算法的進化方程
Xi(T+1)=pi(T)±α×|C(T)-Xi(T)|×
(10)
以上式子中,ψ與hi(T)均為平均分布在(0,1)區間的隨機數。收縮—擴張系數α為算法中唯一需要人為設定的參數,其計算公式為
(11)
式中 MAXITER為最大迭代次數。當α取值較大時,粒子的收斂速度較快,當α取值較小時,粒子的收斂速度較慢,已有數據表明[9],只有α滿足小于1.782時,才能保證粒子充分收斂。
對于QPSO算法,粒子的每個維度通常是隨機初始化的,很難保證初始解的大部分維數根據求值函數是最優的,一個具有許多優良維度的粒子可能會因為一些不良維度的影響而被舍棄,從而降低算法的搜索效率。種群中每一個粒子Xi(T)都是N維個體,維數搜索策略將粒子的每一維都視為一個個體,用這個個體替換QPSO中整個粒子,根據評價函數從K-1個粒子中選取每一維度適應度值最好的粒子,組成一個完整的粒子XK(T)。搜索過程如圖1。

圖1 粒子的維數搜索過程
假設根據評價函數計算出XK-1,1(T)是第一維度中適應度值最好的粒子,則選擇XK-1,1(T)作為第K個粒子的一維解,意味著XK-1,1(T)是K-1個粒子中最優維度。按照此搜索方式,繼續尋找第K個粒子的下一個維度。通過維數搜索策略,從K-1個粒子中生成包含所有維數的最優解。當得到所有維數時,質點在第T次迭代(T=1,2,…,MAXITER)逐步形成問題的新解XK。在QPSO算法中引入粒子維數搜索策略,既優化粒子的組成,又提高了算法在求解空間中的搜索效率。
Elman神經網絡是一種具反饋功能的動態神經網絡,除了輸入層、隱含層和輸出層以外,在隱含層環節增加承接層作為反饋支路,對隱含層前一時刻的輸出進行存儲和延遲處理后,同當前時刻的輸入數據一起再次作用到隱含層,這種內部反饋機制有利于網絡模型的全局穩定性,使Elman神經網絡的精度高于BP神經網絡,但效果并不明顯。為了在使用少量神經元數目的前提下,動態實現高階系統精度,本文提出在承接層加入自反饋增益因子,并引入直接輸入—輸出層連接來提高網絡的泛化能力。改進的Elman(IElman)神經網絡結構如圖2。

圖2 IElman神經網絡結構
IElman神經網絡的數學表達式如下
y(t)=g(w2x(t)+γz(t))
(12)
x(t)=f(w3u(t)+w1z(t-1))
(13)
u(t)=x(t-1)+βu(t)
(14)
式中w1,w2,w3分別為輸入層—隱含層之間,隱含層—輸出層之間,承接層—隱含層之間的連接權值;γ為輸出與輸入之間的連接權值;z(t)為網絡的外輸入,x(t)為隱含層的輸出,u(t)為承接層的輸出,y(t)為網絡輸出。采用Sigmoid型非線性函數作為隱含層神經元的傳遞函數,用f(*)表示;采用線性函數作為輸出層神經元的傳遞函數,用g(*)表示;t為當前時刻。自反饋因子增益因子β取值為[0,1),當β取0時,承接層不存在自反饋機制。網絡誤差函數為E的表達為
(15)
式中e(t)為網絡理想輸出,M為樣本數,j為第j個樣本。
為了進一步提高IElman神經網絡的精度,采用SDQPSO算法優化神經網絡的權值和閾值,具體步驟如下:1)確定神經網絡的拓撲結構,初始化網絡的權值閾值;2)設置QPSO算法的種群大小K,維數N等參數,初始化K-1個粒子,采用維數搜索策略生成第K個粒子;3)計算當前粒子的適應度值,并與前一時刻的適應度值進行比較,若當前粒子適應度值較好,更新當前粒子的位置為個體最優位置Pi(T);4)計算種群當前全局最優位置,與前一時刻進行比較,選擇較好的更新為粒子全局最優位置Gs(T);5)根據式(5)更新勢阱中每一維粒子的中心位置坐標pi;6)根據式(9)得到種群的平均最好位置C(T);7)用位置更新公式(10)更新K-1個粒子的位置,采用維數搜索策略生成第K個解;8)重復步驟3~步驟7,直到找到最優解或達到最大迭代次數;9)輸出SDQPSO算法得到的最優解,訓練神經網絡,建立SDQPSO-IElman網絡模型。
本文設計的天線正面與背面基本結構如圖3所示,該天線由圓形輻射貼片、介質基板、微帶饋線和截短接地板組成。采用FR4作為介質基板,損耗角正切為0.02,高為32 mm,寬為25 mm,厚為1.6 mm。分別在天線的截短接地板和微帶饋線上開對稱的L形和U形窄縫隙。d5為L形窄縫隙距離介質基板左右兩側的距離,L4為截短接地板的長度。使用HFSS仿真軟件對各個窄縫隙的尺寸參數進行優化仿真,得到天線最佳尺寸結構,具體參數如表1。

圖3 天線結構

表1 天線尺寸
圖4和圖5分別為天線的S11和電壓駐波比(voltage standing wave radio,VSWR)仿真曲線圖,S11的值小于-10 dB,VSWR的值在2以下的波段是UWB天線正常工作的波段。由圖可知,中心頻率分別在3.5 GHz和7.22 GHz處,實現了雙陷波特性,成功濾除全球接入互操作性(WIMAX),衛星X波段和國際電信聯盟(ITU)波段三種窄帶信號的干擾。

圖4 S11曲線

圖5 VSWR曲線
單獨使用HFSS仿真軟件對天線進行設計往往需要耗費大量的時間[10]和人力,而神經網絡具有很強的自適應性,能夠學習輸入與輸出之間的對應關系,從而建立具有天線特性的網絡模型。天線的S11和VSWR參數都能夠反映天線是否實現良好匹配,這里選擇S11參數作為輸出,天線的頻率作為輸入,建立神經網絡模型并進行訓練。
從HFSS仿真軟件中提取500組S11參數和對應的天線頻率,訓練數據和測試數據分別占80 %和20 %。頻率范圍為2~16 GHz,步長設置為0.01,為了提高預測精度,先對數據進行歸一化處理。利用隱含層節點計算公式確定隱含層的大致范圍在2~11,選擇不同的隱含層節點數會得到不同的網絡誤差,經過測試網絡誤差最小[11]時的隱含層節點數為9,以此確定網絡的拓撲結構。分別建立BP,Elman與IElman神經網絡模型,用相同的數據對三種網絡模型進行訓練,在MATLAB 20R2018a仿真平臺上進行仿真實驗,誤差限設為0.001,最大訓練次數1 000次。圖6為HFSS與三種模型的輸出對比,圖7為誤差對比。由圖可知,IElman神經網絡模型計算輸出更加接近實際輸出,泛化能力更強。表2給出3種模型的平均絕對誤差(mean absolute error,MAE)分別為:2.610 71,1.357 78,0.576 97,IElman神經網絡的誤差最小,表明該網絡結構模型具有更好的并行信息處理能力,能夠很好地描述天線參數間復雜的非線性關系。

圖6 IElman等模型輸出對比

圖7 IElman等模型訓練誤差對比

表2 不同模型MAE及收斂時間對比
從局部細節來看,IElman神經網絡部分計算輸出值與實際輸出值之間仍存在較大誤差,這是因為在訓練過程中仍存在易陷入局部極小值的問題,導致個別點無法實現理想擬合,因此,構建SDQPSO-IElman模型來提高模型的精度和收斂速度。種群數量設置為K=30,維數N=28,最大迭代次數MAXITER=100,分別與IElman和QPSO-IElman模型進行對比,結果如圖8和圖9??梢钥闯?,兩種方法均可以改善IElman神經網絡模型局部點誤差較大的現象,實現良好的預測效果,MAE分別為0.097 86和0.023 79。相較QPSO-IElman網絡模型,本文提出的神經網絡模型精度提高75.69 %,收斂速度提高8.18 %;與標準Elman神經網絡模型相比精度提高98.25 %,收斂速度提高34.81 %。綜上所述,本文提出的SDQPSO-IElman模型具有更低的平均絕對誤差和更快的收斂速度。

圖8 SDQPSO-IElman等模型輸出對比
本文在標準的Elman神經網絡結構的承接層中增加自反饋增益因子,并引入輸入—輸出層連接,提高網絡泛化能力;利用維數搜索策略篩選出QPSO算法中維數較好的粒子進行重新組合,增強算法尋優能力,使算法收斂速度更快,具有更強的穩態魯棒性和更高的精度。最后構建SDQPSO-IElman神經網絡模型,實現了對雙陷波天線的S11參數和頻率的精確建模,與其他神經網絡模型相比整體性能最優。