孫 江,行鴻彥,吳佳佳
(1.南京信息工程大學氣象災害預報預警與評估協同創新中心,江蘇 南京210044;2.南京信息工程大學江蘇省氣象探測與信息處理重點實驗室,江蘇 南京210044)
海雜波[1]指的是海面雷達的后向散射回波,受到各種外部自然因素影響,如風、潮汐、浪涌等,其物理機理復雜多變,非高斯、非線性和非平穩特性顯著,容易對雷達目標檢測造成干擾。從雷達檢測海平面目標的需求出發,進而開展對海雜波特性的研究。隨著海浪機理以及海雜波特性研究的深入,研究人員發現海雜波存在混沌特性[2]。研究海雜波作背景噪聲的微弱信號檢測,對海平面小目標的識別與檢測有著非常重要的理論以及實際應用意義。
針對混沌海雜波的復雜多變,非平穩性顯著,基于可知統計特性的傳統信號檢測理論[3]無法完全適用,且海雜波混沌特性反饋不明顯,存在適應范圍局限的缺點,萬普尼克提出的統計學習理論,采用的是統計學方法,在此理論基礎上引出的支持向量機,成為了機器學習以及各個領域研究解決分類預測問題的新方案。支持向量機為混沌海雜波背景下的微弱信號檢測提供了新方法新思路,對海平面小目標信號檢測具有重大意義,備受國內外研究學者的關注和重視。國外學者Leung H于1993建立基于徑向基函數的微弱信號檢測模型[4],對海雜波數據進行了預測。1997年,Mukherjee將支持向量機應用到混沌時間序列的預測中來[5],促進了混沌序列的預測研究。2000年,Hennessey利用恒虛預警原理和RBF-CML預測器實現對海雜波中的小目標檢測[6]。2008年,Kenshi Sakai提出了利用短非線性時間序列重構動力學法,研究確定性混沌[7],促進了相空間重構在信號檢測領域的應用。2010年,Ataollah Ebrahim提出了基于SVM的分類器,驗證高斯徑向基函數核具有較好的性能,并結合粒子群算法優化SVM的參數[8]。在國內,2001年聶春燕,石要武提出了一種結合互相關檢測和混沌特性的微弱信號檢測方法[9],對混沌噪聲實現有效抑制,同時具備時間域方法的優點。2005年,劉丁等人在分析當前混沌信號檢測方法優缺點時,提出了一種基于李雅普諾夫指數計算混沌閥值的微弱信號檢測方法[10],推進了微弱信號檢測方法實用性的進程。2007年,徐偉在研究Lorenz系統作為混沌背景噪聲時,引進神經網絡方法檢測微弱信號,實驗證明了其有效性[11]。2010年,金天力在研究復雜非線性系統相空間重構理論時,提出了基于新型LS-SVM模型的海雜波背景微弱信號檢測[12],與傳統神經網絡方法和LS-SVM相比,提高了預測精度和檢測閥值,但是存在一定局限性。
懲罰系數、核函數和不敏感參數是影響支持向量機預測精度的主要參數,對它們進行參數的尋優優化能夠顯著提高支持向量機的性能。傳統參數優化方法容易局部收斂,從而影響檢測模型的檢測性能。針對此問題,本文引入免疫算法[13]來優化支持向量機的參數,提出了基于免疫算法優化支持向量機(IA-SVM)的混沌小信號檢測方法。
一般來說,時間序列主要是在時間域中進行的,但是對于混沌時間序列并不適用。混沌時間序列的研究理論基礎是Takens提出的嵌入定理,他認為總可以從混沌時間序列中找到一個拓撲意義等價、高維的重構相空間,在這個相空間中進行混沌時間序列的研究處理。相空間重構[14]的基本思想就是任何系統中的任何分量的發展都離不開與其相互作用的其他分量,同樣的是其他分量的發展信息也蘊藏在其演化過程中,因而只需考察一個分量,而相空間重構的關鍵參數就是嵌入維數和延遲時間[15],嵌入維DE和延遲時間τ的確定就成了重構的第一步。
上述兩個參數的確定,分成兩種研究方向:一種方向認為嵌入維DE與延遲時間τ是不相關的,即采用各自參數確定的方法確定參數值;另一種方向則認為嵌入維DE與延遲時間τ是相關的,通過確定嵌入窗寬τω=(DE-1)τ,利用嵌入維與延遲時間的相關性,確定兩者的參數值,進而實現相空間重構。最近研究表明,嵌入窗寬對相空間重構的質量影響更大,即后一種方法重構相空間更優,經典求解嵌入窗寬的方法有C-C法[16]以及基于它的各類改進方法。假設混沌時間序列為x(n)=1,2,…,N,其重構空間上序列:Xi(n)={xi(n),xi(n+τ),…,x[n+(m-1)τ]}(i=1,2,…,M),由于描述混沌特征奇異吸引子的常用參數是關聯維數,利用嵌入混沌序列的關聯積分函數求解關聯維:
(1)
式(1)中,C為關聯積分函數,r為臨界半徑。
將待觀測序列分成N個子序列,計算各個序列的統計量Si,再根據統計學原理列寫所有序列統計量的均值方程:
(2)
結合關聯指數飽和時的最小嵌入維以及統計學原理求解嵌入延時窗,即上述方程的第一個極小值對應的時間窗口,從而同時估計出延遲時間τ和嵌入窗寬τω。
重構的參數會直接影響相空間重構效果以及后續分析,所以本文采用C-C法求嵌入窗,得到嵌入維為5,時間延遲為1。
支持向量機[17]是一種二分類模型,其解決非線性分類問題的核心就是將低緯度的非線性樣本空間通過核函數映射到高緯度空間線性化處理。混沌海雜波背景下的微弱信號檢測就是在復雜的海雜波中進行非線性分析求解,其檢測的基本思路為:
對于給定的訓練數據集:
{(xi,yi)|i=1,2,…,l;xi∈Rn,yi∈R}
(3)
式(3)中,xi為微弱信號預測模型訓練數據的n維輸入,yi為目標信號預測的輸出值,l為采集訓練的樣本個數。
回歸估計函數為:
f(x)=ωTφ(x)+b
(4)
式(4)中,超平面的權值為ω,偏置常數量為b,φ(·)則是將輸入的海雜波背景下微弱信號預測模型的訓練樣本和輸出預測值之間的非線性關系轉化為φ(x)與y之間的線性關系。
支持向量機的優化函數對目標值進行優化,得到下式:
(5)
約束條件:ωTφ(x)+b-yi=ξi
(6)
式(5)、式(6)中,C為支持向量機模型的懲罰系數,C>0;ξi為松弛變量,是數據允許偏離的間隔,在原目標的基礎上要盡可能的小。采用典型求解約束條件下最值問題的方法——拉格朗日數乘法,得到支持向量機的回歸模型為:
(7)
式(7)中,
為拉格朗日乘子,經文獻[8]研究論證核函數K(xi,x)優先選用高斯徑向基函數核:
(8)
支持向量機的主要參數有懲罰系數C、核函數參數σ以及不敏感損失參數ε,這三個參數值都會直接影響支持向量機的預測精度,其中懲罰系數C的取值直接影響支持向量機的泛化能力[18],適當的參數取值得到效果更優;核函數參數σ能夠反映訓練數據的分布特性,取值過大,會使得置信范圍變大,反之亦然;而不敏感損失參數ε取較大為宜,此時回歸函數較簡單,計算較快,不過當ε大于某一值后,就會出現欠擬合。因此,為了提高支持向量機模型的預測精度,需要利用優化算法對其三個參數進行尋優,尋優算法多種多樣,為了避免陷入局部最優,解決運算大、耗時長等問題,本文采用免疫優化算法。
免疫算法[19]是一種借鑒生物免疫系統識別抗原的信息處理機制來解決實際工程應用問題的尋優算法,它是在遺傳算法的基礎上保留一定數量的較優解,增加克隆算子和克隆抑制算子,克隆算子是將經過免疫選擇后的抗體進行復制,克隆抑制算子則是淘汰親和度較低的抗體,保留親和度較高的抗體,這樣不僅提高了算法效率,而且得到優化的結果更好,避免出現陷入局部尋優。免疫算法具有尋優效率高、魯棒性高、并行分布性等特點,已經在科學和工程領域得到應用,能夠解決非線性優化問題、故障診斷、信號處理等,并取得了不錯的效果。因此,本文用免疫算法來解決支持向量機參數尋優的問題。
為了提高預測模型的檢測信號的能力和預測精度,需要利用免疫算法對支持向量的參數進行優化。其中,將待預測信號作為免疫應答的抗原,將預測信號作為抗體,將均方根誤差的倒數作為親和度函數即尋優終止條件。免疫算法優化支持向量機[20]的具體步驟如下:
步驟1 預處理:采用經典C-C法進行相空間重構,將處理后的混沌時間序列作為支持向量機的輸入序列。
步驟2 核函數選擇:采用的是高斯徑向基核函數見式(8)。
步驟3 初始化參數,創建初始種群:將待預測的實際信號作為抗原,預測信號作為抗體,設置支持向量機C、σ、ε各自參數范圍分別為[0.1,100 000]、[0.01,100]、[0.01,10];設置免疫個體維數為3,免疫個體數目為NP,最大免疫代數為G,由于待優化的參數數量較少,所以采用二進制編碼。
步驟4 親和度計算:親和度表征的是免疫細胞和抗原之間的結合強度,對應遺傳算法中的適應度,結合抗原的同時使整個優化模型得到的均方根誤差最小,將均方根誤差的倒數定義為親和度函數:
(9)

步驟5 算法尋優終止判斷條件:判斷算法是否滿足終止條件,如果滿足,則停止算法尋優,否則繼續尋優。
步驟6 抗體濃度和激勵度計算:抗體濃度的高低能夠表明種群中抗體多樣性的好壞,抗體濃度過高容易陷入局部尋優,即在局部可行解中尋優,不利于全局搜索,把抗體濃度定義為:
(10)
(11)
式(10)、式(11)中,N為種群規模,S代表抗體間的相似度,Fit(yi,yj)表示兩抗體之間的親和度,δs表示相似度閾值。
將激勵度定義為抗體親和度與抗體濃度代數形式,綜合考慮兩者間關系,用來表征抗體最終質量,計算方式為:
Simij(C,σ,ε)=a·Fitij(C,σ,ε)-
b·Denij(C,σ,ε)
(12)
式(12)中,a,b為計算參數,視實際情況確定。
步驟7 免疫處理:免疫處理主要包括免疫選擇、克隆、變異以及克隆抑制。較遺傳算法,增加克隆以及克隆抑制操作,目的是為了提高算法的搜索效率,改善算法的優化效果。
步驟8 種群刷新:將種群中激勵度較低即質量較差的抗體替換成隨機生成的新抗體,產生下一代抗體,繼續重復步驟4,直至滿足尋優終止條件結束尋優,得到優化效果最好的支持向量機參數。
步驟9 海雜波微弱信號預測:采用經免疫算法優化后的支持向量機參數進行訓練,完成待測信號基于海雜波背景下的預測。
為了驗證IA-SVM預測模型的實用有效性,本文進行兩組仿真實驗:第一組實驗采用Lorenz系統作為混沌背景噪聲,加入瞬時和周期信號,研究分析預測模型的可行性;第二組實驗則是采用實測海雜波數據作為混沌噪聲背景,檢驗預測模型方法的有效性。分析預測信號的均方根誤差,以此作為預測模型預測精度的衡量標準,檢測信噪比用來判斷預測模型的檢測微弱信號能力。
Lorenz在研究模擬對流天氣預測工作時發現:

(13)
式(13)中,設A=10,B=28,C=8/3,初始條件x=0,y=1,z=2,利用龍格庫塔求解方程,設定求解步長為0.01,待系統完全進入混沌狀態時,經相空間重構后,取處理后的2 000個點作為預測模型的仿真數據,前1 000個數據點作為訓練樣本集,后1 000個數據點作為預測驗證集,通過對比不同預測模型下預測數據和實際數據均方誤差和信噪比,驗證IA-SVM模型的可行性以及優越性。利用經典C-C法求嵌入窗寬,進行相空間重構,推得嵌入維為5,時間延遲為1。
在預測集的第605~654個點處加入一定幅值的小信號,改變幅值大小構造信噪比不同的含噪信號,在保證模型預測穩定的前提下,探究模型的極限檢測能力。經多次重復改變實驗,決定加入幅值為0.000 05的微弱信號,并將其疊加到Lorenz混沌背景噪聲中構成待預測信號,計算信噪比(SNR)為-104.174 3 dB,經歸一化處理和求嵌入窗構建相空間后,進行IA-SVM模型的單步預測。
預測結果如圖1所示,經免疫算法優化后的支持向量機參數C=825.67,σ=0.869 4,ε=0.045 1, 預測結果的均方根誤差(RMSE)為0.000 146 3。從圖2中可知,預測點n=605~654間的誤差較大,這是因為較真實值該處加入了幅值為0.000 05的微弱瞬時信號,能夠確定該處存在微弱信號,驗證了該模型的可行性。通過不斷改變加入微弱信號的幅值,減小幅值實現信噪比下降,在保證預測模型能夠明顯預測微弱信號的前提下,微弱信號幅值最小時對應的極限信噪比以及預測誤差來反映模型檢測能力。對比IA-SVM的預測模型與其他幾種預測模型的檢測能力,比較結果如表1所示。

圖1 含瞬態信號的真實值與預測值Fig.1 Real and predicted values of transient signal
為了進一步說明提出方法的優越性,利用不斷改變加入瞬時小信號的幅值從而改變信噪比,探究不同信噪比條件下本文提出方法和傳統混沌算法的檢測效果,做200次蒙特卡洛仿真實驗,獲得如圖4所示的檢測率對比圖,定義檢測率η=N1/N,其中N1為成功檢測到微弱信號的次數,N為實驗總次數。

圖2 含瞬時信號的預測誤差Fig.2 Prediction error with transient signal
通過對比圖可以發現,本文算法檢測性能較混沌算法有明顯優勢。在信噪比高于-20 dB時,兩種算法均能較為準確地檢測微弱信號的存在;然而當信噪比低于-20 dB時,傳統混沌算法檢測率陡降,檢測性能大打折扣,檢測率已經不能滿足實際工程應用的要求,反觀本文方法檢測率穩定緩緩下降,即使信噪比達到-104.147 3 dB,本文檢測率依然為83.2%,表明本文算法在較低信噪比下檢測信號的有效性。

表1 混沌預測模型性能對比
緊接著進行周期信號的預測實驗,重復上述實驗步驟,將微弱瞬時信號更換成微弱周期信號,設定目標信號為:
s(n)=0.000 25sin(2πfn)
(14)
頻率為0.031 8,信噪比達到-89.5 dB,得到優化后的參數C=93 580,σ=0.635 0,ε= 0.014 6,預測結果的均方根誤差RMSE為0.000 091 8。通過觀測含周期信號的預測誤差如圖4所示,不能確定微弱信號的位置,所以對誤差幅度進行快速傅里葉變換,研究預測誤差的頻譜特性觀察圖5的誤差頻譜圖,不難發現,在頻率為0.031 8處頻譜圖出現顯著峰值,能夠確定微弱周期信號的存在,在其他頻率時同樣出現小鋸齒,主要是因為整個預測模型本身存在誤差以及在預測系統中所加的微弱瞬時信號和周期信號的干擾。

圖3 瞬時小信號檢測率比較圖Fig.3 Comparison diagram of instantaneous small signal detection rate

圖4 含周期信號的預測誤差Fig.4 Prediction error with periodic signal

圖5 含周期信號的預測誤差頻譜Fig.5 Prediction error spectrum with periodic signal
同樣地,為了進一步驗證本文方法檢測周期小信號的檢測性能,依舊選用目標信號,采樣頻率為100 Hz,在不同信噪比條件下比較兩種檢測方法的檢測性能,同樣地做200次蒙特卡洛仿真實驗,得到如圖6所示的檢測性能對比圖。
通過圖6可以得到,本文算法的檢測率高于混沌算法的檢測率,在信噪比較高的情況下,二者的檢測能力旗鼓相當,但是隨著信噪比的降低,兩種方法檢測能力都有所下滑,不過本文提出的檢測方法較混沌算法穩定,檢測率緩緩下降,在信噪比低至-89.5 dB時,依舊能夠保持85%以上的檢測率。

圖6 周期小信號檢測率對比圖Fig.6 Comparison diagram of detection rate of periodic small signal
首先選用2 000個不含微弱目標信號的海雜波數據,選取前1 000個點作為訓練樣本集,后1 000個點作為預測驗證集,并對這兩組數據進行相空間重構和IA-SVM預測,得到優化后的支持向量機參數C=83 546,σ=0.088 1,ε=0.011 5,預測結果的均方根誤差(RMSE)為0.000 623 8,較傳統預測模型的檢測精度得到明顯提升(LS-SVM預測模型的均方根誤差為0.013 7),預測結果如圖7所示。然后進行含小目標的海雜波數據的實驗,選用的是IPIX雷達54#海雜波距離目標單元,目標數據區間:主目標為8,次目標為7∶10,實驗步驟和不含小目標的海雜波數據實驗一樣,得到支持向量機優化參數C=274 340,σ=0.107 7,ε=0.024 7,預測結果的均方根誤差(RMSE)為0.000 259 9。通過觀察預測結果的誤差幅值圖,同樣無法直接確定微弱信號的位置,對其進行頻譜分析得到圖的誤差頻譜分析圖,觀察圖顯而易見,在歸一化頻率為0.014 42時出現明顯峰值,即表明了IA-SVM預測模型檢測到淹沒在混沌海雜波噪聲中的微弱信號,較傳統預測模型有著明顯優勢,得益于支持向量機較好處理復雜非線性問題;較GA-SVM預測模型更加敏感,精度更高,得益于IA算法的搜索效率更高,尋優效果更好。

圖7 海雜波背景下的預測值與真實值Fig.7 Predicted and true values in the background of sea clutter

圖8 海雜波背景下的誤差頻譜Fig.8 Error spectrum in the background of sea clutter
本文提出了基于免疫算法的優化支持向量機微弱信號檢測方法。通過經典C-C法求嵌入窗寬度構建混沌序列相空間,利用免疫算法的尋優能力對支持向量機中影響預測精度的懲罰系數、核函數以及不敏感損失參數這三個參數進行優化,從而建立混沌時間序列的預測模型,從預測誤差中檢測混沌噪聲背景中的微弱信號。仿真實驗以Lorenz系統的混沌數據和實測雷達的海雜波作為背景噪聲,分析IA-SVM模型預測信號信噪比和均方根誤差,來判斷模型預測性能效果,并與其他預測模型對比。利用免疫算法優化支持向量機參數的預測模型能夠檢測出淹沒在混沌背景中的微弱信號,而且比常規使用的未優化支持向量機和傳統的神經網絡方法更快、精度更高,提高了預測模型的精度同時還避免了陷入局部極值,得益于支持向量機和免疫算法的優點。通過對比分析其他幾種模型預測的均方根誤差,在信噪比更高情形下的IA-SVM模型的預測誤差更小,預測性能更好,更接近實際值。