朱 廈,康利鴻,王海鵬
(1.北京市遙感信息研究所,北京 100192;2.復旦大學 電磁波信息科學重點實驗室,上海 200433)
SAR自問世以來已經被廣泛應用于地球科學、氣候變化研究、環境和地球系統監測、海洋資源利用等領域,具有極高的應用價值[1-3]。SAR成像時受系統固有特性的影響,使得其對目標的方位角十分敏感,方位角的變化將會導致差異很大的目標圖像;由于特殊的相干成像機理,SAR圖像存在特有的斑點噪聲[4-5],因此SAR圖像與光學圖像在視覺效果上差異很大。近年來,SAR分辨率越來越高,傳感器模式增多,工作波段和極化方式越來越多元化,使得SAR圖像中信息爆炸性增長,人工判讀的工作量超出了人工迅速做出判斷的極限[6-7],人工判讀帶來的主觀和理解上的錯誤就難以避免。因此,SAR自動目標識別技術的研究顯得尤為重要[8-9]。為了能夠更好地適應各種復雜的地物環境,增強在真實環境下的目標探測及對雷達獲取信息的處理能力,目前世界各國都越來越重視SAR自動目標識別技術的研究[10-12]。極化合成孔徑雷達采用矢量測量的方法來探測散射電磁波的極化信息,利用2個通道發射和接收不同極化方式下的電磁波,能夠獲得4組完備的數據[6-7],從而獲得更加豐富的、關于散射過程的信息。極化合成孔徑雷達從電磁波的極化散射機理研究地物的物理特性,其通道之間的相對相位信息可以定量反映目標特性的差異。
SAR自動目標識別可以表述為在沒有人工直接干預的情況下,計算機在較短時間內從海量的SAR圖像中自動檢測出類似目標的區域,并識別出目標的種類[13]。由于SAR一次觀測得到的對應場景一般比較大,SAR自動目標識別通常采用分層處理機制。首先從較大的SAR原始數據中提取出可能包含目標的小區域;接著進一步處理這些感興趣的區域,去除掉不可能是目標的區域;最后僅對剩下的感興趣的區域進行更大計算量的復雜處理,從而實現對目標的分類、識別。典型的自動目標識別框架包含檢測、鑒別和分類3個階段。檢測階段從原始SAR圖像中提取出感興趣的區域[14],恒虛警率檢測器是最常用的檢測器[15-16];鑒別階段將會對感興趣的區域進行處理,利用一系列不同的特征訓練鑒別器實現目標與雜波的二元分類[17],從而去除只包含自然雜波虛警的感興趣區域;分類階段去除掉剩下的感興趣區域中非目標的人造虛警,給出目標的種類、姿態和位置等信息。
本文主要研究基于極化SAR數據的陸地環境下典型人造目標自動檢測與鑒別算法。和海洋環境不同,一般的CFAR算法應用在陸地環境下往往產生較高的虛警率,因此本文提出采用目標的極化特征進行目標鑒別的方法,實驗結果表明該方法能有效降低陸地環境下目標檢測的虛警率。
基于背景雜波統計特性的恒虛警率方法其最重要的任務是建立一個能夠精確描述像素點強度分布的模型。SAR圖像雜波的統計特性主要受到兩方面因素的影響:一是雷達設備自身參數,包括分辨率、成像模式、入射角和極化方式等;二是環境背景和目標參數,包括風向、風速、雨區和強散射體泄漏的旁瓣等,另外估計窗口的尺寸對雜波的統計特性也有很大的影響。在Gamma分布的基礎上,廣義Gamma分布模型被認為具有更強的SAR圖像雜波分布擬合能力[18-21],實驗表明廣義Gamma分布能夠更好地實現對SAR圖像的統計建模。
廣義Gamma分布(Generalized Gamma Distribution,GΓD)是1962年E.W.Stacy提出一種三參數的統計分布,它是兩參數Gamma分布的推廣。許多常用的SAR圖像雜波統計分布,如指數分布、Gamma分布、對數正態分布(Log-Normal Distribution)、Weibull分布、Rayleigh分布和Nakagami分布,都是GΓD的特例[18]。因為GΓD具有對各種常見的SAR圖像雜波統計分布模型的概括性,所以GΓD非常適合復雜背景下SAR圖像雜波的統計建模。
GΓD的概率密度函數為:
x>0,
(1)
式中,β,λ,ν均大于0;β為尺度參數;λ為形狀參數;ν為能量參數;Γ(·)為Gamma函數。
GΓD的累積分布函數為:

(2)
對于給定的背景雜波樣本,需要一種高效精準的GΓD分布函數參數估計方法。最大似然估計(Maximum Likelihood,ML)是最常用的分布參數的估計方法之一,其基本思想是:分布參數的估計值應使觀測樣本出現的概率最大。假設有N個服從GΓD的觀測樣本{Xi|i=1,2,…,N},一般可以認為樣本的分布互相獨立,所以似然函數寫為:
(3)
對數似然函數為:
l(X1,X2,…,XN;β,λ,ν)= ln{L(X1,X2,…,XN;β,λ,ν)}=
(4)
對數似然函數對β,λ,ν三個參數的偏導數可分別求得:
(5)
式中,ψ(·)為Digamma函數,表示Gamma函數的導數,定義為:
(6)
讓對數似然函數對β,λ,ν三參數的偏導數都為0,聯立3個等式就能得到β,λ,ν三參數的估計值。但這3個方程都是非線性方程,一般采用迭代的方法進行數值求解。直接對這一非線性方程組求解很容易陷入不合理的局部最小值。考慮到Gamma分布是GΓD在ν=1時的特殊情況,所以首先估計出對應Gamma分布的參數,即限制ν=1時先求解另外2個參數,此時得到的解是在(β,λ,ν)三維解空間內ν=1平面上的最小值。然后以這個點為初始值進行迭代求解GΓD的3個參數優化問題,實驗表明該方法可以得到穩定合理的GΓD參數。
對地面目標,因為環境比較復雜,包括建筑物等人造目標,從SAR圖像中檢測典型目標就比較困難,因此提出結合目標圖像空域特征和極化域特征的聯合檢測識別方法,如圖1和圖2所示。

圖1 構建主要散射機制的空間域距離特征圖

圖2 構建主要散射機制的極化域距離特征圖
首先將POLSAR圖像中目標的主要散射機制提取出來,然后以這些散射機制項為節點,計算兩兩之間的距離,構建一張圖。在圖像空間域上,任意2個節點的距離可以簡單地表示為歐式距離,由此建立的空域距離圖即直接表征了目標像的幾何形狀。同時在極化特征域上,任意2個節點的距離則由Cameron極化度量表征[22-25],由此建立的極化特征域距離圖表征了該目標的極化散射特性。采用圖的相似性度量即可實現特定目標的檢測和識別。
本文提出的鑒別準則有2個:
① 根據Cameron分解結果,車輛和飛機等人造目標包含螺旋體散射;
② 利用待鑒別目標與已知目標散射特征分別的Kullback-Leibler(K-L)距離來進行鑒別。
另外一個準則是通過計算Kullback-Leibler(K-L)距離與目標散射特征分布進行匹配。假設目標散射特征的概率分布集合為{f1,f2,…,f9},待鑒別目標的散射特征概率分布為g,則已知目標與待鑒別目標散射特征分別的K-L距離定義為:
(7)

實驗所用數據為機載全極化SAR數據。該數據Pauli偽彩色顯示如圖3所示,該區域大部分區域為農田和樹林,其中有一些人造目標和建筑物。

圖3 機載全極化SAR數據Pauli偽彩色圖
用基于廣義Gamma分布的CFAR檢測算法對整幅圖像進行檢測,如圖4所示,可以看出圖中有很多虛警目標。由于CFAR算法本質上是基于圖像強度進行檢測,因此高亮的點都會被認為是目標,如場景中房屋、橋梁等建筑物。圖4(a)為檢測結果,圖4(b)為檢測結果在原圖中的位置。如圖右側局部放大圖所示,建筑物也被作為目標檢測出來,所以檢測結果有很高的虛警率,需要考慮用目標的極化特征進行鑒別。

圖4 基于廣義Gamma算法的檢測結果
根據對極化SAR數據進行Cameron分解,車輛等目標的極化特征中包含螺旋體散射,利用目標是否包含螺旋體散射進行鑒別,結果如圖5所示。其中圖5(a)中目標為不包含螺旋體散射的虛警。圖5(b)中目標表示包含螺旋體散射目標,可以看出,通過本步鑒別,目標檢測的虛警率能顯著降低。

圖5 基于螺旋體散射特征的鑒別結果
在此基礎上,又對上述結果進行基于K-L距離的鑒別,取K-L距離閾值為0.2,基于螺旋體散射與K-L距離鑒別的結果如圖6所示。鑒別結果表明,人造目標可以有效的保留,虛警目標被剔除。

圖6 基于螺旋體散射與K-L距離鑒別的結果
在此基礎上,比較極化鑒別前后的虛警率,實驗結果如表1所示??梢钥闯鰞H僅用CFAR算法,目標的檢測概率是100%,但有很高的虛警率(≥30%),如果用螺旋體散射特征進行鑒別,目標的虛警在3 m分辨率情況下降低到6.25%。如果用K-L距離鑒別,對應的虛警率降低到18.75%。如果將螺旋散射特征與K-L距離結合,則虛警率可降低到0%,極大地提高了目標檢測性能。

表1 人造目標檢測與鑒別的定量分析指標表 (%)
注:H參數:Helix鑒別;KL距離:Kullback-Leibler(K-L)距離。
針對復雜陸地環境下典型人造目標識別需求,提出了一種基于廣義Gamma分布的目標檢測算法,并結合典型人造目標極化特征,提出了基于螺旋體散射及K-L距離的目標鑒別算法。基于機載全極化數據,驗證了檢測算法對地面目標有100%的檢測率,但同時虛警率較高;通過利用目標的極化特征信息,本文提出的目標鑒別算法,可以將虛警率從≥30%降低到0%,使得該算法的實用性得到極大的提高。實驗結果表明,該方法可以應用于復雜陸地環境下地面車輛等典型人造目標極化SAR圖像檢測,提升極化SAR目標檢測性能。