耿杰 范劍超, 初佳蘭 王洪玉
基于深度協(xié)同稀疏編碼網(wǎng)絡的海洋浮筏SAR圖像目標識別
耿杰1范劍超1,2初佳蘭2王洪玉1
浮筏養(yǎng)殖廣泛存在于我國近海海域,可見光遙感圖像無法完全準確地獲取養(yǎng)殖目標,而基于主動成像的合成孔徑雷達(Synthetic aperture radar,SAR)遙感圖像能夠得到養(yǎng)殖目標,因此采用SAR圖像進行海洋浮筏養(yǎng)殖目標識別.然而,海洋遙感SAR圖像包含大量相干斑噪聲,并且SAR圖像特征單一,使得目標識別難度較大.為解決這些問題,提出一種深度協(xié)同稀疏編碼網(wǎng)絡(Deep collaborative sparse coding network,DCSCN)進行海洋浮筏識別.本文方法對預處理后的圖像先提取紋理特征和輪廓特征,再進行超像素分割并將同一個超像素塊特征組輸入該網(wǎng)絡進行協(xié)同表示,最后得到有效特征并分類識別.通過人工SAR圖像和北戴河海域浮筏養(yǎng)殖SAR圖像的實驗驗證所提模型的有效性.該網(wǎng)絡不僅具有優(yōu)異的特征表示能力,能夠獲得更適合分類器的特征,而且通過近鄰協(xié)同約束,有效抑制相干斑噪聲影響,所以提高了SAR圖像目標識別精度.
合成孔徑雷達,深度學習,稀疏自動編碼器,浮筏養(yǎng)殖,目標識別
引用格式耿杰,范劍超,初佳蘭,王洪玉.基于深度協(xié)同稀疏編碼網(wǎng)絡的海洋浮筏SAR圖像目標識別.自動化學報,2016,42(4):593?604
合成孔徑雷達(Synthetic aperture radar,SAR)是一種主動成像傳感器,具有全天候、全天時、高分辨率的數(shù)據(jù)獲取能力[1?2].SAR圖像目標識別是SAR圖像解譯的重要內容,在軍事偵察、資源探測、地理測繪、海域監(jiān)測等領域有著廣泛的應用.隨著SAR成像技術的發(fā)展,分辨率的不斷提高,SAR圖像目標識別成為海量SAR數(shù)據(jù)處理的主要手段.典型的SAR圖像目標識別模型分為檢測(Detection)、鑒別(Discrimination)和分類(Classification)三個階段[2].海洋浮筏養(yǎng)殖是海域監(jiān)測的重要組成部分,自動識別浮筏信息對實現(xiàn)大面積海域動態(tài)使用監(jiān)測有著重要意義[3?4].由于海洋散射信號較弱,光譜成像衛(wèi)星數(shù)據(jù)難以獲取浮筏信息,而SAR是主動式微波成像,利于獲取浮筏信息,在海域監(jiān)測中具有明顯優(yōu)勢[5].因此,利用SAR圖像進行海洋浮筏養(yǎng)殖自動識別,不僅可以大范圍、宏觀調查海域使用情況,而且為海洋遙感業(yè)務化動態(tài)監(jiān)測提供了有力手段.但是,由于海洋周期性波浪的影響,后向散射系數(shù)相干疊加使得成像存在嚴重的相干斑噪聲;同時由于海洋每個區(qū)域的流、浪、涌、內波都不一樣,導致后向散射特性非常不規(guī)律,同一目標在不同海域特征存在明顯差異[6].這些問題增加了海洋SAR圖像目標識別難度,有效的特征表示是解決問題的關鍵.
在SAR圖像目標識別問題中,紋理特征被廣泛用于SAR圖像的特征提取.紋理特征是圖像灰度或色彩在空間上的重復或者變化的特征,提取紋理特征的方法可以分為三類:基于統(tǒng)計的方法、基于模型的方法和基于變換域的方法[7].在基于統(tǒng)計的方法中,灰度共生矩陣(Gray-level co-occurrence matrix,GLCM)統(tǒng)計圖像上保持某距離的兩個像素的灰度狀況,主要包括均值、方差、對比度、熵、自相關等元素.在基于模型的方法中,馬爾科夫隨機場模型是最常用的分析模型.在基于變換域的方法中,小波變換得到變換域各個方向的系數(shù)能反映目標的后向散射特性.
為了更加有效地分析理解圖像,多尺度幾何分析(Multi-scale geometric analysis,MGA)方法陸續(xù)被提出,它是一種多方向、多尺度和局部性的圖像稀疏表示方法,被稱為后小波分析.由于小波分析的方向受限、頻率分辨率低,而MGA可以利用圖像的幾何正則性,能夠保持豐富的細節(jié)信息.目前常用的MGA方法有Gabor變換、曲波變換、輪廓波變換、剪切波變換等.Gabor變換是具有高斯函數(shù)的傅里葉變換,二維Gabor函數(shù)相當于一個高斯函數(shù)調制的復正弦函數(shù),可以提取圖像不同空間位置、空間頻率的局部結構信息[8].由于二維Gabor變換在表征圖像紋理變化方面的優(yōu)勢,已經(jīng)被普遍用于人臉識別等模式識別問題中.為了更好地逼近圖像的輪廓信息,Do等提出了輪廓波變換[9],通過多尺度分解和方向分解,可以有效地表示圖像輪廓.然而,對圖像輪廓波變換時,要進行降采樣和上采樣,這樣就不具備平移不變性,而平移不變性在邊緣保持、目標檢測等方面起著重要作用.為了解決這一問題,Da Cunha等提出一種非下采樣輪廓波變換(Nonsubsampled contourlet transform,NSCT)[10],具有平移不變性,可以很好地保持圖像的細節(jié)和邊緣信息.當前,NSCT已經(jīng)被廣泛用于圖像融合問題中[11].考慮到二維Gabor變換和NSCT在圖像特征表示方面的優(yōu)勢,本研究利用這兩種方法分別提取SAR圖像的紋理特征和輪廓特征.
在目標識別問題中,有效的特征表示對于識別準確度起著關鍵作用.但是在許多研究中,特征提取和表示都需要大量的經(jīng)驗知識和人為地參數(shù)設置,這個過程比較復雜而且效率較低,尤其是當圖像分辨率較高、尺寸較大時,更增加了特征表示的難度.近年來,深度學習神經(jīng)網(wǎng)絡被用于特征自主學習和表示,在智能識別任務中表現(xiàn)出極其優(yōu)異的性能[12?15].深度學習網(wǎng)絡具有類似于人腦感知視覺的層次化結構,不過分依賴研究人員的經(jīng)驗知識,能逐層抽象學習數(shù)據(jù)的特征,從而發(fā)現(xiàn)數(shù)據(jù)的內在結構信息并改善分類識別的效果.研究表明,深度網(wǎng)絡可以很好的挖掘圖像的低層特征(如邊界)和中層特征(如形狀),在圖像去噪、圖像分類識別等問題中取得較好的效果.在分類識別問題中,利用深度網(wǎng)絡得到的特征表示,不同類別的區(qū)分度更大,更適合于監(jiān)督分類.常用的深度網(wǎng)絡結構有深度置信網(wǎng)絡(Deep belief networks,DBN)[12]、卷積神經(jīng)網(wǎng)絡(Convolutional neural networks,CNN)[16]和堆疊自動編碼器(Stacked auto-encoders,SAE)[17].
本文提出一種深度協(xié)同稀疏編碼網(wǎng)絡(Deep collaborative sparse coding network,DCSCN)來進行SAR圖像目標識別,并用在海洋浮筏養(yǎng)殖監(jiān)測任務中.為了從SAR圖像獲得更優(yōu)異的特征,提高目標與背景特征差異性,DCSCN利用了自動編碼器在特征表示中的優(yōu)勢,獲得更適合于分類器的特征.為了克服海洋SAR圖像嚴重的相干斑噪聲,對超像素分割的近鄰像素特征利用DCSCN進行協(xié)同表示,使得同個超像素塊特征更相近并平滑掉相干斑噪聲,減小噪聲對目標識別的影響.
傳統(tǒng)的神經(jīng)網(wǎng)絡都是隨機初始化模型的參數(shù),然后通過反向傳播來優(yōu)化參數(shù).然而深度網(wǎng)絡如果利用這種方式,很容易陷入局部極值或者造成梯度彌散,使得網(wǎng)絡參數(shù)無法最優(yōu).為了解決這一問題,提出了逐層學習參數(shù)的預訓練,再對預訓練后的模型進行反向傳播來優(yōu)化參數(shù)的方法[18].常用的預訓練單元有限制玻爾茲曼機(Restricted Boltzmann machine,RBM)和自動編碼器(Auto-encoders),多層預訓練單元堆疊起來構成深度網(wǎng)絡.
1.1自動編碼器
一個自動編碼器由輸入層、隱含層和輸出層構成,訓練學習的目標是使得網(wǎng)絡的輸出盡量逼近輸入[19].自動編碼器訓練過程由編碼過程和解碼過程組成,編碼過程將輸入樣本進行線性映射和非線性映射變換得到隱含層表示.設樣本集為輸入樣本對應的隱含層表示為



訓練好一層自動編碼器后,將其隱含層的激活值作為下一層自動編碼器的輸入.這樣將多層自動編碼器堆疊起來構成了堆疊自動編碼器.
1.2堆疊自動編碼器
堆疊自動編碼器是一種典型的深度神經(jīng)網(wǎng)絡,被廣泛用于特征學習與表示.該網(wǎng)絡先逐層貪婪學習來確定參數(shù),再從最頂層反向傳播來微調(Finetune)整個網(wǎng)絡的參數(shù).如果最頂層不加入標簽信息,則這個學習過程為無監(jiān)督的特征學習過程;如果最頂層加入樣本的標簽信息來反向微調整個網(wǎng)絡的參數(shù),則這個學習過程是監(jiān)督學習過程.圖1給出了堆疊自動編碼器結構圖.

圖1 堆疊自動編碼器結構圖Fig.1 The structure of SAE
由圖1所示,該堆疊自動編碼器共M層,最高層自動編碼器的隱含層就是網(wǎng)絡的輸出.通常在堆疊自動編碼器后連接Softmax分類器進行分類識別.在有監(jiān)督學習網(wǎng)絡中,樣本的標簽也是在Softmax分類器加入的,整個網(wǎng)絡的參數(shù)通過后向傳播來整體調整.網(wǎng)絡整體參數(shù)微調的目標函數(shù)為

2.1預處理
衛(wèi)星拍攝的SAR圖像需要先進行幾何校正,來解決由于傳感器以及地球自轉等因素造成的圖像相對于地面目標發(fā)生的幾何畸變.由于原始的SAR圖像對比度較差,需采用灰度拉伸來提高圖像灰度級的動態(tài)范圍.為了增大目標與背景間的對比度,利用非線性函數(shù)對圖像進行灰度拉伸處理.為了抑制相干斑噪聲對目標識別的影響,采用增強Lee濾波算法進行去噪.
2.2紋理特征提取
二維Gabor濾波器可以提取圖像多尺度、多方向的紋理特征.二維Gabor變換是具有高斯函數(shù)形式的傅氏變換,由一個高斯函數(shù)乘以正弦函數(shù),正弦函數(shù)的頻率決定特征的尺度,相位決定特征的方向,具體公式如下[20]

其中,x0=xcosθ+y sinθ,y0=?xsinθ+y cosθ,x和y代表像素點的位置,ω0表示濾波器的中心頻率,θ表示濾波器的方向,σ表示高斯函數(shù)的標準差. exp(jω0x0)代表交流分量,代表直流分量.當直流分量趨于0時,Gabor濾波器對光照強度不敏感.θ和σ不同取值得到一組濾波器,將濾波器組與圖像進行卷積得到與圖像相同大小的分解圖像,這些圖像代表紋理特征.
2.3輪廓特征提取
非下采樣輪廓波變換(NSCT)[10]可以將圖像分解為不同頻率和不同方向的子帶圖像,各個子帶圖像表示了圖像在各個頻率和各個方向上的系數(shù),可以看作原圖的一張?zhí)卣鲌D,即輪廓特征圖.NSCT交替利用非下采樣的塔型濾波器組和非下采樣的方向濾波器組,來得到多方向、多尺度的二維分解圖像.圖2給出了具體分解的過程.

圖2 非下采樣輪廓波變換Fig.2 Nonsubsampled contourlet transform
如圖2所示,NSCT先利用非下采樣的塔型濾波器組將圖像分解為低通、帶通和高通子帶圖像,然后利用非下采樣方向濾波器組對子帶圖像進行方向濾波,得到各個頻域方向的子帶圖像.具體過程如下:NSCT的非下采樣塔型濾波器由多個雙通道非下采樣濾波器級聯(lián)構成.設定分解的尺度為j,則在尺度j上的理想低通濾波器包含的區(qū)域為理想高通濾波器H1(z)包含的區(qū)域為由于每次分解中都只對上次分解結果進行上采樣,而不使用下采樣,所以保證算法的平移不變性.經(jīng)過k級非下采樣塔型濾波,可以得到k+1個與原圖像相同尺寸大小的子帶圖像.NSCT所采用的方向濾波器組也是一組二通道非下采樣濾波器,其理想頻域區(qū)域是扇形形狀,對扇形濾波器采用不同的采樣矩陣進行上采樣,再對上一級方向分解的子帶進行濾波,得到頻域的方向分解.當方向濾波器組數(shù)目較多時,得到的子帶圖像代表各個方向的分解圖像,具有優(yōu)異的輪廓和邊界保持效果.如果對某尺度下子帶圖像做t級方向分解,可以獲得2t個與原圖像相同尺寸大小的方向子帶圖像.因此,圖像經(jīng)過K級NSCT后可得到個與原圖像尺寸大小相同的子帶圖像,其中tk是尺度k下的方向分解級數(shù)[21?22].綜上描述,NSCT分解得到的子帶圖像具有平移不變性、良好的輪廓和邊界保持效果,這些子帶圖像可以用來作為目標識別的特征圖.
海洋SAR圖像存在嚴重的相干斑噪聲,使得圖像像素的灰度值不完全反映地物的后向散射特性,基于單個像素特征進行分類識別往往達不到很好的效果.考慮到圖像的統(tǒng)計特性,近鄰像素點的特性比較接近,可以聯(lián)合起來進行協(xié)同表示.為了增加不同類別特征的差異性,并且抑制相干斑噪聲的影響,本研究提出一個深度協(xié)同稀疏編碼網(wǎng)絡(DCSCN),采用超像素分割的方法將圖像進行分割,然后對每個超像素塊內像素點對應的特征聯(lián)合優(yōu)化,使得同個超像素塊的像素特征更趨于相似并平滑掉相干斑噪聲.為了獲得更豐富的特征,在DCSCN網(wǎng)絡前先進行預處理,再通過二維Gabor變換和NSCT來提取紋理特征和輪廓特征.圖3給出了整個算法的流程圖.

圖3 基于深層協(xié)同稀疏編碼網(wǎng)絡算法流程圖Fig.3 The flow chart of the proposed algorithm
如圖3所示,本文算法先對輸入SAR圖像進行幾何校正、灰度拉伸和增強Lee濾波去噪的預處理過程,再利用二維Gabor濾波器和NSCT濾波器提取圖像的特征,并進行超像素分割,然后將各個超像素塊特征組輸入DCSCN網(wǎng)絡進行特征優(yōu)化和分類識別,最后輸出識別結果.
本研究中使用了一種基于幾何流的水平集方法(TurborPixels)[23],將SAR圖像分割成M 個超像素塊{S1,S2,···,SM}.把每個超像素塊特征組輸入到DCSCN網(wǎng)絡進行協(xié)同表示和分類識別.下面詳細描述了DCSCN網(wǎng)絡結構和網(wǎng)絡訓練過程.
3.1DCSCN網(wǎng)絡結構
根據(jù)第1節(jié)描述,堆疊自動編碼器可以學習到圖像更高層次的特征,使得不同類別樣本特征區(qū)分度增大.為了讓隱含層單元激勵的平均輸出較小,對每個自動編碼器進行稀疏約束,可以避免參數(shù)取值過大,防止過學習.稀疏自動編碼器的目標是使得解碼輸出盡量接近輸入,本文為了有效抑制相干斑噪聲,希望各個像素特征通過編碼器的解碼輸出與其相應的超像素塊特征組的平均特征接近,提出了協(xié)同稀疏編碼器來對每個超像素塊的特征組聯(lián)合訓練學習.將多個協(xié)同稀疏編碼器堆疊起來構成了深度協(xié)同稀疏編碼網(wǎng)絡(DCSCN),圖4給出了網(wǎng)絡結構圖.圖中網(wǎng)絡共包含L層,第1層到第L?1層網(wǎng)絡為協(xié)同稀疏編碼器,第L層網(wǎng)絡為Softmax分類器.為了進行協(xié)同表示,各層協(xié)同稀疏編碼器的輸入對輸出進行約束,即每個特征的輸出都要與輸入的這組特征的平均值盡量接近.因此,在前向逐層訓練過程中,每層參數(shù)都是將特征組的特征依次輸入網(wǎng)絡后確定的.完成逐層貪心訓練后,整個網(wǎng)絡的參數(shù)通過后向反饋整體微調.

圖4 深度協(xié)同稀疏編碼網(wǎng)絡結構圖Fig.4 The structure of deep collaborative sparse coding network
3.2DCSCN網(wǎng)絡訓練
DCSCN網(wǎng)絡需要先確定各層參數(shù),然后再進行分類識別.網(wǎng)絡各層參數(shù)的優(yōu)化分為預訓練(Pretraining)和整體微調(Fine-tune)兩個過程.預訓練是逐層優(yōu)化各層網(wǎng)絡的參數(shù).整體微調是從頂層引入標簽信息來優(yōu)化整個網(wǎng)絡參數(shù),可以使得網(wǎng)絡輸出的特征更適合于分類器.
3.2.1DCSCN網(wǎng)絡預訓練
預訓練過程是將訓練樣本的特征輸入到網(wǎng)絡,逐層訓練得到各層網(wǎng)絡的參數(shù).對于第k層網(wǎng)絡,參數(shù)優(yōu)化的目標函數(shù)為


其中,ρ是稀疏性參數(shù).ρ?j表示第j個隱含單元在所有超像素塊特征組編碼后的平均激勵值,其中可知,j的大小由網(wǎng)絡權重和偏置決定[24].ρ是人為設定的接近0的數(shù)值,目的是讓j的值接近0,這樣隱含層的輸出值接近0,使得隱含層具有稀疏性.目標方程(6)利用此約束項求解網(wǎng)絡權重和偏置,目的是使得網(wǎng)絡的隱含層輸出具有稀疏性.
根據(jù)網(wǎng)絡的目標函數(shù),通過梯度下降法來確定網(wǎng)絡的參數(shù).對于第k層協(xié)同稀疏編碼器,設定


根據(jù)以上分析,下面給出了利用梯度下降法求第k層網(wǎng)絡參數(shù)的具體過程:

3.2.2DCSCN網(wǎng)絡整體微調
通過預訓練逐層學習各層參數(shù),再從頂層加入訓練樣本標簽信息來優(yōu)化整個網(wǎng)絡參數(shù),可以使得網(wǎng)絡輸出的特征更適合于分類器,即不同類別的樣本特征差異更大.整體微調網(wǎng)絡參數(shù)采用了誤差反向傳播梯度下降算法,設網(wǎng)絡層數(shù)為L,則目標函數(shù)表示如下

步驟1.設權重系數(shù)的修改量為?WWW,考慮到學習速率η,有

同理,可得偏置系數(shù)的修改量


3.2.3分類識別
訓練好整個網(wǎng)絡的參數(shù)后,最后一層Softmax分類器可以用來對樣本進行識別.如果樣本是目標,則對應的標簽為+1;如果樣本不是目標,則對應的標簽為?1.樣本是否為目標的概率計算如下


本文采用人工合成SAR圖像和真實SAR圖像-北戴河海域Radarsat-2數(shù)據(jù)進行實驗.本文與其他幾種常用的識別方法進行比較,分別是支持向量機(Support vector machine,SVM)[25]、聯(lián)合稀疏表示分類算法(Simultaneous orthogonal matching pursuit,SOMP)[26]、未做改進的堆疊自動編碼器(SAE)[24]和稀疏編碼-池化分類算法(Lasso-Pooling)[27].Lasso-Pooling算法,先采用Lasso算法對每個像素點稀疏編碼得到稀疏向量,然后對超像素分割后同一像素塊的各個像素點稀疏向量采用最大值池化(Max pooling)得到一個稀疏向量,最后利用聯(lián)合稀疏表示分類器進行分類.為了比較各個算法的識別效果,采用總分類精度(Overall accuracy,OA)和Kappa系數(shù)(Kappa coefficient,κ)作為識別精度的評價指標.總分類精度反映了整體圖像識別的誤差性,計算公式如下

Kappa系數(shù)反映了樣本的識別結果與真實標記類型相一致的概率,計算公式如下

其中,M表示誤差混淆矩陣(Confusion matrix),是一個C×C的矩陣,C是類別數(shù)量,Mji表示類別j被誤分類為類別i的樣本數(shù)量.N表示總的樣本數(shù)量.
本文實驗還比較了各個算法的計算效率,實驗所用的計算平臺為PC(Intel Core i7 4.0GHz CPU,32GB RAM),操作系統(tǒng)為Windows 7,所有算法采用Matlab編寫.
4.1仿真實驗
4.1.1人工SAR圖像
為了驗證DCSCN網(wǎng)絡在目標識別上的可行性和有效性,設計人工SAR圖像進行實驗.該圖像中包含了多個不同形狀的目標,圖像大小為200×200.通過對該圖像的目標識別來說明DCSCN網(wǎng)絡的普適性.圖5(a)和圖5(b)分別給出了人工SAR圖像及其相應的目標真值圖.

圖5 人工SAR圖像數(shù)據(jù)Fig.5 The artificial SAR data
4.1.2網(wǎng)絡參數(shù)設置
根據(jù)第3節(jié)介紹,本文分別利用二維Gabor變換和NSCT來提取圖像紋理特征和輪廓特征,初始特征會對最后的識別精度有一定影響.根據(jù)經(jīng)驗,采用5個尺度、8個方向的二維Gabor濾波器組來提取圖像紋理特征,利用3級NSCT分解得到15個子帶圖像作為輪廓特征,將這些特征堆疊起來構成55維的特征.然后,采用TurborPixels將圖像分割為1000個超像素塊,將各個小塊特征組輸入到DCSCN網(wǎng)絡中進行特征學習和分類識別.
DCSCN網(wǎng)絡的結構和參數(shù)對識別精度有很大的影響.考慮到算法的復雜度,設計三層結構的DCSCN,前兩層進行特征稀疏編碼,最高層進行分類識別.根據(jù)實驗經(jīng)驗,網(wǎng)絡的權重衰減系數(shù)λ設置為0.005,稀疏性懲罰因子β設置為0.1,稀疏性參數(shù)ρ設置為0.2.各層隱含單元數(shù)目對分類識別的精度有明顯影響,因此這里詳細描述了隱含單元數(shù)目的確定過程.由于最高層用于識別,最高層隱含單元數(shù)等于類別數(shù),所以只需要分析前兩層隱含單元數(shù)目對識別結果的影響.實驗中,隨機選取20%的超像素塊作為訓練集,其他超像素塊用來驗證算法的識別精度.通過改變其中一個參數(shù)的同時固定另一個參數(shù),來討論隱含單元數(shù)目對結果的影響.
圖6(a)和圖6(b)分別給出了總分類精度和Kappa系數(shù)隨著兩層隱含單元數(shù)目變化的變化情況.實驗中,第一層隱含單元數(shù)目在20到150之間變化,第二層隱含單元數(shù)目在20到100之間變化.實驗結果表明,當前兩層的隱含單元數(shù)目分別為100和40時,網(wǎng)絡的識別精度最高.當?shù)诙与[含單元數(shù)目一定,第一層隱含單元數(shù)目取值在90到110之間時,識別的精度優(yōu)于其他情況的結果.即第一層隱含單元數(shù)目比輸入樣本特征維度要高,其原因是輸入的樣本初始特征是非線性的,當隱含單元數(shù)目比輸入單元數(shù)目大時,網(wǎng)絡第一層相當于對特征進行高維空間映射,使得特征更加線性化、更利于分類識別.當?shù)谝粚与[含單元數(shù)目一定,第二層隱含單元數(shù)目取值在30到40之間時,識別的精度優(yōu)于其他情況的結果.網(wǎng)絡第二層的作用相當于對特征進行降維,降維處理不能降得太低或者太高.這是因為降維維度過低會壓縮掉有用信息,而降維維度較高時訓練分類器容易發(fā)生過擬合現(xiàn)象.

圖6 DCSCN網(wǎng)絡參數(shù)設置Fig.6 Parameter setting of the DCSCN
4.1.3對比實驗結果與分析
為了證明DCSCN在SAR圖像目標識別中的效果,本文與SVM算法、SOMP算法、Lasso-Pooling算法及未做改進的SAE網(wǎng)絡進行對比.對比算法采用的樣本特征與輸入到DCSCN網(wǎng)絡的特征一致,都是由二維Gabor濾波器和NSCT濾波器得到的55維特征.根據(jù)前述實驗分析,DCSCN網(wǎng)絡為三層,前兩層的隱含單元數(shù)目分別為100和40.SVM采用了高斯徑向基作為核函數(shù),參數(shù)通過十次交叉驗證得到.SOMP算法、Lasso-Pooling算法中的主要參數(shù)為稀疏度和重建誤差極值,分別設定為10和10?3.SAE網(wǎng)絡采用了與本文提出的DCSCN網(wǎng)絡相同的結構,都設計了三層結構的網(wǎng)絡,前兩層的隱含單元數(shù)目分別為100和40,最高層進行分類識別.通過五次實驗來分析各個算法的識別效果,每次實驗隨機選取20%的樣本作為訓練集,其他樣本作為測試集,計算五次實驗結果的均值和標準差.表1給出了各種算法識別精度和算法效率的結果對比.
根據(jù)表1結果,DCSCN識別精度要明顯高于其他四種算法.對比SAE和DCSCN實驗結果,基于SAE提出的DCSCN網(wǎng)絡可以提高目標識別精度,說明本文對DCSCN網(wǎng)絡的設計是有效的.DCSCN網(wǎng)絡考慮了近鄰像素的協(xié)同性,通過聯(lián)合優(yōu)化得到近鄰像素特征表示,能平滑掉相干斑噪聲,從而有效降低相干斑噪聲對識別結果的影響.由于SVM算法、SOMP算法、Lasso-Pooling算法和DCSCN網(wǎng)絡輸入的初始特征都是由二維Gabor濾波器和NSCT濾波器分別提取的紋理特征和輪廓特征,而DCSCN網(wǎng)絡識別精度得到明顯提高,這說明經(jīng)過DCSCN網(wǎng)絡優(yōu)化后的不同類別特征的區(qū)分度更大,更適合于分類器進行識別.對比各個算法的計算耗時發(fā)現(xiàn),DCSCN網(wǎng)絡計算效率比SVM算法略差,但要優(yōu)于其他方法.這是由于SOMP算法和Lasso-Pooling算法的計算復雜度隨著樣本數(shù)成高次方增長,而DCSCN網(wǎng)絡計算復雜度隨迭代次數(shù)、樣本數(shù)和網(wǎng)絡節(jié)點數(shù)線性變化.因此,基于深度學習神經(jīng)網(wǎng)絡的DCSCN網(wǎng)絡計算復雜度低于基于稀疏編碼的SOMP算法及Lasso-Pooling算法.

表1 各個算法在人工SAR圖像上識別結果對比Table 1 Recognition performance comparison of different algorithms on the artificial SAR image
圖7顯示了五種算法的目標識別結果圖.對比五幅圖可知,DCSCN網(wǎng)絡表現(xiàn)出更好的識別結果,誤分類點比其他方法更少.同時發(fā)現(xiàn),SOMP算法和Lasso-Pooling算法結果圖的孤立誤分類點也很少,這是因為SOMP算法、Lasso-Pooling算法和本文DCSCN網(wǎng)絡都考慮了近鄰像素的協(xié)同性,而通過空間近鄰協(xié)同可以平滑掉相干斑噪聲,所以這三種算法對相干斑噪聲抑制作用明顯.由于DCSCN算法有優(yōu)異的特征表示能力,所以其識別精度明顯高于SOMP算法和Lasso-Pooling算法.此外,SVM算法和SAE算法結果的孤立誤分類點很多,原因是這兩種算法是基于像素的分類識別,未考慮空間協(xié)同相關性,相關斑噪聲對識別產(chǎn)生很大的影響.

圖7 人工SAR圖像目標識別結果Fig.7 Target recognition results of the artificial SAR image
4.2浮筏識別實驗
為了驗證DCSCN網(wǎng)絡在海洋浮筏養(yǎng)殖目標識別的有效性,選取北戴河海域作為研究區(qū)域.圖8(a)和圖8(b)是北戴河海域的兩個不同傳感器的多光譜圖像,分別是Landsat-8衛(wèi)星圖像和資源三號衛(wèi)星圖像.圖8(c)為Radarsat-2衛(wèi)星的SAR圖像,極化方式為HH,分辨率為5m.比較這三幅圖可以發(fā)現(xiàn),多光譜圖像不能有效地獲取北戴河海域的浮筏目標,而在SAR圖像中有清晰的浮筏目標.這是由于海洋散射信號較弱,光譜成像衛(wèi)星數(shù)據(jù)難以獲取浮筏信息,而SAR是主動式微波成像,利于獲取海洋信息.圖8(d)為現(xiàn)場測繪時拍攝的實景圖片.從圖8(c)選取兩塊海域的圖像來驗證本文提出算法的效果,選取的圖像1和圖像2分別如圖8(e)和圖8(g),圖像大小分別為1275×1140和600×600.根據(jù)現(xiàn)場測繪的數(shù)據(jù)繪制出相應的真值圖如圖8(f)和8(h).

圖8 北戴河區(qū)域SAR數(shù)據(jù)Fig.8 The original SAR data of Beidaihe area
在SAR圖像1上進行實驗,先做幾何校正、灰度拉伸和增強Lee濾波去噪,再采用二維Gabor變換和NSCT提取圖像紋理特征和輪廓特征.與仿真實驗相同,采用3級NSCT分解和5個尺度、8個方向的二維Gabor濾波器得到55維的特征.采用TurborPixels將圖像分割為40000個超像素塊,將各個小塊輸入到DCSCN網(wǎng)絡中進行特征學習并分類識別.DCSCN網(wǎng)絡共三層,前兩層的隱含層單元數(shù)目分別設置為100和40.網(wǎng)絡其他參數(shù)的設置與仿真實驗相同.同樣,為說明本文算法在海洋浮筏養(yǎng)殖目標識別的優(yōu)越性能,本文與SVM、SOMP、Lasso-Pooling和SAE進行了比較.表2給出了各個算法識別精度和算法效率的對比,這里每個算法效率的統(tǒng)計都是指整個識別過程,即從輸入圖像到最后得出分類識別結果.圖9給出了各個算法目標識別結果圖.
根據(jù)表2結果,DCSCN網(wǎng)絡的總分類精度和Kappa系數(shù)都明顯好于其他四種算法.結果表明,本文DCSCN網(wǎng)絡具有優(yōu)異的特征表示能力,可以得到區(qū)分性更大、更適合分類器的特征.同時,DCSCN通過空間近鄰協(xié)同約束,有效地抑制SAR圖像相干斑噪聲的影響,所以在分類精度上明顯優(yōu)于現(xiàn)有的三種方法.此外,DCSCN的算法效率更優(yōu),比其他四種算法耗時都少.這是由于DCSCN網(wǎng)絡計算復雜度隨迭代次數(shù)、樣本數(shù)和網(wǎng)絡節(jié)點數(shù)線性變化,而SVM算法、SOMP算法和Lasso-Pooling算法的計算復雜度隨著樣本數(shù)成高次方增長,所以DCSCN網(wǎng)絡計算復雜度較低.在圖像尺寸較大、樣本較多的時候,DCSCN能夠有效地降低計算量,使得計算效率優(yōu)于其他算法.

表2 各個算法在SAR圖像1浮筏識別結果對比Table 2 Recognition performance comparison of different algorithms on the first SAR image
對比圖9各個算法的結果圖,DCSCN識別效果要明顯優(yōu)于其他四種算法的結果.分析發(fā)現(xiàn),SVM和SAE識別結果圖存在較多誤分類噪點,而本文算法、SOMP算法和Lasso-Pooling算法誤分類噪點較少.這是由于這三種算法都采用了近鄰協(xié)同約束,可以有效抑制SAR圖像相干斑噪聲.同時,本文算法的誤分類噪點更少,說明本文算法在抑制相干斑噪聲方面的效果更好.本文算法要優(yōu)于SAE算法結果,說明稀疏約束和協(xié)同約束能使得深度網(wǎng)絡學到區(qū)分性更大的特征.此外,在實際SAR圖像上的實驗結果與人工SAR圖像的實驗結果得到了一致的結論,充分證明了算法的有效性和適應性.
由于海洋不同區(qū)域的后向散射特性存在差異,為了說明本文DCSCN網(wǎng)絡對不同海域浮筏的識別能力,對SAR圖像2進行相同的實驗.與SAR圖像1上實驗一樣,先進行幾何校正、灰度拉伸和增強Lee濾波去噪,再采用5個尺度、8個方向的二維Gabor濾波器和3級NSCT濾波器提取出55維的特征,然后采用TurborPixels將圖像分割為10000個超像素塊,最后將各個小塊輸入到三層結構的DCSCN網(wǎng)絡中進行特征學習和分類識別.表3給出了各個算法識別精度和算法效率的對比,圖10給出了各個算法目標識別結果圖.
分析圖10和表3結果,DCSCN網(wǎng)絡的識別精度和算法效率都優(yōu)于其他四種算法,這一結論和前面分析一致.這充分說明,不同海域即使海洋后向散射特性有差別的情況下,DCSCN網(wǎng)絡都能達到較好的浮筏養(yǎng)殖識別結果.

表3 各個算法在SAR圖像2浮筏識別結果對比Table 3 Recognition performance comparison of different algorithms on the second SAR image

圖9 SAR圖像1浮筏識別結果Fig.9 Target recognition results of the first SAR image

圖10 SAR圖像2浮筏識別結果Fig.10 Target recognition results of the second SAR image
本文針對海洋遙感SAR圖像嚴重的相干斑噪聲污染和SAR圖像特征單一的問題,提出一種深度協(xié)同稀疏編碼網(wǎng)絡,進行SAR圖像特征表示和目標識別.通過人工SAR圖像和北戴河兩個海域浮筏養(yǎng)殖SAR圖像的實驗,證明本文所提網(wǎng)絡的有效性和適用性.結果表明,深度協(xié)同稀疏編碼網(wǎng)絡不僅可以有效優(yōu)化近鄰像素特征組來提高識別精度,而且能有效抑制SAR圖像相干斑噪聲的影響.此外,深度協(xié)同稀疏編碼網(wǎng)絡計算效率較高,在圖像尺寸較大時表現(xiàn)出更好的效率.
References
1 Yu Hang,Jiao Li-Cheng,Liu Fang.Context based unsupervised hierarchical iterative algorithm for SAR segmentation. Acta Automatica Sinica,2014,40(1):100?116(余航,焦李成,劉芳.基于上下文分析的無監(jiān)督分層迭代算法用于SAR圖像分割.自動化學報,2014,40(1):100?116)
2 Zhao Ming-Bo,He Jun,F(xiàn)u Qiang.Survey on fast CFAR detection algorithms for SAR image targets.Acta Automatica Sinica,2012,38(12):1885?1895(趙明波,何峻,付強.SAR圖像CFAR檢測的快速算法綜述.自動化學報,2012,38(12):1885?1895)
3 Chu Jia-Lan,Zhao Dong-Zhi,Zhang Feng-Shou.Wakame raft interpretation method of remote sensing based on association rules.Remote Sensing Technology and Application,2012,27(6):941?946(初佳蘭,趙冬至,張豐收.基于關聯(lián)規(guī)則的裙帶菜筏式養(yǎng)殖遙感識別方法.遙感技術與應用,2012,27(6):941?946)
4 Fan Jian-Chao,Zhang Feng-Shou,Zhao Dong-Zhi,Wen Shi-Yong,Wei Bao-Quan.Floating raft aquaculture extraction based on high resolution satellite remote sensing SAR images.In:Proceedings of the 2nd Symposium on Disaster Risk Analysis and Management in Chinese Littoral Regions. 2014.59?63(范劍超,張豐收,趙冬至,文世勇,衛(wèi)寶泉.基于高分辨率衛(wèi)星遙感SAR圖像的海洋浮筏養(yǎng)殖信息提取.見:第二屆中國沿海地區(qū)災害風險分析與管理學術研討會.2014.59?63)
5 Qazi W A,Emery W J,F(xiàn)ox-Kemper B.Computing ocean surface currents over the coastal california current system using 30-min-lag sequential SAR images.IEEE Transactions on Geoscience and Remote Sensing,2014,52(12): 7559?7580
6 Pan De-Lu,Lin Ming-Shen,Mao Zhi-Hua.Microwave Remote Sensing and Application of Ocean.Beijing:Ocean Press,2013.(潘德爐,林明森,毛志華.海洋微波遙感與應用.北京:海洋出版社,2013.)
7 Collins M J,Allan J M.Modeling and simulation of SAR image texture.IEEE Transactions on Geoscience and Remote Sensing,2009,47(10):3530?3546
8 Liu C J,Wechsler H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition.IEEE Transactions on Image Processing,2002,11(4):467?476
9 Do M N,Vetterli M.The contourlet transform:an efficient directional multiresolution image representation. IEEE Transactions on Image Processing,2005,14(12): 2091?2106
10 Da Cunha A L,Zhou J P,Do M N.The nonsubsampled contourlet transform:theory,design,and applications. IEEE Transactions on Image Processing,2006,15(10): 3089?3101
11 Yang X H,Jiao L C.Fusion algorithm for remote sensing images based on nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(3):274?281
12 Hinton G E,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7): 1527?1554
13 Salakhutdinov R,Tenenbaum J B,Torralba A.Learning with hierarchical-deep models.IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8): 1958?1971
14 Goh H,Thome N,Cord M,Lim J H.Learning deep hierarchical visual feature coding.IEEE Transactions on Neural Networks and Learning Systems,2014,25(12):2212?2225
15 Zheng Yin,Chen Quan-Qi,Zhang Yu-Jin.Deep learning and its new progress in object and behavior recognition.Journal of Image and Graphics,2014,19(2):175?184(鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展.中國圖象圖形學報,2014,19(2):175?184)
16 Chen X Y,Xiang S M,Liu C L,Pan C H.Vehicle detection in satellite images by hybrid deep convolutional neural networks.IEEE Geoscience and Remote Sensing Letters,2014,11(10):1797?1801
17 Chen Y S,Lin Z H,Zhao X,Wang G,Gu Y F.Deep learningbased classification of hyperspectral data.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094?2107
18 Feng Bo,Chen Bo,Wang Peng-Hui,Liu Hong-Wei.Feature extraction method for radar high resolution range profile targets based on robust deep networks.Journal of Electronics&Information Technology,2014,36(12):2949?2955(馮博,陳渤,王鵬輝,劉宏偉.基于穩(wěn)健深層網(wǎng)絡的雷達高分辨距離像目標特征提取算法.電子與信息學報,2014,36(12): 2949?2955)
19 Li Shuai,Xu Yue-Lei,Ma Shi-Ping,Ni Jia-Cheng,Wang Kun.SAR target recognition using wavelet transform and deep sparse autoencoders.Video Engineering,2014,38(13): 31?35(李帥,許悅雷,馬時平,倪嘉成,王坤.基于小波變換和深層稀疏編碼的SAR目標識別.電視技術,2014,38(13):31?35)
20 Rai P,Khanna P.A gender classification system robust to occlusion using gabor features based 2D2PCA.Journal of Visual Communication and Image Representation,2014,25(5):1118?1129
21 Zhang Qiang,Guo Bao-Long.Fusion of multi-sensor images based on the nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(2):135?141(張強,郭寶龍.基于非采樣Contourlet變換多傳感器圖像融合算法.自動化學報,2008,34(2):135?141)
22 Yan C M,Guo B L,Yi M.Fast algorithm for nonsubsampled contourlet transform.Acta Automatica Sinica,2014,40(4): 757?762
23 Levinshtein A,Stere A,Kutulakos K N,F(xiàn)leet D J,Dickinson S J,Siddiqi K.TurboPixels:fast superpixels using geometric flows.IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(12):2290?2297
24 Ng A.Sparse autoencoder[Online],available:http://web. stanford.edu/class/cs294a/sae/,November 8,2015.
25 Chang C C,Lin C J.LIBSVM:a library for support vector machines.ACM Transactions on Intelligent Systems and Technology,2011,2(3):Article No.27
26 Chen Y,Nasrabadi N M,Tran T D.Simultaneous joint sparsity model for target detection in hyperspectral imagery. IEEE Geoscience and Remote Sensing Letters,2011,8(4): 676?680
27 Mairal J,Bach F,Ponce J.Sparse modeling for image and vision processing.Foundations Trend in Computer Graphics Vision,2014,8(2?3):85?283

耿 杰大連理工大學電子信息與電氣工程學部博士研究生.主要研究方向為SAR圖像處理,模式識別.E-mail:gengjie@mail.dlut.edu.cn
(GENG JiePh.D.candidate at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers SAR image processing and pattern recognition.)

范劍超國家海洋環(huán)境監(jiān)測中心,大連理工大學電子信息與電氣工程學部副研究員.主要研究方向為神經(jīng)網(wǎng)絡,模式識別和遙感圖像處理.本文通信作者.E-mail:fjchaonmemc@163.com
(FAN Jian-ChaoAssociate professor at National Marine Environment Monitoring Center and Dalian University of Technology.His research interest covers neural network,pattern recognition,and remote sensing image processing.Corresponding author of this paper.)

初佳蘭國家海洋環(huán)境監(jiān)測中心工程師.主要研究方向為海域動態(tài)衛(wèi)星遙感應用.E-mail:jlchu@nmemc.org.cn
(CHUJia-LanEngineer at National Marine Environment Monitoring Center.Her research interest covers sea dynamic surveillance remote sensing application.)

王洪玉大連理工大學電子信息與電氣工程學部教授.主要研究方向為圖像處理,模式識別和無線傳感器網(wǎng)絡.E-mail:whyu@dlut.edu.cn
(WANG Hong-YuProfessor at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers image processing,pattern recognition,and wireless sensor networks.)
Research on Marine Floating Raft Aquaculture SAR Image Target Recognition Based on Deep Collaborative Sparse Coding Network
GENG Jie1FAN Jian-Chao1,2CHU Jia-Lan2WANG Hong-Yu1
Floating raft aquaculture is widely distributed in the offshore ocean of China.Since raft information cannot be obtained accurately in the visible remote sensing image,active imaging images acquired from synthetic aperture radar(SAR)are applied.However,oceanic SAR images are seriously contaminated by speckle noise,and effective features of SAR images are deficient,which make recognition difficult.In order to overcome these problems,a deep collaborative sparse coding network(DCSCN)is proposed to extract features and conduct recognition automatically.The proposed method extracts texture features and contour features from the pre-processed image firstly.Then,it segments the image into patches and learns features of each patch collaboratively through the DCSCN network.The optimized features are used for recognition finally.Experiments on the artificial SAR image and the images of Beidaihe demonstrate that the proposed DCSCN network can accurately obtain the area of floating raft aquaculture.Since the network can learn discriminative features and integrate the correlated neighbor pixels,the DCSCN network improves the recognition accuracy and has better performance in overcoming the contamination of speckle noise.
Synthetic aperture radar(SAR),deep learning,sparse auto-encoders,floating raft aquaculture,target recognition
Manuscript July 6,2015;accepted January 15,2016
10.16383/j.aas.2016.c150425
Geng Jie,F(xiàn)an Jian-Chao,Chu Jia-Lan,Wang Hong-Yu.Research on marine floating raft aquaculture SAR image target recognition based on deep collaborative sparse coding network.Acta Automatica Sinica,2016,42(4): 593?604
2015-07-06錄用日期2016-01-15
國家自然科學基金(61273307,61301130),中國博士后面上基金(2014M551082),北戴河鄰近海域典型生態(tài)災害與污染監(jiān)控海洋公益專項(201305003),海域使用動態(tài)監(jiān)測和污染監(jiān)測研究專項資助
Supported by National Natural Science Foundation of China(61273307,61301130),the China Postdoctoral Science Foundation(2014M551082),the Public Welfare Project of Beidaihe Marine Ecological Disasters and Pollution Monitoring(201305003)and the Research of Dynamic Monitoring and Pollution Monitoring of Sea Area
本文責任編委劉躍虎
Recommended by Associate Editor LIU Yue-Hu
1.大連理工大學電子信息與電氣工程學部大連1160242.國家海洋環(huán)境監(jiān)測中心大連116023
1.Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology,Dalian 1160242.Na-tional Marine Environment Monitoring Center,Dalian 116023