何錦濤,張文婷,宋嘉玟,趙耀東,張 朋
西南石油大學計算機科學學院,四川 成都 610500
高分遙感影像分類是指按照某種規則將每個像素點或者每塊區域根據其在不同譜段的光譜特征、空間結構特征或其他信息劃分為不同的類別[1],這些類別包括房屋、河流、田地等。目前大多數關于卷積神經網絡在高分遙感影像分類方面的研究都實現了基本的分類。然而,對地形較為復雜的環境進行分類時,卷積神經網絡存在特征提取精度低、模型表達和建模能力有局限性、缺少顯著標記等問題。
本文通過對傳統卷積神經網絡結構進行改進來完成高分辨率遙感影像的分類標記[2]。改進的神經網絡結構,增添了針對特征圖的強化模塊和通道域的注意力模塊,因此模型可以實現對圖像更準確的預測,并具有更強的泛化能力[3]。
試驗使用數據擴充和增強技術[4]對選取地的樣本圖像進行了預處理,使試驗樣本數據更加豐富,更有利于試驗的開展。試驗結果用于評價提出的改進算法的準確性和有效性,并采用4種評價參數來對試驗結果進行評估。
卷積神經網絡(convolutional neural network,CNN)是計算機視覺應用所使用的一種深度學習模型,成功地應用于當今的信號處理、模式識別、生物醫學等領域。CNN將輸入圖像數據分解為不同像素大小的層,在輸入的圖像數據中學習輸入和輸出的映射關系。CNN的輸入層是由圖片像素轉化來的數組;隱藏層主要由卷積層、池化層和全連接層交替連接組成;輸出層通常是全連接層,在圖像處理問題中,輸出層使用邏輯回歸函數或softmax函數輸出分類標簽[5]。在圖像語義分割中,輸出層直接輸出每個像素的分類結果。
在經典的CNN模型中,輸入層輸入的數據首先進入第1個卷積層,每個卷積層帶有其特有的過濾器,是一個數字矩陣。在卷積層中,輸入的矩陣與過濾器進行卷積運算后得到一個新的矩陣,即特征圖。特征圖在池化層中進行降維操作后會進入下一個池化層,經過卷積運算后再次被池化。由于過濾器的不同,在不同的卷積層中,過濾器會對輸入圖像進行輪廓檢測、邊緣檢測、模糊化、銳化等多種操作[6]。經過多次卷積和池化操作后,數據抵達全連接層,全連接層通過激活函數對圖像進行分類,最終的輸出結果表示輸入圖像輸入某個類別的概率。
原始的卷積網絡模型存在一些缺點,主要包括:模型提取圖像特征信息的準確率較低且信息之間的相關性較弱;模型不能充分挖掘圖像中多種類型的特征信息;網絡模型對表達能力和泛化能力較弱等。針對這些缺點,本文在原有卷積網絡模型的基礎上又增加了特征強化模塊和通道域注意力模塊,以提高卷積神經網絡的性能。
原始網絡在對圖像進行特征提取時只是獲取了區域中非零部分的信息,模型采用空洞卷積的稀疏采樣方式會引起網格效應,會導致模型訓練的不充分,從而缺少相關性的特征映射信息。
為了解決這個問題,本文設計了特征圖的強化模塊。該模塊的核心步驟為:將原始特征圖輸入至1×1的卷積核進行降維,再將其分別輸入至2個低擴張率的空洞卷積進行特征信息提取的學習,最后輸出更具判別性的特征圖。同時,在每次卷積后增設批量處理歸一化處理層用來標準化每個卷積核的數據,這提高了模型的運算效率和網絡的收斂速率,減少了過擬合的現象,提高了對鄉村遙感影像的特征信息提取的精度和相關性。
原始卷積神經網絡隨著網絡層的不斷深入,模型的感受隨之擴大,對特征圖的分辨率也隨之下降,因此,在淺層網絡上,模型提取到的更多是圖像的細節特征,而在深層網絡上,模型獲取到的主要是圖像的語義特征信息。
引入通道域注意力模塊能使模型更好地融合帶有不同特征信息的特征圖。該模塊的核心步驟如下。
對于高層特征,首先將其輸入至卷積核中,對特征圖進行空間維度上的壓縮,該部分通過全局平均池化來完成;接著,模型對壓縮后的特征圖進行激活和歸一化,激活函數使用softmax函數;接下來對通道進行升維,并使用ReLu函數將權重歸一化;最后,使用scale函數完成每一個通道的權重分配。
對于低層特征,首先輸入至1×1卷積核進行處理,接著在與通道權重相乘后,與高層特征一起合并輸出。
該模塊讓卷積網絡模型可以對信息的關鍵程度有更精準的了解,更多地去關注相對重要的通道,從而提高特征的表征能力。
改進后的卷積網絡是基于一般的卷積網絡結構進行了增添處理,改進后的模型加入了特征強化模塊和通道域注意力模塊。特征強化模塊用來提高遙感圖像特征信息的相關性和準確性,同時緩解網格效應;通道域注意力模塊將深層特征進行輸入,低層特征進行加權,有效地保存了特征圖的細節信息,且提升了卷積網絡的信息提取能力和精度。
改進后的卷積網絡結構如圖1所示:首先,輸入一張高分遙感影像圖進行預處理操作,包括灰度化、標準化和裁剪等;然后,通過卷積層和池化層進行特征提取和降維,并輸出步幅為4的中間結果;接著,經過Block1、Block2、Block3,逐步提高輸出步幅,以獲取圖像的不同尺度信息和更加詳細的語義特征,在Block4中,引入了特征強化模塊對特征圖進行處理,提高其密集性和相關性,從而更好地實現表征性和分類效果;隨后,將特征圖進行2倍上采樣,輸入通道域注意力模塊對低層特征進行加權融合,再次進行2倍上采樣,最后進行4倍上采樣得到最終輸出結果。

圖1 改進后的卷積網絡結構
本文將研究區域選取在我國海南省的瓊海沙美村,試驗目的是對鄉村生態特征進行提取和標記。試驗選取了幾幅具有代表性的遙感影像作為試驗數據集,并基于該數據集進行模型訓練。由于圖像數據集中的樣本過大,所以在對圖像進行特征提取之前,需要對樣本進行切割處理,本文將其切割為256×256像素大小的圖像。
由于卷積神經網絡使用到的參數數量龐大,當模型在學習訓練的過程中數據量不足時,很容易出現過擬合的問題。為解決該問題,對圖像進行了數據擴充和增強,經過處理后,數據集的數量得到了擴大,數據集的多樣性大大豐富,算法的魯棒性也得到提升。本文將數據集按照4:1的比例分為訓練集和驗證集。訓練的過程中使用SGD算法來更新卷積神經網絡中的參數:學習率初始值設置為0.01,動量設置為0.85,并且每經過10 000輪迭代就將學習率縮小為原來的1/10,經過40 000次迭代結束訓練,得到改進后的卷積神經網絡模型。具體的試驗流程如圖2所示。

圖2 試驗流程
試驗結果如圖3所示,圖3(a)為選取的特定地區的高分遙感影像,圖3(b)為改進的卷積神經網絡處理后的圖像,其中灰色部分為提取出的目標鄉村建筑的區域,可以看到改進后的卷積神經網絡能夠較好地提取鄉村生態特征。

圖3 試驗結果
為了更全面且準確地評估該算法的精確度,使用了Kappa系數、正確率、虛警率和漏檢率4種評價參數。評估依據為:4種評價參數的范圍均位于0~1,正確率和Kappa系數的值在該范圍內越高,模型的分類效果越好;虛警率和漏檢率在該范圍內值越低,模型的分類效果越好。每組試驗的分類準確率和評價指標如表1所示,該結果充分驗證了本文提出的改進卷積神經網絡模型適用于大幅高空間分辨率遙感影像的處理,具有良好的有效性和可行性。

表1 試驗結果評價
本文使用了改進的卷積神經網絡實現對鄉村遙感影像的特征提取。試驗結果表明,此方法比傳統的網絡結構信息提取的效果更好、精度更高。
本文使用海南省的鄉村遙感圖像作為原始樣本數據,樣本數量較少,因此在試驗過程中對樣本進行了數據擴充和增強。此外,使用了特征強化模塊和通道域注意力模塊,對網絡模型進行較大的改進,大大提升了網絡對特征信息的提取能力。試驗選取的區域大多分布在農田、草地和水域等鄉村典型區域,地貌特征較復雜。由于原始樣本數量的限制,模型在對鄉村遙感圖像的特征提取方面的表現沒有達到預期效果,未來在樣本數據的處理方面仍有較大改進和完善的空間,同時也可嘗試多種遙感影像特征提取技術的結合處理,以便更高效地提取出鄉村遙感圖像的有效特征信息。