栗華杰 李格 蘇煉 蔡繼駒
(西南科技大學(xué) 四川省綿陽市 621000)
航空遙感圖像作為一種常見的遙感圖像之一,具有分辨率高、尺度多元性強、排列密集、目標(biāo)方向多樣化等特點,其成像方式主要以航空攝影成像方式為主。通過將卷積神經(jīng)網(wǎng)絡(luò)算法與遙感圖像目標(biāo)檢測技術(shù)進行充分結(jié)合,不僅可以提高網(wǎng)絡(luò)學(xué)習(xí)能力,還能提高遙感數(shù)據(jù)處理效率和效果,為實現(xiàn)遙感圖像數(shù)據(jù)集的優(yōu)化發(fā)揮出重要作用。因此,在卷積神經(jīng)網(wǎng)絡(luò)算法的應(yīng)用背景下,如何科學(xué)應(yīng)用遙感圖像目標(biāo)檢測技術(shù)是技術(shù)人員必須思考和解決的問題。
卷積神經(jīng)網(wǎng)絡(luò)(英文簡稱為“CNN”),主要是由Wiesel 通過研究貓的視覺皮層的基礎(chǔ)上提出的,后來,由提出了一種新的概念,即:“神經(jīng)認知機”,并將其作為一種卷積神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)方式。由此可見,卷積神經(jīng)網(wǎng)絡(luò)屬于一種新型、先進的深度學(xué)習(xí)模型,主要是在人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展而來的,是一種深度學(xué)習(xí)法。
對于卷積神經(jīng)網(wǎng)絡(luò)而言,其結(jié)構(gòu)主要由以下四個部分組成,分別是卷積層、全連接層、輸出層以及池化層。其中,卷積層主要是指通過利用卷積運算方式[1],對已輸入的圖像的特征進行提取。全連接層主要集中分布于網(wǎng)絡(luò)結(jié)構(gòu)的底部,其個數(shù)較多,通過利用全連接層,可以對已得到的二維特征圖特征進行提取和分類,在此基礎(chǔ)上,對對其進行轉(zhuǎn)化處理,使其轉(zhuǎn)化為具有一維特征的向量。池化層主要集中分布于卷積層的后方[2],其功能主要是指采用降采處理的方式,對輸入圖像特征進行統(tǒng)一化處理,以保證運算過程的簡潔性,從而提高運算效率和效果。池化層在進行運算的過程中,重點引入了激活函數(shù),通過利用這一函數(shù),在保證圖像特征數(shù)量不變的情況下,可以實現(xiàn)對多個特征圖的降維處理,為進一步提高網(wǎng)絡(luò)結(jié)構(gòu)的非線性表達能力發(fā)揮出重要作用。比較具有代表性的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有兩種[3],一種是LeNet-5,另一種是AlexNet。隨著人們對其研究內(nèi)容的不斷加深,具有深層次的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不斷涌現(xiàn),這些結(jié)構(gòu)包含ZFNet 網(wǎng)絡(luò)結(jié)構(gòu)、ResNet 網(wǎng)絡(luò)結(jié)構(gòu)等。
卷積神經(jīng)網(wǎng)絡(luò)具有以下三大特點:
(1)稀疏連接。稀疏連接主要集中體現(xiàn)在卷積結(jié)構(gòu)中,通過采用局部連接方式,可以有效地簡化計算流程,縮小整個計算量,從而最大限度地提高卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型處理效率和效果。
(2)降采樣。降采樣主要是指主要集中體現(xiàn)在池化層中,通過借助池化層,采用降采處理的方式[4],確保網(wǎng)絡(luò)結(jié)構(gòu)具有強大的記憶功能,確保特征圖像在扭曲或者縮放處理中始終保持不變形狀態(tài),這樣一來,為降低運算過程的繁瑣性和復(fù)雜性創(chuàng)造良好的條件。
(3)權(quán)值共享。權(quán)值共享主要是指通過采用卷積操作的方式,對所有卷積核與特征圖像的集中化處理,從而自動形成多種新特征圖像,而新特征圖像內(nèi)部的各個像素點均實現(xiàn)了對同樣權(quán)重值的共享,確保卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)具有強大的平移不變功能,為最大限度地降低計算量,提高計算效率和效果打下堅實的基礎(chǔ)。
總之,通過充分利用以上三大特點,可以從平移、縮放、扭曲三個環(huán)節(jié)出發(fā),實現(xiàn)對圖像特征的隨意處理。
在卷積神經(jīng)網(wǎng)絡(luò)算法 的應(yīng)用背景下, 遙感圖像目標(biāo)檢測流程主要體現(xiàn)在以下幾個方面:
(1)輸入圖像,通過對已輸入 圖像進行剪裁、縮放、翻轉(zhuǎn)等一系列預(yù)處理,提高數(shù)據(jù)增強效果;
(2)通過借助CNN 模型,完成對圖像特征的快速提取和科學(xué)分類,為后期遙感圖像目標(biāo)檢測工作的有效落實提供重要的依據(jù)和參考。
(3) 最后,將最終的處理結(jié)果輸出。
遙感圖像目標(biāo)檢測算法 主要包含以下兩種技術(shù):
(1)雙步目標(biāo)檢測算法。該算法將遙感圖像目標(biāo)檢測過程劃分為兩個不同階段:首先,自動生成若干個的候選區(qū)域;其次,提取候選區(qū)域相關(guān)特征,并對其進行直接分類和檢測,
(2)單步目標(biāo)檢算法。該算法在具體的運用中, 省掉了對候選區(qū)域特征的提取操作,僅僅對圖像特征進行直接分類和檢測即可,極大地提高了遙感圖像目標(biāo)檢測效率和效果。
通常情況下,雙步目標(biāo)檢測算法具有準(zhǔn)確性高、處理速度慢特征,而單步目標(biāo)檢測算法具有處理速度快,準(zhǔn)確性低等特征,而遙感圖像在具體的檢測中,通常對準(zhǔn)確度提出了更高的要求 ,因此,本文在對遙感圖像目標(biāo)檢測進行研究的過程中,主要以雙步目標(biāo)檢測算法應(yīng)用為主。
FasterR-RCNN 算法作為一種常用的識別檢測算算法,主要由以下兩個部分組成,分別是RPN 和FastR-CNN,其中,RPN 屬于區(qū)域性生成網(wǎng)絡(luò),主要用于對遙感圖像目標(biāo)的識別以及具體位置的確定;FastR-CNN 屬于遙感圖像目標(biāo)識別網(wǎng)絡(luò)[5],主要用于對圖像尺寸等參數(shù)信息的識別以及遙感圖像目標(biāo)的分類。通過利用FasterR-RCNN 算法對遙感圖像目標(biāo)進行識別、檢測的過程中,主要涉及到了以下四個操作步驟:
(1)通過提取圖片特征,并生成新的特征圖像;
(2)利用RPN,對新生成的候選區(qū)域框進行處理;

表1:遙感圖像目標(biāo)檢測結(jié)果統(tǒng)計

表2:不同模型的識別準(zhǔn)確率
(3)利用池化層,對特征圖進行綜合分析,并根據(jù)proposals信息數(shù)據(jù),得到遙感圖像目標(biāo)相對位置,然后,將最終的分析結(jié)果保存于全連接層中;
(4)借助全連接層,對特征圖像進行分類判別,在此基礎(chǔ)上,使用矩形框,對遙感圖像目標(biāo)位置進行精確標(biāo)明[6]。
此外,為了確保RPN 和FastR-CNN 能夠結(jié)合并形成網(wǎng)絡(luò)共享卷積層,需要從以下四個階段算法入手,完成對相關(guān)圖像特征的精確化計算:
(1)利用預(yù)訓(xùn)練網(wǎng)絡(luò)模型,對RPN 模型進行訓(xùn)練。
(2)通過利用已獲得的RPN 輸出區(qū)域,對FastR-RCNN 網(wǎng)絡(luò)進行訓(xùn)練。
(3)利用已訓(xùn)練好的FastR-RCNN 網(wǎng)絡(luò),采用初始化訓(xùn)練方式,對RPN 網(wǎng)絡(luò)進行初步訓(xùn)練,在進行訓(xùn)練的過程中,要盡可能確保卷積層始終保持相同,僅僅調(diào)整和控制RPN 網(wǎng)絡(luò)獨有的相關(guān)參數(shù)。
(4)在確保共享卷積層相同的情況下,利用已得到的區(qū)域,采用微調(diào)全連接層相關(guān)參數(shù)的方式,對FastR-CNN 網(wǎng)絡(luò)進行優(yōu)化和完善。
總之,通過落實以上四個步驟,不僅可以提高對RPN 和FastR-CNN 的訓(xùn)練效果,還能更好地共享提高卷積層參數(shù),為進一步提高相關(guān)參數(shù)的利用率打下堅實的基礎(chǔ)。
2.3.1 遙感目標(biāo)檢測實驗
在本次實驗中,為了更好地驗證遙感圖像目標(biāo)檢測技術(shù)的可靠性和有效性,現(xiàn)采用正樣本集,采用隨機劃分的方式,將樣本集劃分為以下三個部分,分別是訓(xùn)練集、驗證集和測試集,這三個組分部分的比例是2:1:2,此外,還要使用在Python3.5 軟件,完成對FasterR-CNN 算法的編寫,并利用TensorFlow 相關(guān)技術(shù),完成對模型的構(gòu)建,然后,利用準(zhǔn)確率均值(mAP)對遙感目標(biāo)檢測實驗過程進行評價,最終所測得的檢測結(jié)果如表1 所示。
2.3.2 實驗結(jié)果分析
從表中的數(shù)據(jù)可以看出,本文所提出的卷積神經(jīng)網(wǎng)絡(luò)模型可以提高遙感圖像檢測結(jié)果準(zhǔn)確率,使其準(zhǔn)確率提升至89.28%,遠遠高出傳統(tǒng)遙感算法所達到的準(zhǔn)確率[7]。不同模型的識別準(zhǔn)確率如表2 所示。從表中的數(shù)據(jù)可以看出,通過利用FasterR-CNN 算法,可以保證目標(biāo)識別與檢測性能的穩(wěn)定性和良好性,因此,F(xiàn)asterRCNN 算法被視為高效的遙感圖像檢測方法。
綜上所述,在卷積神經(jīng)網(wǎng)絡(luò)算法的應(yīng)用背景下,以航空遙感圖像為主要研究對象,通過研究遙感圖像目標(biāo)檢測技術(shù),根據(jù)遙感圖像成像特點,使用FasterR-RCNN 算法完成對目標(biāo)檢測框架的構(gòu)建,不斷提高遙感檢測數(shù)據(jù)集檢測結(jié)果準(zhǔn)確性,使得遙感檢測數(shù)據(jù)集檢測結(jié)果準(zhǔn)確率提升至89.28%,為進一步提高遙感數(shù)據(jù)處理效率和效果提供有力的保障。