鄂鑫雨
(河鋼集團礦業公司 河北 唐山 063000)
地質災害是野外工程必須要重視的問題,這對地質環境保護是一個非常重要的環節,在開采工程中應用較多的是高分遙感影像,為礦區的環境監測和地質環境監測提供了科學的指導,并積累了一些原始數據資料[1-2]。高分辨率遙感影像識別技術在開采中的應用方式有兩種,一種是面向對象的分類,另一種是對像素的監督進行分類[3]。面向對象的分類技術研究方面,SONG W等[4]將開采信息在Spot-5遙感影像上呈現出來;還有張文博等[5]將面向對象的多個尺度進行改進,使遙感影像能夠清晰地呈現工程地區的地物情況,使之更加遙感圖像更加清晰;顏小霞[6]研究了無人機遙感技術,并與面向對象的方法進行融合,得到了工程地區平面的數據資料;王戰衛等[7]將攀枝花地區作為范本,將土壤調節大氣耐抗設備指數與監督分類進行融合,從而提取了開采區域的相關遙感信息;張松浩等[8]在工程地區進行分類時使用了支持向量機算法,效果顯著。上述識別方法并沒有多大的難度,因此顯示影像僅限于紋理、波段、結構等簡單的資料,很少能夠顯示開采工程的高級別數據資料。
多層網絡結構高級別數據資料特征的顯示方法常為卷積神經網絡,卷積神經網絡也常常被應用于土地分類或車輛識別中。基礎的卷積神經網絡(convolutional neural networks,CNN)訓練方法對帶標簽樣本的數量有一定的要求,但是在實際的野外工程中,這種帶標簽的樣本并不多,由此導致CNN訓練方法并沒有足夠高的精確度。因此,本文主要闡述CNN中的遷移學習方法在遙感信息處理中的應用,該方法對數據量沒有過高的要求,所以能夠很好識別野外工程的相關信息。
本文研究區域由低山、平原和丘陵共同組成,所處地區的總面積約為2 182 km2,它的氣候特征以半干旱大陸氣候為主,降水量平均每年約為654.2 mm。開采對地形地貌造成了一定的破壞,出現了山體的崩塌與滑坡,研究區影像的波段來自高分二號(GF-2)遙感數據,是多光譜與全色相融的結果。空間分辨率1 m 研究區坐落在114°9′E,35°41′N,該地區聚集了諸多的開采區,這就導致了伴隨著開采而來的廢料和玻璃層產生的土石對地貌地形造成了嚴重的破壞。
數據是經過加工處理后的GF-2遙感數據,加工處理的方式有幾何融合與幾何校正兩種方式,它們的分辨率大概為1 m。測試集、訓練集和驗證數據共同組成了實驗數據集。測試集及訓練集的常見場景主要有七類,分別是開采區域、梯田、農田、建筑、道路、河流和森林,在CNN的遷移學習中常用的是訓練集,80幅/類;測試集中有16幅/類的算法驗證。采用數據為GF-2預處理數據可用來評估評價算法的精確度。
該模型是由Ken設計的,它的網絡架構是CNN-F,共包括8層,由卷積層和全連接層組成,比例為5∶3,圖像的規格是224×224像素。CNN-F網絡結構如圖1 所示。卷積層/全連接層的結構為5/2。卷積層的表示方法如下:Size—卷積核尺寸;stride、pool 和pad 分別表示卷積步長、降采樣池化和空間填充。全連接層fc6和fc7的神經元數均為4 096,fc8是softmax 分類器,也是神經網絡的最后一層。

圖1 CNN-F網絡結構示意圖
深度殘差網絡ResNet-50是以傳統卷積網格為基礎。該學習框架可以減輕網絡訓練負擔,可以進行跨層連接,從而形成殘差塊,能夠有效地解決網絡層數多引起的梯度下降現象。該模型優化了反向傳播的網格數據,使網絡能夠更好地提取數據信息。ResNet-50的網絡結構如圖2所示,殘差塊與卷積層的比例為16∶1,softmax分類器與平均池化層共同組成了全連接層,該圖像的尺寸為224×224像素。

圖2 ResNet-50 網絡結構示意圖
訓練CNN必須有足夠數據的支撐,如果數據過度匱乏會導致擬合現象經常發生。解決該問題的有效方法是遷移學習,也就是將CNN的數據進行訓練得出預訓練模型,并調取特征層重復使用,從而有效解決新任務缺乏數據的問題,該方法即遷移學習。
在場景分類中應用最廣泛的是CNN模型的全連接層,它的神經元數量等同于圖像分類器。本文的模型數據來自ImageNet數據集,該數據與mageNet不屬于同一類別,即通過替換該模型的最后一層數據,才能夠進行遷移學習,從而得到合理的實驗數據。如圖3所示為預訓練模型調整流程,用該模型的預訓練數據替代分離器,N用于表示不同的訓練數據影響類別。

圖3 預訓練模型調整流程示意圖
參數微調和特征提取是遷移學習的主要方法,前者是將預訓練模型的全部或部分數據用目標數據集進行訓練,這樣就可以調整網絡各層的數據信息,使其更符合實際要求;后者并不會全部舍棄預訓練模型的數據信息,而是在新的案例數據仍有所保留,可將其視為特征提取的原始能力。
CNN-F是本實驗的基礎,第一步是處理最后一層網格,讓它的分類器與實驗數據集更吻合。訓練方法有三種,即An、Bn、Cn,訓練的場所是訓練集,An是訓練前需凍結預模型的n層數據,該方法只是需要初始化7—n層數據,而不需要調整參數,Bn方法不會破壞預訓練模型的數據信息,但是需要對7—n層數據進行初始化;Cn是要凍結預訓練模型的n層數據,同時不刪除余下7—n層數據,即n={1,2,…,7}。
當n=1時,該層保留模型的參數用陰影部分表示,初始化部分用白色來表示,該層凍結的數據用有鎖符號來表示。因此,預訓練模型位于第一層,初始化模塊則位于剩下的7層,這7層主要用于初始化訓練。B1表示除不初始化第一層外,對其他層數據進行初始化,從而達到對整個網絡訓練的目的。C1表示將預訓練模型的第一層數據進行凍結后,對其他層的參數進行局部調整。
如圖4所示,是在實驗中得到的An,Bn,Cn 三種遷移學習方法的訓練模型,并進行一系列測試的輸出結果。

圖4 An、Bn、Cn 分類精度對比
由圖4可知,紅色菱形點An 的 1—3層,精度會隨著凍結層數的增加而提升,精度的最高點是A3。但是如果凍結層數持續增加,精度并不會一直調高,而是呈現出下降趨勢。由此可見,可以通過調整預訓練模型的前3層參數,獲取實驗測試集的整體特性。實驗數據集與ImageNet數據集存在顯著差別,因此預訓練模型4—7層不能夠很好地呈現出遙感數據的本質特征。通過微調層數,可以得到精準度更高的黃色三角點Bn,精準度最高點是B7。由此可見,如果ImageNet數據集與實驗數據集存在著明顯差異,可以通過對其他的層次進行微調獲取精準度更高的遙感影像信息。
由實驗可知,C1與C2可以通過微調高層或底層參數進行凍結,由此可以保留預訓練模型的提取能力。在實際應用中只需要對高層參數進行調整,就可以完成對新遙感圖像的甄別。為了了解C1與 C2訓練效果的差別,筆者將生產者精度與用戶精度同時進行考量,C1訓練方法的生產者精度和用戶精度分別為93.75%和100%,C2的生產者精度和用戶精度分別為100%和94.12%。
通過以上的實驗可以看出,最佳的訓練方法是將高層參數進行微調同時對底層預訓練模型參數進行凍結。對此我們也在CNN模型上進行了實驗,具體的實驗方法如下。
在ResNet-M中,M是指ResNet-50 預訓練模型被凍結的是M層以前的參數(含M層),未被凍結的數據則可以在訓練集上進行調整。
圖5為ResNet-conv1識別的最高精確度。識別的精確度會隨著凍結層數的增加和殘差塊的產生而下降,所以說ResNet-50 模型最適合將高層數據進行調整并對底層數據進行凍結。

圖5 ResNet-M 分類精度
實驗通過對比可知,ResNet-50 預訓練模型的精準度雖然會在調整高層數據并對底層數據進行凍結時得到改善,但是可發現生產者精度與總精度并不能滿足CNN-F 預訓練模型的需求。雖然在ImageNet 數據集上顯示了ResNet-50 模型的優越性,但是筆者認為,本文所闡述的遷移學習方法最適合CNN-F 模型,這也就說明了殘差網絡的跨層連接可以幫助優化網絡數據,所以就遷移學習在ResNet-50 模型中的效果不顯著。
應用C1在對開采工程進行識別的過程中,采用CNN-F對最佳遷移學習方式進行驗證。結果如下:該算法得出的工程區域的用戶精度和生產者精度分別為87.5%和100%。如圖6所示為研究區域解譯圖(a)與本文識別方法圖(b)對比結果,只有A處工程區域沒有被本文的算法識別。本文方法識別出了多種地貌、地物特征,并得到了良好的數據分析資料。因此,充分證明了CNN模型的最佳遷移學習方式在開采工程遙感信息處理的效果顯著。

圖6 遙感信息識別結果對比
綜上所述,開采工程遙感識別精度不高主要與訓練數據量不足有關系。本文通過不同的對比實驗可知,如果通過微調高層數據并同時對底層CNN預訓練模型的數據進行凍結的遷移學習方法,能夠有效地提高CNN模型的識別精度。遷移學習方法對CNN模型的結構沒有具體的要求,實驗證明這種方法能夠同時提高用戶精度和生產者精度。因此,通過該種方法訓練的CNN模型能夠有效識別開采工程區域的高分遙感影像信息,可以在開采工程中廣泛使用。