

摘要:文章在對面向對象多尺度分割技術和深度學習技術分別進行理論、方法闡述后,開展目標區建設用地和非建設用地自動提取實例研究。通過建立少量地類樣本庫完成遙感影像自動分類提取,并對提取結果進行分析,得出目標區總體分類精度達到94.40%,建設用地的制圖精度和用戶精度能夠滿足實際生產需求。
關鍵詞:遙感影像;自動提取;面向對象;深度學習
doi:10.3969/J.ISSN.1672-7274.2023.07.009
中圖分類號:P 237,TP 3 " " " " " " 文獻標志碼:A " " " " " " " 文章編碼:1672-7274(2023)07-00-03
Research on Remote Sensing Image Automatic Extraction Technology Based on Object Oriented and Deep Learning Methods
DOU Yajuan
(Zhongse Blueprint Technology Co., Ltd., Beijing 101312, China)
Abstract: This article conducts a case study on automatic extraction of construction and non construction land in the target area. By establishing a small number of land class sample libraries to complete automatic classification and extraction of remote sensing images, and analyzing the extraction results, it was found that the overall classification accuracy of the target area reached 94.40%, and the mapping accuracy and user accuracy of construction land can meet actual production needs.
Key words: remote sensing images; automatic extraction; object-oriented; deep learning
目前,遙感圖像解譯存在兩大難點:一是不同地物難以分割開,二是地物分類不準確。隨著遙感影像分辨率的提高和高分影像獲取能力的提升,應用面向對象技術進行高分影像分析越來越普遍,而多尺度分割技術是面向對象影像分析技術中的一個關鍵步驟,它對影像分析結果有重要影響[1]。
近年來,得益于深度學習技術的快速發展,各種深度學習網絡,完成了各種高性能的計算機視覺任務,如圖像分類、自然語言處理、語音識別等。由于CNN在圖像分類方面取得了較好的效果,許多學者基于CNN發展了遙感影像語義分割算法[2]。
面向對象方法與深度學習方法有各自的優缺點。面向對象的多尺度自動/半自動分割方法可以將不同的地物分割到不同的對象之中,但是對光譜、形狀、紋理等地物特征描述不夠全面,信息量不足以支撐地物分類和識別[3];深度學習方法可以掌握不同對象的形狀、紋理特性,用以指導地物分類,但是不能準確地得到地物大小范圍等信息[4]。二者的有機結合可以有效地進行地物識別分類。
在實際生產中,面向大空間范圍的自然資源典型地類信息自動提取,樣本制作的工作量巨大。在目標樣本數量相對較少的情況下,如何實現高精度高效率的目標地物提取,基于小樣本條件下深度學習模型高可信迭代技術可為其提供有效途徑。
1 " 面向對象多尺度分割
圖像分割本質上是將一幅M×N陣列的數字圖像劃分為若干個互不交疊區域的過程。多尺度分割算法首先應該保證能生成高度同質性(或異質性最小)的影像分割區域(影像對象),從而適于最佳分離和表示地物目標[5]。在某指定的尺度下分割時,采用自單像元大小的區域開始,相鄰影像區域兩兩合并增長的方法。影像區域同質性可以通過異質性的計算來表達。多尺度分割能夠保證在合適的尺度進行對象的分割。
面向對象的分割尺度包括大尺度分割層、中尺度分割層和小尺度分割層,最底層為像元。為了達到比較準確的分割效果,根據實際影像統計的方差值,初步評估遙感影像分割的尺度。分割尺度的數值越大,分割結果的圖斑越大。圖像分割過程中,同時考慮顏色因子和平滑度因子的占比,以遙感影像的實際像素進行多尺度分割。
2 " 小樣本條件下的深度學習模型構建
隨著計算機硬件和大數據技術的發展,以深度學習為代表的人工智能技術為圖像信息的智能化提取提供了有效支撐[6]。但是,實際工作中難以快速獲取數量多、質量好的海量樣本數據,在一定條件下制約了信息自動提取技術的工程化應用。要想提高遙感影像樣本數據的制作效率,可以采用邊標記邊訓練的方式構建樣本數據。驗證遙感影像樣本數據的精度,對深度學習樣本數據的構建效率起著重要作用。
(1)訓練樣本數據集準備。對初始構建的小訓練樣本采集數據集中的每一景影像,根據影像分辨率確定鄰域尺度,計算影像特征,并將特征影像作為單獨波段添加到對應的影像中,合成新的訓練樣本采集影像,將新合成的所有影像作為新的訓練樣本采集數據集。
(2)樣本標簽數據集制作。對新的訓練樣本采集數據集中的每一景影像,進行地物樣本標記生成對應的標簽影像,標記范圍內的灰度值用1填充,標記范圍外的灰度值用0填充,全部標簽影像組成樣本標簽數據集。
(3)訓練樣本裁切。使用固定大小的方形窗口,對每一對樣本采集數據和標簽采集數據進行裁切,將全部裁切結果作為訓練樣本數據集。
(4)樣本數據剔除。對訓練樣本數據集、標簽集中的每一對影像,查看每個樣本中目標地類像元占全部像元數的比例,剔除比例小于5%的樣本數據及其對應的樣本標簽。
(5)深度學習模型迭代訓練與驗證。利用編碼深度、卷積核數量、多尺度深度、多尺度步長、特征合成大小等參數定義語義分割深度學習模型,將所有保留的樣本數據輸入模型中進行參數訓練,獲得地物提取的深度學習模型,對新的測試影像進行處理,獲得影像的地物樣本數據驗證結果。
3 " 多尺度面向對象+深度學習技術
面向對象與深度學習相結合的技術,首先是對遙感影像進行面向對象多尺度分割,然后基于面向對象規則開展信息提取,特別是用于深度學習訓練樣本的提取,按照需求選擇深度學習模型進行模型訓練后,將深度學習模型應用到圖像中進行分類處理,最后采用人工方式進行后期修訂。
“簡譯”(Easy Interpretation)是一個包含“面向對象+深度學習”分類方法的遙感圖像信息提取軟件,其包含新建處理工程、圖像面向對象多尺度分割、自動化信息提取、面向對象半自動化編輯、分類結果導出、導出分類矢量結果后期編輯等基本步驟。
4 " 實例分析
4.1 數據準備
按照影像質量好,無云霧遮擋,影像紋理清晰,包含建設用地、耕地等土地利用類型等原則選取符合要求的高分辨遙感影像。本次研究區選取貴州省貴陽市一景WorldView-2遙感數據,影像分辨率為1米,數據時相為2017年10月29日。
將原始影像經過影像正射校正、配準融合、波段組合、色彩調整后,制作形成三波段真彩色遙感正射影像圖。
在貴陽市遙感正射影像圖上制作5 km×5.5 km的矢量區域,用ArcGIS軟件中的Clip工具進行矢量對柵格數據的裁剪,對裁剪后區域開展遙感監測信息自動提取研究。基于“簡譯”軟件的面向對象多尺度分割和小樣本下的深度學習技術進行建(構)筑物、道路、建設性推土等典型建設用地地物的快速、自動提取。
4.2 面向對象多尺度分割
根據研究區遙感影像質量和分辨率情況,為達到比較好的地物分割效果,最大分割尺度設定為50,顏色因子設定為0.7,平滑度因子設定為0.5,依據影像實際像素進行多尺度分割,分為三個層次,每個層次的尺度間隔為0.6。通過最大分割尺度和尺度間隔,確定不同尺度的分割尺度數,即尺度3=50,尺度2=50×0.6,尺度1=50×0.6×0.6。各層次的最佳分割尺度以及對應的分割后的影像對象數量如表1所示。
在表1中,尺度1的分割尺度最精細,分割后的影像對象數量最多;尺度3的分割尺度較粗,分割后的影像對象數量最少;尺度2介于二者之間。如果僅從一種地類進行分析,如以建設用地中的建(構)筑物為例,按照尺度1分割得到的影像對象基本上是單個建(構)筑物,而按照尺度2分割得到的影像對象是建(構)筑物構成的圖斑塊,按照尺度3分割得到的影像對象是由建(構)筑物圖斑塊進一步擴展形成的建(構)筑物所覆蓋的范圍。
4.3 深度學習樣本提取及訓練
在遙感影像多尺度分割結果的基礎上,根據所要提取的地物類別,構建用于深度學習的地物樣本。樣本選取需要保證每種地物類別樣本足夠豐富,包括同一地物的不同形態,比如不同房頂顏色的建(構)筑物、不同建設狀態的建設用地等。
分析研究區遙感影像地類情況,確定建立非建設用地如耕地、園林地、草地、水域和建設用地等典型地物的數據分類。用矩形框工具選取兩塊樣區范圍,“樣區”范圍內圖斑需要包含所有要提取的地物類別,通過地物提取快速搜索功能,結合人工目視篩查,確保樣區內的每一塊樣本圖斑都定義到正確的地物類別當中。
基于小樣本數據,使用深度學習提取模型工具制作樣本數據標簽,并裁切為200 m×200 m的方形影像數據及其對應的標簽數據。遙感影像數據是經過處理后的三波段真彩色影像,標簽數據為二值化的柵格數據,其中,白色為1值,代表樣本目標區域,黑色為0值,代表背景區域。
在ArcGIS軟件中,逐一打開影像數據及其對應的標簽數據,查看目標地物的像元占整個樣本數據的像元是否小于5%,若是,則進行刪除;若不是,則予以保留。經過篩選,最終確定的質量合格的建設用地樣本共67對,非建設用地樣本共132對。
采用正常速度的訓練時間對質量合格的樣本數據集進行深度學習模型訓練,以生成的深度學習模型文件對待分類的地物要素進行模型計算,得到各類地物的概率分布圖,再以60%的分類置信度對研究區影像進行快速分類提取,采用濾波處理等手段減少提取結果“椒鹽現象”,消除不相關的細節,保證提取結果完整性[7]。
4.4 分類結果后處理
對于自動化方法得到的分類結果,會出現少量錯分、漏分情況,可以采用軟件內部的半自動化編輯功能進行人機交互修改。
自動提取的分類結果是柵格圖像,需要進行矢量化處理,對共邊的同一類地物圖斑進行合并,設定光滑因子為0.5、壓縮因子為0.06,對矢量結果的邊界進行自動化的平滑處理,以減少分類后圖斑的鋸齒效應,同時保持矢量間的拓撲關系。最終的提取結果矢量為ShapeFile格式,可在ArcGIS軟件中進行編輯。
4.5 分類結果精度分析
采用研究區2017年地類現狀數據中的建設用地面狀圖斑作為基準矢量,結合自動提取柵格結果和地類定義文件,通過混淆矩陣方法檢驗自動提取的建設用地分類圖斑的精度。表2中的分析結果顯示,建設用地與非建設用地自動提取的總體分類精度達到94.40%,Kappa系數為0.7257,建設用地的制圖精度和用戶精度分別為77.80%和67.56%。
5 " 結束語
本次研究區域位于貴州省貴陽市城鎮周邊地區,存在大量高層建(構)筑物,因為它的陰影與水體的影像紋理非常相似,在建設用地分類過程中容易被誤提為水體,對分類結果的用戶精度會產生影響。實例結果驗證了面向對象多尺度分割和小樣本量的深度學習模型相結合的方法,可以實現對高分辨率遙感影像典型地物的快速提取,在一定程度上可以助力人工目視解譯,提升遙感監測信息提取效率。
地物樣本質量對深度學習模型訓練效果有著關鍵影響。基于深度學習的遙感信息自動提取技術,對于不同數據源、不同時相的遙感影像,需要分別制作地類樣本庫用于提取模型的迭代訓練,因而如何快速、高效地進行樣本標注是后續工作研究的重點。
參考文獻
[1] 陳強,黃光體,沈麗莉,等.基于面向對象的多尺度分割技術在森林督查工作中的應用研究[J].湖北林業科技,2018(6):58-60,66.
[2] 謝夢.基于卷積神經網絡的遙感圖像語義分割算法研究[D].徐州:江蘇師范大學,2020.
[3] 陳俊任,周曉華,盧興.基于分層次多尺度分割的面向對象地物分類方法[J].江西測繪,2018(4):26-29.
[4] 張萌.面向對象框架下基于深度學習的高分辨率遙感影像分類[D].昆明:云南師范大學,2019.
[5] 王鵬偉.基于多尺度理論的圖像分割方法研究[D].合肥:中國科學技術大學,2007.
[6] 焦洋洋,劉平芝,蔣萌,等.面向居民地要素智能化綜合的樣本庫構建[J].測繪科學技術學報,2021(4):430-434.
[7] 仇俊杰.遙感圖像椒鹽噪聲濾波算法的研究[D].南昌:東華理工大學,2020.