方 鑫,陳善雄
(武漢大學遙感信息工程學院,湖北 武漢 430079)
高分辨率遙感影像(high-resolution satellite image,HRSI)建筑物提取是攝影測量與遙感領域的一個熱門研究主題[1]。長期以來,很多學者就相關問題作了大量研究。文獻[2]利用形態特征和植被指數去除圖像中的陰影和植被區域;文獻[3]提出了一種形態學建筑物指數(morphological building index,MBI),并通過建筑物與陰影間的距離關系來提取建筑物對象;文獻[4]利用陰影和植被指數來提取陰影和植被區域,并利用陰影和建筑物的模糊距離建立兩者之間的方向關系;文獻[5]在OK方法的基礎上進一步優化了利用陰影和建筑物間關系的方法。文獻[6]使用了一種組合方法,先聚類生成建筑物種子點,再用區域生長的方法提取建筑物的范圍,最后通過對非建筑物對象構建一個環來完善提取結果。
在這些較為廣泛認同的建筑物提取方法中也存在著一些問題。如,文獻[7]利用MBI提取建筑物結果中,由于同質區域內部存在很多噪聲,影響了最終的提取結果,且參數過多難以調節;文獻[6]的方法雖然自動化程度較高,但單純通過聚類難以對較亮的非建筑物目標做到有效區分。本文綜合前人的研究成果,針對這些方法存在的問題,提出一套具有較高自動化程度的面向對象密集城區建筑物提取流程。
本文的整體提取流程分為4個步驟:陰影提取、建筑物對象初提取、疑似對象篩選和后處理,如圖1所示。
陰影在遙感影像上呈現較強的同質性,在可見光波段亮度均較低。針對陰影提取,很多學者提出了一系列算法[3,8-10]。本文對文獻[10]的方法作出改進,可以較好地提取陰影對象,詳細的提取過程分為3個步驟:RS特征影像計算、圖像聯合分割和面向對象聚類。

圖1 建筑物提取流程
1.1.1 RS特征影像計算
首先將HRSI影像轉換到HSI(hue-saturation-intensity)空間后,然后根據式(1)計算出RS比值[10],得到RS特征影像
(1)
式中,S、I分別為HSI空間中分量。
1.1.2 圖像聯合分割
面向對象的提取方法十分依賴分割的結果[11-12],單純通過原始影像分割難以取得令人滿意的效果。因此將RS特征影像作為一個波段與HRSI影像融合后,對融合影像進行多尺度分割。本文方法基本上與eCognition的分割方法相同,首先根據圖像的光譜和形狀建立距離目標函數
Dist=wshapeHshape+wspectralHspectral
(2)
式中,wshape、wspectral分別為形狀權重、光譜權重;Hshape、Hspectral分別為形狀差異與光譜差異。依據距離函數建立起全圖的二叉樹,最后依據設立的最小差異閾值在二叉樹的某一層進行切割,每一棵子樹即為一個對象,通過該方法可以將全圖劃分為若干個對象。
為了突出陰影對象,可以在融合過程中加大RS特征影像的權重,根據經驗,若原影像波段數為n,則與RS特征影像融合比例為1∶n。
1.1.3 面向對象聚類
面向對象的聚類算法將矢量對象分為多類,聚類中心數需要根據圖像中實際地物類別進行調整。面向對象聚類方式為
(3)
式中,Xi為第i個對象的所有特征,共有n個;Cj為第j個聚類中心;距離函數Distij為第i個對象到第j個聚類中心的歐氏距離;λi為每個對象所屬的聚類簇。
在提取陰影過程中每個對象使用了兩個特征:HRSI影像三波段均值及RS特征影像均值。雖然聚類的目的是得到影像中的陰影對象,但可以將聚類數目設為大于2以使得提取的陰影對象更純。在RS特征影像上陰影區域會以高亮顯示,與其他地物反差很大且自身一致性程度很高,因此在聚類過程中幾乎總是聚為一類,且聚類中心值最大的簇所對應的即為所需的陰影對象。
建筑物在遙感影像上的表現十分復雜,同時具有同物異譜和異物同譜性。在眾多建筑物提取的研究中,文獻[13]提出的形態學建筑物指數(MBI)對建筑物具有較好的區分性。在本文中,采用與上述陰影提取相類似的方法對建筑物進行初提取,區別在于將陰影提取過程中所用的RS影像替換為MBI特征影像。
在具體試驗操作過程中,目標距離函數所用特征有兩個:HRSI影像的三波段均值及MBI特征影像均值。聚類中心個數需要根據圖像中地物復雜程度來確定,一般而言,針對建筑物提取可以將地物聚為4類:高亮區域、較亮區域、較暗區域和暗區域。聚類結果中,將聚類中心最大的簇所對應的對象當作建筑物初提取結果,聚類中心最小的簇所對應的對象當作非建筑物區,中間區域歸入疑似建筑物區域。最終得到建筑物對象、疑似建筑物對象和非建筑物對象三類結果。
該步驟主要分為兩個部分:光照方向計算和距離角度篩選。
1.3.1 光照方向計算
首先需要根據1.1節中得到的陰影結果和1.2節中得到的建筑物結果計算出光照方向,光照方向根據建筑物初提取結果和陰影提取結果來計算。在計算過程中借鑒了文獻[14]的思想。由多方向線性結構元素和形態學膨脹運算建立投票矩陣,利用式(4)來計算每個建筑物對象所對應的光照方向
(4)
式中,B(xj)為第j個建筑物對象;dilate為膨脹運算;di為第i個方向的線性結構元素;shadow為陰影提取對象;DirectSet為光照方向的集合。式(4)的幾何含義是找到使建筑物對象與陰影對象有最多交集的膨脹方向作為該建筑物的光照方向,并增加投票矩陣中所對應方向的權重。通過該方法計算出所有建筑物對象所對應的光照方向,最后選取投票矩陣最大數值所對應的方向當作光照方向。
1.3.2 距離角度篩選
利用光照方向和陰影對象對1.2節中得到的疑似建筑物對象做篩選,篩選的目的是從該部分對象中找出建筑物區域。在篩選過程中需要用到的輔助信息是陰影對象和全圖的光照方向。
首先對每一個陰影對象建立一個篩選范圍區,范圍篩選函數為
(5)
式中,f1為沿光照方向的篩選函數;f2為垂直于光照方向的篩選函數;α為光照方向;(xe,ye)為邊界點。通過篩選函數獲取邊界點為
(6)
式中,Pshadow為陰影點的集合。搜索每一個陰影對象點,找到陰影對象中沿著光照方向的邊界點集合Palong_edge和垂直于光照方向上的邊界點集合Pvertical_edge,根據邊界點集合和光照方向即可計算出陰影對象自身的邊界范圍。設立兩個閾值Twidth和Tdistance,分別用來拓展垂直于光照方向和沿光照方向的搜索范圍。
建立起搜索范圍區后,對疑似建筑物對象做篩選,將其分為建筑物對象和非建筑物對象。
一方面,由于在高分辨率影像中可以獲得十分豐富的細節信息,往往會從圖像上提取出多余的信息;另一方面,在圖像分割步驟中往往會采取過分割的方法,這會導致提取出的建筑物對象出現缺損或包含多余信息。
根據得到的建筑物初提取結果與從疑似建筑物對象中篩選出的建筑物樣本合并后,會發現提取結果中間出現“漏洞”或邊緣與實際地物難以貼合的現象。針對這種情況,本文利用GrabCut算法[15]對最終提取的結果進行優化。GrabCut是一種圖像分割算法,該算法利用圖像中的紋理信息和邊界信息,根據用戶選擇的前景和背景建立高斯混合模型,在搜索過程中反復迭代找到能量最小的目標區域作為最終的目標檢測結果。
在處理過程中,首先需要計算出每一個建筑物對象所對應的前景和背景,計算方法為
(7)
式中,Bi為第i個建筑物對象;Dilate為膨脹運算;Rect為求取對象的矩形范圍;Expand為對矩形的范圍做拓展;τ為一個比例因子。對每一個建筑物目標Bi作膨脹運算,將計算膨脹后的矩形范圍rectprospect當作算法的搜索目標區域,再將根據搜索區域的長寬按一定比例τ擴大矩形框的范圍當作背景rectbackground。獲取每一個建筑物對象的前景和背景所對應的范圍后,用GrabCut算法計算出該建筑物對象的提取結果。
在實際的后處理過程中,有時由于建筑物目標太小,導致選取的背景圖太小,通過高斯混合模型無法對前景的目標進行正確提取,在本文中對這種建筑物目標不作處理,仍然以原提取結果作為最終結果,因此在最終的提取結果中有部分建筑物對象的邊緣仍然不夠完善。
黃昕等提出了形態學建筑物指數MBI并利用該指數取得了較好的面向對象的建筑物提取效果[3],文獻[6]主要通過基于聚類的方法得到了較好的基于像素的建筑物提取結果,為證明本文方法的有效性,選用武漢地區的兩幅QuickBird影像分別用文獻[3]、文獻[6]和本文方法對數據進行建筑物提取試驗,結果如圖2所示。
試驗精度通過3個經典指標查準率、查全率及F1分數來衡量[16]。在本試驗中,對3種方法提取結果的精度評定見表1。

表1 試驗區精度評定結果

圖2 3種提取方法結果對比
根據試驗結果可以看出,在密集城區的建筑物目標提取中,3種方法都可以得到較好的結果。從圖3所示的區域中可以看出,通過本文的后處理可以更好地完善建筑物輪廓。

圖3 局部示例1
在如圖4所示的區域中,存在較亮的非建筑物目標,通過文獻[3]和文獻[6]的方法均不能做到有效去除,而通過本文的陰影距離篩選條件可以將這類目標加以濾除。

圖4 局部示例2
對于圖5所示較暗且在其光照方向上沒有陰影對象的建筑物,通過本文與文獻[3]的方法均難以取得較好的效果,但是文獻[6]的方法對這樣的目標有一定的提取效果。

圖5 局部示例3
本文在綜合前人的建筑物提取方法的基礎上,提出了一種針對密集城區的自動化程度較高的面向對象建筑物提取流程。本文的提取方法對輸入數據的要求低,僅需三波段影像即可完成,同時人工參與程度也較低,需要調整的參數少并且易調節。
在試驗過程中,用本文方法與部分前人的方法進行了比較。結果證明,本文的建筑物提取流程具有較高的效率和可靠性,在建筑密集區域取得了不錯的效果。在今后的研究中,一方面仍要解決建筑物同物異譜的問題,另一方面可以考慮將深度學習引入建筑物提取的方法中。