曹志民,吳 云
(1.東北石油大學 電子科學學院,黑龍江 大慶163318;2.哈爾濱工業大學 電子與信息工程學院,黑龍江 哈爾濱 150001)
基于區域特征的快速城區機載LiDAR數據分類方法
曹志民1,2,吳 云1
(1.東北石油大學 電子科學學院,黑龍江 大慶163318;2.哈爾濱工業大學 電子與信息工程學院,黑龍江 哈爾濱 150001)

提出了一種基于區域特征的快速城區LiDAR點云數據分類方法。首先進行數據濾波處理,去除地面點。然后對非地面點,利用二次多項式進行區域曲面擬合,擬合曲面的參數作為特征構造區域特征向量,通過投票方式判斷每個點的局部區域屬性。最后,利用模糊邏輯技術實現最終分類。實驗結果表明,該分類方法能夠高效實現城區建筑物及樹木的分類。
機載LiDAR;區域特征;分類
隨著遙感技術的飛速發展,結合測繪、電力、城市規劃、油氣管線監測及規劃等多種應用的實際需求,3D城市重建已經得到了廣泛的關注和研究。近些年,由于機載LiDAR具有主動獲取大范圍目標區域精確三維空間信息點云數據的能力,且數據采集不受陰影和采集時間的限制,機載LiDAR系統已在3D城市重建等相關領域中得到了非常廣泛的應用。其中,城區點云數據的分割/分類是一個非常重要的研究內容。
分類的目的在于將原始LiDAR點云數據區分為多種具有不同屬性的類別,目前已提出很多相關研究成果。文獻[1]利用基于分割的分類方法將原始LiDAR數據區分為建筑物、植被和地面,所用特征為分割邊緣梯度、高程紋理、首末次回波高程差、強度等;文獻[2]實現了一種有監督分類方法,所用特征為歸一化高程、高程方差、多次回波差、強度等;文獻[3]利用航拍圖像和機載LiDAR數據聯合,采用先分割后分類的方法檢測樹,所用特征為色度、飽和度和亮度、高程、局部高程方差、法向量等;文獻[4]利用擴展AdaBoost算法將機載LiDAR數據分成了4類,所用特征為高程、高程方差、方向量方差、強度和灰度。文獻[5]采用多層二類分類過程構造了多類分類器,利用該領域中應用廣泛的PCA技術[6-8]實現了局部空間結構的分析。上述方法中,無論是基于分割的分類方法,還是基于有監督分類器構造的分類方法,分類效果對所提取特征的有效性都有非常高的依賴性,且計算成本往往很高。提取的特征中,多數需要利用數據局部鄰域進行分析,而鄰域計算結果通常直接作用于當前處理點,對鄰域其他點沒有影響。本文給出了一種真正的基于區域特征的分類方法。首先,利用高程特征將數據進行濾波,即將原始點云數據分為地面點和非地面點;然后,對于非地面點,利用局部二次多項式曲面擬合結果構建了一個二維特征向量,對該特征向量的分析結果通過投票的方式不僅對當前點有影響,而且對鄰域其他點也有影響,從而充分體現鄰域曲面擬合過程中各鄰域點的貢獻;最后,利用模糊邏輯技術將非地面點分類為樹木和建筑物。
無論是分割、分類,還是目標檢測、識別等,所采用的特征大多是基于點的特征,且都趨向于識別平面結構(城區中大多數建筑物及其他人造物中存在大量平面結構)。本文中,不僅要考慮建筑物,還同等重要地考慮到了樹木。換句話說,構造的特征并不是面向平面結構,而是面向更高階的特征。眾所周知,有理多項式模型和徑向基函數(RBF)模型是計算機視覺領域中常用的散亂點云曲面擬合方法。本文基于以下2點考慮選擇了二次有理多項式模型對點云進行局部曲面擬合:①雖然采用更高階的模型可以實現更高精度的擬合,但高階模型需要更多的點和更高的計算成本來實現擬合;②RBF模型大多也是由多個二次有理多項式基函數的線性組合來構成的。因此,本文所采用的局部曲面模型為:

式中,(X,Y,Z)為LiDAR數據點的三維空間坐標。
為了獲取區域特征向量,分別手動選取了6組典型的樹木和建筑物樣本(樣本取自典型結構的典型局部區域),如圖1。利用式(1)對圖1中的樣本進行曲面模型擬合。
從表1中可以看到,建筑物和樹木樣本的擬合系數(P20,P11,P02)有明顯區別。因此,可以利用這3個系數構造一個三維特征向量。就像PCA區域結構分析技術一樣,可以獲取局部區域協方差矩陣的3個特征值,它們可以直接用于對局部區域特征進行分析,然而實際應用中往往是3個特征值的某種線性或非線性組合構造的新的特征能夠獲得更好的分析結果。為此,本文通過實驗驗證,設計的二維特征向量為:

圖1 樹木和建筑物曲面擬合樣本

表1 訓練樣本點云曲面擬合結果

其中,

由圖2可見,所構造的二維特征向量能夠很好地實現建筑物和樹木的分類。

圖2 12組樣本的二維特征向量分布情況示意圖
2.1 區分地面點和非地面點
為了區分LiDAR數據中的地面點和非地面點,已經提出了很多濾波算法包括基于形態學的方法、基于TIN三角網的方法和基于分割的方法等。這些方法中的主要假設是地面點往往低于非地面點。顯然,如果能夠很好地估計出局部地面高度,最簡單有效的濾波方法就是利用高程閾值法。因此,首先將輸入的原始LiDAR數據按照空間坐標劃分為多個正方形子區域(子區域面積一般大于區域中最大建筑物面積)。本文將目標區域分割成4×4共16個子區域。對于每個子區域來說,其高程閾值可設為:

式中,N為子區域中數據點數;ρ為地面點所占比例相關的約束參數;Tid為高程排序的標號;HTid為對應的高程值。
2.2 基于區域特征的分類
在獲取特征向量后,主要有2種分割或分類的流程:①非監督法,僅依賴于特征向量和某種距離測度以聚類的方式進行。②監督法,利用具有類別標號的樣本進行訓練學習以構造相應的分類器來實現對未標定類別的數據進行分類。無論選擇哪種流程,所提取的特征向量往往只反映對應一個點的屬性,而沒有充分影響到構成特征所需要的局部點的屬性。所提取特征的結果將嚴重受制于局部區域形狀和尺寸的選擇。
為了解決上述問題,采用一種區域投票策略實現樹木和建筑物的分類。首先,令為非地面點集合。對于每個點,令為對應的鄰域點集合。然后,對于每個點,利用鄰域點集擬合局部曲面模型并構造對應的二維特征向量,進而可以計算得到當前二維特征向量到訓練得到的樹木或建筑物二維特征向量均值間的歐式距離。再根據距離的大小關系,對鄰域所有點投票為樹木或建筑物類。在對所有非地面點進行上述處理后,對于每個點,可以得到2個參數:Nv_tree和Nv_building,分別為對應點被投票為樹木和建筑物的次數。最終,每個點屬于樹木或建筑物的隸屬度函數為:

利用兩式的大小關系即可判斷每個點的最終類別。
3.1 實驗數據
本文所用的實驗數據和對應的航拍圖像如圖3所示。
該數據為ISPRS工作組III/4提供數據集的一個子集。機載LiDAR數據采集于2008年8月,所用系統為萊卡ALS50,采用45°視場角,平均飛行高度為500 m。中值點密度為6.7點/m2。從圖3可以看到,該區域中有大量的樹木和建筑物。

圖3 實驗數據(31 221點)
3.2 實驗結果
為了驗證本文所提方法的性能,所有相關算法均采用Matlab 2012a開發,采用的計算機CPU為Pentium(R) Dual-Core CPU T4400 @2.20GHz,內存為1.18 GHz的2 G內存。
首先,將原始數據分為地面點和非地面點。本文方法中,式(5)中參數ρ的選擇非常關鍵,令ρ為0.35。對應的濾波結果如圖4所示。然后,利用投票方式下的二次曲面擬合區域特征法將非地面點分為樹木和建筑物。文中所用鄰域構造方法為球形鄰域,鄰域半徑設為2.8 m。最終,算法總執行時間約為288 s,分類準確度為92.3%,分類質量為88.6%,對應的分類結果如圖5所示。
本文以局部二次曲面擬合參數構造二維特征向量,以投票方式利用模糊邏輯實現了一種真正意義上的基于區域特征的機載LiDAR點云分類方法的框架。實驗結果表明,該方法實現簡單快捷,能夠有效實現城區機載LiDAR點云地面、樹木和建筑物的分類。通過引入更多先驗知識或針對性規則,該框架的性能還可以得到明顯提高。

圖4 原始LiDAR數據濾波結果

圖5 實驗結果
[1] Tóvári D, V?gtle T. Object Classification in Laser Scanning Data [J]. International Archives of Photogrammetry, Remote Sensing and Spatial Information Science, 2004,36(8/w2)∶45-49
[2] Charaniya A P, Manduchi R. Supervised Parametric Classification of Aerial LiDAR Data Computer Vision and Pattern Recognition Workshop[C]. Washington, IEEE, 2004
[3] John Secord, Avideh Zakhor. Tree Detection in Urban Regions Using Aerial LiDAR and Image Data[J]. IEEE Geoscience and Remote Sensing Letters, 2007,4(2)∶196-200
[4] Lodha S K, Fitzpatrick D M. Aerial LiDAR Data Classification Using AdaBoost[C]. Sixth International Conference on 3-D Digital Imaging and Modeling,Mentreal,2007
[5] Moussa A, El-Sheimy N. Automatic Classification and 3D Modeling of LiDAR Data[J]. International Archives of Photogrammetry and Remote Sensing, 2010,38(3B)∶155-159
[6] Choi Y W, Jang Y W. Three-dimensional LiDAR Data Classifying to Extract Road Point in Urban Area[J]. IEEE Geoscience and Remote Sensing Letters, 2008,5(4)∶725-729
[7] Carlberg M A, GAO P. Classifying Urban Landscape in Aerial LiDAR Using 3D Shape Analysis[C].16th IEEE International Conference on Image Processing (ICIP), Cairo, 2009
[8] Gross H, Thoennessen U. Extraction of Lines from Laser Point Clouds[C]. ISPRS Conference Photogrammetric Image Analysis (PIA), Bonn, 2006
[9] SHI Xiaozhe, Zakhor Avideh. Fast Approximation for Geometric Classification of LiDAR Returns[C].18th IEEE International Conference on Image Processing (ICIP), Brussels, 2011
[10] Nesrine Chehata, LI Guo, Clement Mallet. Airborne LiDAR Feature Selection for Urban Classification Using Random Forests[C]. Laser Scanning, Paris, 2009
P237
B
1672-4623(2016)05-0011-03
10.3969/j.issn.1672-4623.2016.05.004
曹志民,博士,講師,主要研究方向為遙感多源數據融合與處理。
2015-03-18。
項目來源:國家自然科學基金資助項目(61371180);東北石油大學校青年科學基金資助項目(NEPUQN-2014-07)。