李 婷,詹慶明,3,喻 亮
基于地物特征提取的車載激光點云數據分類方法
李 婷1,2,詹慶明1,2,3,喻 亮2,3
(1.武漢大學遙感信息工程學院,武漢 430079;2.武漢大學數字城市研究中心,武漢 430072;3.測繪遙感信息工程國家重點實驗室,武漢 430074)
車載激光掃描測量方法較傳統攝影測量方法具有更多優點,它能快速采集大面積、高精度的三維空間數據,具有廣闊的應用前景。針對車載激光掃描數據的分類問題,提出了一種基于地物特征提取的點云數據分類方法,即采用主成分分析(PCA)方法,在提取多種街區地物點云數據幾何特征和總結地物對象特征知識規則的基礎上,根據選取的主特征設計一套階層式的分類方法,并利用該方法對一套車載激光點云數據進行了分類試驗。結果表明,該方法的分類效果良好,具有一定的實用性。
車載激光點云數據;特征提取;主成分分析;數據分類
隨著城市數字化、信息化需求的日益上升,如何采用高效、精確的手段進行城市三維模型的構建,已成為實現城市數字化、信息化的一個關鍵環節和技術難點。車載激光掃描作為一種先進的測量手段,不僅具有快速、不與測量物接觸、實時、動態、主動、高密度及高精度等特點[1],而且能采集大面積的三維空間數據和獲取建筑物、道路、植被等城市地物的表面信息,從而為有效解決傳統攝影測量在進行三維建模時所遇到的一系列瓶頸問題提供了新思路。因此,如何快速精確地對車載激光點云數據進行分類,已經成為三維建模領域首先需解決的問題之一。
國內對激光點云數據的自動分類研究起步較晚,早期的研究主要是利用影像信息進行特征提取和分類,而激光點云數據僅作為輔助信息。隨著激光掃描技術的進步,單純基于點云數據的分類研究開始逐漸增多。李必軍等提出了基于建筑物幾何特征的信息挖掘方法,但該方法在對地形、地物數據進行分類以及對點云數據的去噪方面,均需要根據已知信息對觀測值進行概算[2];史文中等提出了基于投影點密度的車載激光掃描距離圖像分割方法[3];李永強等提出了一種基于車載激光點云數據的三維公路信息提取方法,但該方法過度依賴人工交互,不適用于復雜的城市環境[4]。
國外在該領域的研究起步較早,已經發展了較為理想的點云數據自動分類識別算法。Manandhar和Shibasaki提出了根據斷面掃描點的點位空間分布特征(幾何特征、分散程度和密度信息)將激光掃描點云數據分類成不同組[5]的算法,但該算法對混合排列點的識別較為復雜;Shi Pu和George Vosselman提出了基于建筑物語義的點云數據特征提取方法[6],旨在從地面點云數據中通過提取語義特征來構建墻壁、門、窗戶,建筑物凸出部分和凹進部分以及屋頂等部件的數字模型:首先對點云數據進行分割,以保證每一塊分割好的點云數據只包含一種語義特征;然后根據語義特征的大小、點位、方向、拓撲關系以及點云數據密度等特點來對其進行分類,以實現建筑物的三維重建。
本文延伸了基于建筑物語義的點云數據特征提取方法,提出了一套較為完整的、基于地物特征的車載激光點云數據分類新方法。該方法首先提取街區地物點云數據的多種語義特征,同時建立地物對象的分類語法,并將這套語法轉換為計算機可以理解的特征約束;然后采用主成分分析(PCA)方法提取主特征,按一定的知識規則對車載激光掃描數據進行階層式分類。
基于主成分分析(PCA)的分類方法是在提取多種街區地物的點云數據幾何特征和在總結地物對象特征知識規則的基礎上,基于選取的主特征,通過設計一套階層式的分類策略來實現對車載激光點云數據的分類,它是按照點云數據幾何特征提取、城市地物知識規則歸納、地物主特征提取和地物分類等步驟進行的。
車載激光掃描系統對獲取的點云數據是以離散點的形式存儲的(包括x,y,z三維坐標信息),但每個離散點間并無關聯,這使得單個點云數據并不能解釋為被掃描對象的整體特征信息。因此在進行點云數據分類前,需對點云數據進行分割處理。一般采用點的鄰近度和局部平滑度作為確定表面延伸和種子增長的標準。經過處理后,使屬性相同或相近、且空間鄰近的點云數據被劃分為一個分割面塊[7]。綜合考慮城市地物對象的空間分布特征、幾何特征以及激光點云數據和分割面塊自身的信息特征,可以提取高程、法向量、擬合殘差、XOY平面投影面積與密度等幾個特征。
1.1.1 平面擬合
人們通常使用最小二乘法給定點集進行表面擬合,使得所有的點到所擬合表面的垂直距離平方和最小。盡管大多數的擬合表面估計都是非線性的,但為了在滿足精度要求的前提下,通過減少參數數量來加快運算速度,可采用平面方程進行擬合。一般在處理激光點云數據時,多采用

作為平面擬合的參數方程。式中:a,b,c為參數;x,y,z為變量。
1.1.2 法向量提取
當使用式(1)對某鄰域內一定數目的點云數據集進行最小二乘平面擬合時,若可計算出方程參數a,b,c,則該點云數據的法向量為(a,b,c)。
1.1.3 殘差擬合
殘差是指實際觀察坐標值yi與回歸估計值y(取實際觀察坐標值的平均值)的差值,即

但當需要對平面擬合結果進行殘差評估時,就不能采用任何實際觀察坐標值的平均值作為回歸估計值,而應采用各點到所擬合平面垂直距離的平方和作為點云數據平面擬合的總殘差。任何一個點到平面ax+by+cz=1的垂直距離為

1.1.4 XOY平面投影面積與密度
將分割面內包含的點云數據投影到XOY平面上,就存在一個圍合點云數據的外輪廓多邊形,可采用最小面積的外接矩形法對其進行簡化來代替其外輪廓。該最小矩形的面積可作為該分割面的XOY平面投影面積;XOY平面投影密度是分割面內的點云數據數與其投影面積之比。
1.2.1 街區地物分類體系
根據城市環境,尤其是城市的主干道及其兩側的街景,可將城市街區基本地物分為道路、建筑物、植被以及其他地物(圖1)。

式中:xi,yi,zi表示點的實際觀測坐標值;δi代表第i點到擬合平面的空間垂直距離。
總殘差δ的計算方法為

圖1 城市街區地物分類體系Fig.1 Classification system of urban objects
1.2.2 街區地物對象的模式化
所謂街區地物模式化,即通過分析不同街區地物對象的空間分布特征和幾何構造特征,并根據構成支撐分類的知識規則來形成城市地物分類的知識規則。表1為構建的用于城市地物分類識別和重建的知識庫。

表1 城市街區地物對象的特征知識庫Tab.1 Characteristic knowledge base of feature objects
1.2.3 街區地物對象的知識規則
將表1中各類對象的特征知識庫轉換為計算機可以理解的特征約束,如表2所示。

表2 城市街區地物對象的特征知識規則Tab.2 Characteristic knowledge rules for various objects
在分析各種地物點云塊特征的基礎上,通過總結每類地物與其他地物存在最大表現差異的特征,即可提取一二種主特征和輔特征,用于建立階層式的分類策略。本文采用基于PCA的方法來提取主特征,幾種典型地物的主特征如表3所示。

表3 城市街區地物對象主特征Tab.3 Main characteristics of feature objects
綜合考慮表3中歸納的對各類地物分類起關鍵作用的主特征,即可建立階層式分類模式。設計的算法流程如圖2所示。

圖2 階層式分類模式Fig.2 Hierarchical classification mode
文中采用的實驗數據是由三維激光測量車LYNX采集的某測試路段的點云數據,基于Visual Studio 2005平臺,采用C#語言進行分類實驗。當對搜索半徑為0.5 m范圍內的30個點進行平面擬合時,通過設置角度閾值(15°)和殘差閾值百分比(95%)來對車載激光點云數據進行分割;在對點云數據進行分割的基礎上,運用PCA方法對點云分割面塊進行分類,得到的自動分類結果如圖3(左)所示;通過人機交互方式,對實驗數據進行分類,即可得到點云數據的真實分類結果(圖3右)。

圖3 自動(左)和人機交互(右)分類結果Fig.3 Automatic(left)and artificial classification(right)results
采用本文提出的方法對街區點云數據進行自動分類,與人機交互的手工分類結果進行比較,得到的分類混淆矩陣如表4所示。表中“精度1”是自動分類所得正確分類的面塊數占自動分類所得分割面塊總數的比率;“精度2”是自動分類出來的分割面塊數占屬于特定地物分割面塊總數的比率。

表4 混淆矩陣Tab.4 Confusion matrix (個)
從表4可以看出,共有1 337個分割面塊,其中,地面的分類“精度1”和分類“精度2”分別為91.8%和60.6%;建筑物的“精度1”和“精度2”分別為56.5%和84.9%;其他地物,如交通指示牌、花壇、行道樹的分類精度雖然較前兩者低,但也基本符合要求,總體分類精度為58.5%。各類地物間均存在不同程度的錯分現象:
1)建筑物與交通指示牌之間存在錯分。因為建筑物上存在零散的分割面,其高程與交通指示牌較為接近,而交通指示牌的法向量方向與建筑物一樣,也接近于水平,這與建筑物的分類規則存在一定的重疊。
2)路面分類的“精度1”為91.8%,“精度2”卻僅為60.6%。因為接近地面高程的點云數據被分割的面塊較為零散,在自動分類時,地面的主要分類特征也是高程,而這些零散的小面塊實則屬于“其他”類別,故降低了地面的分類“精度2”。本文改進的分割算法降低了分割面塊的離散性,因此地面的分類“精度1”也會相應提高。
3)人工分類得到的建筑物面塊數比用本文方法分類得到的面塊數目多。因為建筑物屋頂有球狀的穹頂、坡屋頂以及其他不規則的附屬物,且存在一部分不規則的弧形墻體,描述這些物體的點云數據所生成的分割面較為零散,特征與知識庫中墻體的特征規則不相同所致。
4)花壇和行道樹分類存在一定的混淆現象。因為花壇和行道樹的法向量方向各異、離散無規則,而行道樹的樹干部分以及部分樹冠部分則可能被分割成獨立的離散面,其高程與花壇較為接近,而且分類特征與花壇的分類特征接近,所以就產生了分類混淆的現象。
5)低矮地物(花壇、路肩)被劃分為路面。由于現代道路一般是中間高、兩側低(便于排水),因此高程閾值不易確定,閾值太低會造成道路中部的分割面不能劃分到道路,閾值太高又會造成路邊部分地物劃分到路面類別中。
由于地物紛繁多樣,且具備不同的結構特征,因此實驗中未被分類出來的分割面數較多。用本文中提取的幾個特征并不能完全描述所有地物特征,也不能實現地物的高精度分類。但實驗驗證了將高程、法向量、XOY平面投影面積、投影密度以及殘差等特征用于點云數據分類的可行性,同時驗證了基于PCA分類方法的可行性,但精度仍有待提高。
本文根據多種街區地物點云數據的語義特征,提出了一種基于地物特征的車載激光點云數據分類新方法,該方法與傳統的激光點云數據分類算法中的基于回波強度或者灰度信息等單指標的分類方法有很大的不同?;谥鞒煞址治龇椒ㄍㄟ^提取城市地物的主特征和充分利用知識規則,實現了階層式的分類策略,并避免了造成約束條件中特征信息的冗余。實驗結果表明,該方法具有可行性,為拓寬車載激光點云數據的分類方法提供了一個新的思路。在后續研究中,可考慮利用多個特征參數和設定不同的權值參與分類;對于分類時特征參數閾值的設定也可以通過手工分類的方式先進行統計,并將其作為其他場景分類的先驗知識,以提高分類精度和效率。
[1] 吳芬芳.基于車載激光掃描數據的建筑物特征提取研究[D].武漢:武漢大學,2005.
[2] 李必軍,方志祥,任 娟.從激光掃描數據中進行建筑物特征提取研究[J].武漢大學學報:信息科學版,2003,28(1):65 -69.
[3] 史文中,李必軍,李清泉.基于投影點密度的車載激光掃描距離圖像分割方法[J].測繪學報,2003,34(2):95 -100.
[4] 李永強,盛業華,劉會云,等.基于車載激光掃描的公路三維信息提?。跩].測繪科學,2008,33(4):23 -25.
[5] Manandhar D,Shibasaki R.Vehicle- borne Laser Mapping System(VLMS)-_A New Observation System for 3-D Mapping of Urban Areas[C]//Proceedings of IEEE Joint Workshop on Remote Sensing and Data Fusion over Urban Areas,Rome,Italy,2001:5-9.
[6] Shi Pu,George Vosselman.Knowledge Based Reconstruction of Building Models from Terrestrial Laser[J].ISPRS Journal of Photogrammetry and Remote Sensing,2009,64(1):575 -584.
[7] Liu Y,Xiong Y.Automatic Segmentation of Unorganized Noisy Point Clouds Based on the Gaussian Map[J].Computer - Aided Design,2008,40(5):576 -594.
A Classification Method for Mobile Laser Scanning Data Based on Object Feature Extraction
LI Ting1,2,ZHAN Qing - ming1,2,3,YU Liang2,3
(1.School of Remote Sensing and Information Engineering,Wuhan University,Wuhan 430079,China;2.Research Centre for Digital City,Wuhan University,Wuhan 430072,China;3.State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing,Wuhan 430074,China)
Compared with traditional survey technologies,mobile laser scanning has many advantages.Its characteristics make it possible to rapidly acquire large-area high-precision 3D spatial data for reconstruction of 3D(three - dimensional)model.This paper focuses on the classification of mobile laser scanning data.The authors present a multi-level classification method based on object feature extraction,namely extraction of main features by PCA(Principal Component Analysis).This method was applied to blocks point data obtained by mobile laser scanning,and the results show that the proposed classification method is promising.
mobile laser scanning data;feature extraction;PCA;classification
TN 249
A
1001-070X(2012)01-0017-05
10.6046/gtzyyg.2012.01.04
2011-05-27;
2011-08-06
國家高技術研究發展計劃(863計劃)項目(編號:2006AA12Z151)和國家自然科學基金項目(編號:40871211)共同資助。
李 婷(1988-),女,碩士研究生,研究方向是LiDAR數據的處理、攝影測量與遙感技術在城市規劃中的應用。E - mail:tingziforever@foxmail.com。
(責任編輯:刁淑娟)