湯建鳳
(中鐵第四勘察設計集團有限公司 湖北武漢 430063)
鐵路工程設計時需要鐵路設計方案走廊帶的地形圖作為設計基礎資料,地形圖的生產是鐵路設計中的重要一環。目前地形圖生產方式主要為航空攝影測量。隨著測繪科技的進步,基于機載激光雷達的地形圖的制作方法應用越來越廣泛。相比基于影像的立體測圖,基于機載激光雷達技術可以在少量人工干預下高精度、高效地完成等高線和高程點的采集工作。然而,目前基于機載激光雷達的地形圖測繪中地物要素測繪仍需人工繪制,大幅制約制圖的自動化程度。本文正是針對這一問題,研究基于機載激光雷達點云數據自動提取建筑物,以期提高地形圖測繪的生產效率、降低勞動強度,對于加快整個鐵路設計進程具有重要的現實意義[1-3]。
機載LiDAR技術能夠快速直接、連續自動獲取地面三維數據。與傳統航空攝影測量技術相比,具有對控制測量依賴少、受天氣影響小、自動化處理程度高、成圖周期短、產品種類豐富等特點。機載LiDAR技術生產大比例尺地形圖總體可以分為數據采集、數據預處理、點云制圖三個大塊。數據采集包括航線設計、地面參考站布設、航空攝影和攝影數據質量檢查工作;數據預處理包含航跡數據解算、激光點云處理及檢校、坐標轉換、點云濾波等步驟;點云制圖包括高程點生成、等高線生成、地形要素采集等內容。
基于點云數據地形圖中的等高線和高程點已經能夠自動生成,而其他地形要素還需要人工采集,特別是城區、鄉鎮等建筑密集區域,內業作業量非常大,使得整體生產效率低下,研究基于LiDAR生產地形圖過程中的建筑邊線自動提取前,需要將建筑點云提取出來。建筑物點云提取主要包括地面點濾除、點云分割和點云分類三個步驟。通過點云分類提取出建筑物點云后即可進行建筑邊界線的自動提取[4]。
機載激光雷達成像過程是對地面全要素進行的非選擇性掃描,數據中包含地面、植被、人工構造物等對象的三維點集。為了提取建筑物,應首先濾除地面點,從而降低提取的運算量和難度,提高提取的正確率。目前地面點自動提取已比較成熟,可實現80%以上的正確率。濾除地面點后,點云數據中將只包含非地面數據,基于非地面數據可進行進一步的分割和分類處理。
隨著機載掃描系統的不斷發展,應用領域越來越廣泛,獲取到的點云數據量也越來越大,從海量的點云數據中提取特征并進行分類和目標識別難度較大。對點云數據進行分割的目的即化繁為簡,將復雜的掃描場景點云根據其幾何或紋理特征分割成獨立地物點云集合。在對點云進一步處理時,可直接對每個集合進行操作,從而提高點云數據處理的效率和復雜度。
點云分割就是將點云數據分割成若干個互不相交的子集。學術界對點云分割方法進行了多年研究,相繼提出了區域增長法、特征圖像法和空間特征聚類法等有效方法。
在完成地物特征的表達和選擇后,需要選擇合適的機器學習模型進行訓練,以達到最終的分類目的。支持向量機具有很高的分類正確率,對于擬合也有很好的理論保證。同時如果選取合適的核函數,對特征線性不可分的問題也可以表現得很好。而隨機森林具有學習過程快、能夠高效處理大數據等優點,并且它對離群值不敏感,在隨機干擾較多的情況下依然表現穩健。
(1)支持向量機
支持向量機SVM是Vapnik于1995年基于SLT理論首先提出的一種新的學習方法。通過SRM原則在有限的樣本中找到學習能力和學習模型的復雜度的最佳平衡點,并最終轉化為求解凸二次規劃的問題。同時引入核函數思想,在很大程度上解決了模型選擇與過學習問題、非線性與維數災難問題以及局部極小值問題等。SVM在數據挖掘、模式識別、數據分析、遙感圖像分類等領域取得了成功而廣泛的應用,是SLT中最有效的方法之一。
(2)隨機森林
隨機森林是一種采用決策樹作為基預測器的集成學習方法,由Breiman在2001年提出。結合了Bagging和隨機子空間理論,集成眾多決策樹進行預測,最后將各個決策樹的預測結果進行平均或者投票,從而得到最終的預測結果。大量的理論和實驗研究都證明了隨機森林算法具有較高的預測準確率,對異常值和噪聲具有很好的容忍度,且不容易出現過擬合現象。
本研究對建筑物點云邊界的自動提取算法進行了實驗驗證,采用的是黃岡黃梅高鐵LiDAR航飛的數據。設備是集團公司現有的Leica ALS60機載激光雷達測量系統,影像傳感器為RCD30中畫幅數碼相機。選取了整個測段中浠水段的點云數據作為實驗數據。原始點云數據如圖1所示。

圖1 原始實驗點云數據
(1)地面點濾除
首先采用terrasolid軟件對點云數據進行濾波后,采用本課題提出的算法進行了地面點的濾除工作。
(2)點云分割
原始點云數據經過地面點濾除處理后,即可對非地面點云進行空間聚類分割處理,將離散點分割為獨立的地物點集合,不同的顏色代表不同的地物點集合(見圖2)。

圖2 非地面點云分割結果
(3)點云分類
點云數據經過分割后,可以進一步進行點云的分類,將獨立的地物集合賦予類別屬性。本文地物提取主要針對建筑、植被和橋梁三類對象。首先,采集這三類的樣本進行訓練,采用隨機森林模型進行點云分類,綠色點云為植被,紅色點云為建筑。
自動提取出的建筑點云如圖3所示,不同的顏色代表著獨立的建筑點云集合。利用提取出的經過單體化后的建筑點云數據可進一步進行建筑的邊界線提取,以滿足基于LiDAR點云數據的自動化生成地形圖需求。

圖3 點云單體化結果
在完成建筑點云的提取并單體化后,即可對每塊建筑點云自動提取出邊界線,用于地形圖的自動生成。建筑物輪廓線提取根據應用的不同又分為二維輪廓線提取和三維輪廓線提取[5-7]。
建筑邊界點云提取一般情況下只需要生成凸包即可,點云的凸包可使用先構造不規則三角網再去三角網邊界的方法獲取。
采用凸包算法能夠提取大部分規則建筑點云的邊界,但是對于異形結構的建筑點云數據提取效果不佳。
對于不規則建筑的邊界提取還需要采用凹包算法,常用的從點云數據中提取凹包邊界的算法有Alphashape算法。
提取出建筑物的邊界點云后,需要對邊界點云進行規則化,進而生成建筑物邊界角點,形成建筑物邊界矢量圖形,從而生產地形圖中的建筑物要素。
在單一建筑物內,針對上述步驟獲取的建筑物輪廓點,提出了迭代的方法對其進行規則化處理。規則化分為兩個步驟,第一步為提取建筑角點;第二步為角點直角化。
建筑物角點提取的基本原理是依據角點的夾角一般為90度。基于這一原理,對建筑物邊界點云進行篩選[8]。
經過邊界點云的提取和簡化后,已可較為真實地表現建筑物的形狀。然而,現實情況中,往往由于激光點云的不完整等原因,導致提取的建筑物邊界失真。因此,還需要對提取出的邊界點進行精化處理,以提高建筑物邊界提取的精度。邊界線的精化包含兩個步驟,第一步是直線擬合;第二步是邊界外延。
由于機載激光掃描獲取的點云數據比較稀疏,掃描獲取的建筑角點可能距離其真實角點有一定的差距,因此,通過邊界擬合直線并通過邊界直線相交的方式來獲取精確的建筑物角點。算法的具體步驟是分配邊界點、邊界點直線擬合、尋找最遠邊界點、直線相交求建筑角點、角點直角化(在實際建筑物的角點并不一定是直角,而在地形圖上為了圖幅美觀,可盡量將建筑物的角點強制轉化為直角。這一步驟不是必須的,可根據實際情況來選擇)。
本研究對建筑物點云邊界的自動提取算法進行了實驗驗證,采用的是整個實驗區域測段中溪水段的點云數據作為實驗數據。提取的建筑物點云如圖4所示,提取的建筑邊界如圖5所示[9]。

圖4 提取的建筑點云數據

圖5 提取的建筑邊界
在基于機載LiDAR點云數據制作大比例尺地形圖的過程中,除了建筑物需要人工繪制外,高架路橋邊線的提取也需要大量的人工干預。因此,在研究了建筑物邊界線提取的基礎上,對高架路橋邊線的自動提取技術也展開了深入研究[10-11]。
(1)高架橋點云提取
高架橋點云的提取步驟和建筑物提取的步驟基本相同,主要包括地面點濾除、點云分割和點云分類三個步驟。唯一的區別是在點云分類的過程中使用的閾值參數不同,一般情況下,高架橋的聚類點云集合長寬比、面積都比較大。
(2)高架橋邊線提取
高架橋的邊界點提取同樣可以采用Alphashape的凹包提取算法,提取步驟和建筑物邊界提取相同。
(3)高架橋邊線簡化
高架橋的邊界簡化和建筑物的邊界簡化略有不同,高架橋邊界線不存在明顯角點,但又不需要過于密集的邊界點。因此需要對邊界進行簡化,簡化方法采用道格拉斯-普克簡化方法進行高架橋邊線簡化。該方法可最大限度保持線形的真實度。
在完成了基于點云數據的建筑物邊界提取后,需要設計相應的應用接口,將提取結果轉換為CAD格式對象,使其能夠兼容到標準地形圖中,并根據相應比例尺的地形圖相關規范進行精度評定。從兩個方面來驗證整個提取精度,一是建筑物的有效提取率;二是提取出邊界的絕對精度。有效提取率是將所有正確提取的建筑物除以整個實驗范圍內的建筑計算所得,本實驗區提取率達到91%。通過外業采集房角的方式對建筑物邊界提取的絕對精度進行了檢查,平面中誤差為1.15 m,滿足鐵路1∶2 000地形圖制圖要求[12]。
本研究基于點云數據在鐵路工程大比例尺制圖過程中,實現了建筑物邊界線自動提取,相比傳統作業模式具有以下幾個方面的優勢:
(1)人工干預少、自動化程度高
將點云數據進行濾波處理后可直接自動生成等高線和高程點。實現建筑物的自動提取后,作業員只需補充采集水系、電力線等少量地物,比之傳統作業方法效率大大提高。這樣的優勢在隨著近幾年高鐵工程建設越來越多、工期越來越緊的背景下顯得更加重要。
(2)點云數據高程精度更高
相比于航空數碼影像成圖,基于點云數據制作的地形圖具備更高的高程精度,且高層建筑不存在投影差,測量成果更加可靠。
(3)內業工作量大大減少,整體作業效率高
機載激光雷達系統的內、外業處理工序相比于傳統航空影像更少,這將使內業制圖的工作量大大減少,整體作業效率大大提高。