嚴劍鋒 鄧喀中
1)中國礦業大學國土環境與災害監測國家測繪局重點實驗室,徐州 221116
2)中國礦業大學環境與測繪學院,徐州221116
三維激光掃描技術是20世紀90年代發展起來的一種快速獲取空間三維信息的新技術手段,以其非接觸、掃描速度快、獲取信息量大、實時性強、自動化等優點廣泛用于測繪領域[1]。大部分情況下,三維激光點云處理的最終目的是建立精確的掃描物體的可視化模型。石銀濤等[2]采用CAD 建模和地面三維激光掃描建模分別對某歷史建筑進行三維模型重建,得出掃描建模方法具有快速、高效、精度高等優點;張毅等[3]將地面三維激光掃描技術應用于公路建模,完成了數字表面模型、等高線、縱橫斷面等的模型生成。
由于真實場景中含有大量平面特征,這些平面特征可以在后續建模中簡化數據或者直接進行局部建模。因此平面特征提取成為3D 建模的重要組成部分,獲取高精度的擬合平面是建模的重要研究內容[4]。很多研究人員對于平面擬合進行了研究和應用,潘國榮等[5]對RANSAC 算法進行改進,提出擬合平面自動提取算法,得到了理想的結果;官云蘭等[4]針對點云數據存在粗差或異常值情況,采用一種以特征值法為基礎的穩健的點云數據平面擬合方法。蔡來良[6]對三維激光掃描儀采集的變形監測數據進行平面擬合處理,分析了建筑物的整體形變,證明該方法的可行性和有效性。
三維激光掃描點云數據在獲取過程中因樹木、行人等遮擋會出現異常值,當異常點較多時,平面擬合結果會產生較大的偏差,最小二乘就失去了擬合的意義,影響最終的建模結果。針對這個問題,本文引入可以表征數據對模型估計影響大小的Cook 距離,提出一種基于Cook 距離的平面擬合方法。這種方法通過優選擬合點進行最小二乘平差計算,從而達到精確的平面擬合結果。
設空間平面方程:

平面擬合總存在一定的誤差,對測得的點云數據(xi,yi,zi)(i=0,1,…,m),要求其最小二乘擬合平面其實就是使

即可表示成:vi=a0xi+a1yi+a2zi+1,i 為點的個數。求使v 最小的a0、a1、a2的值。對于有m 個點的點云數據,間接平差模型為

寫成誤差方程:

用最小二乘求解,得:

擬合中誤差為:

式中,P 為權陣,一般取單位權。A 為由已知點信息構成的系數矩陣。
設有線性回歸模型

這里Y 為n×1 的觀測向量,β 為p×1 的參數向量,e 為n×1 的誤差向量,X 為n ×p 的系數矩陣。在回歸分析中,常常需要考慮對回歸推斷具有較大影響的數據,這些數據點稱為強影響點。在眾多選擇強影響點的方法中,重要的一類是所謂的影響函數。記β 為從完全數據算出的β 的LS 估計;β(i)為剔除第i 組數據后,從其余n-1 組數據算出的β 的LS估計。稱

為第i 組數據對β 的影響函數。IFi反映了剔除的數據引起回歸系數的LS 估計變化大小。
為了更方便地表征影響函數變化的大小,通常考慮它的某種函數。對于剔除一組數據的情形,Cook 等引進了判定數據對LS 估計影響大小的IFi函數:

這里的M是正定方陣,C 為給定的常數。Di,1(M,C)愈大表示第i 組數據剔除后,β 變化愈大。因此,Di,1(M,C)度量了回歸系數估計β 影響的大小。顯然,Di,1(M,C)依賴于M、C 的選擇。取M=為必要觀測數,為利用完全數據算得的單位權方差),則稱為Cook 距離:

Cook 距離愈大,表示剔除第i 組數據后,參數的變化愈大[7-9]。
對于本文的平面擬合,不同于文獻[7]中的情況:文獻[7]不存在剔除較大誤差點的問題,只需要找到對擬合影響最大的點,也稱為強擾動點;本文中,計算得到的Cook 值較大的點實際上是平面擬合的強擾動點,Cook 值越大,對應的點與點云整體偏差越大。Cook 值越小,說明去掉該點對整體平面擬合的影響并不大,該點在點云的趨勢中或接近點云整體趨勢,為平面擬合的強勢點。本文基于Cook 距離的最小二乘擬合的目的是將偏離真實平面較多的點剔除在外,采用準確的數據點進行擬合。
文中對于部分點云數據進行優選,期望用若干Cook 距離較小的點,進行平面擬合,獲得較準確的結果。本文為說明問題,進行試驗分析,采用一已知平面:1.732 0x+0.577 3y-z+1=0,用該平面完成試驗分析。
已知平面如圖1,從該平面上隨機選取50 個點,并人為將其中任意13個點的坐標改動,使之成為異常點(有的異常點粗差較大,有的較小,如15號點只在z 方向加了0.04 的誤差),誤差點達到了26%。為方便辨識,異常點號為:5、7、10、15、18、20、25、30、35、37、40、45、50。在三維激光掃描的點云數據中,這些異常點由樹木、行人等遮擋產生。下面的實驗基于經過改動的50 個點的新坐標數據。

圖1 原始平面Fig.1 Original plane
用所有50 個點進行最小二乘平面擬合,得出平面方程2 為:1.635 7x+0.545 7y-0.947 6z+1=0,由式(5)計算擬合中誤差。由式(9)計算Cook 距離,選出Cook 值最小的6 個點,即Cook距離達到0 的6 個點,點號為:13、14、36、43、44、48。
這6 個點即為對準確的模型估計影響最大的點,用該6 個點擬合平面方程3 為:1.732 0x +,擬合中誤差
和用所有數據擬合中誤差相比,Cook 點選取擬合精度更高,相差的數量級在103。
Cook 距離最大的6 個點如表1。從表1 可以看出,這6 個點全是異常值較大的點,通過Cook 距離計算可以被選出與剔除。這樣可以對點云數據進行有效去噪。
增加兩個異常點,當異常點達到15 個時,計算Cook 距離并選出值最小的6 個點用于平面擬合,如表2。
用表2 中點擬合出的平面方程為:1.732 1x +0.577 3y-1.000z+1=0,中誤差為2.369 5 ×10-5,結果仍較準確。

表1 Cook 距離最大的6 個點Tab.1 6 points with the largest Cook distance

表2 15 個異常點時Cook 距離計算的6 個強影響點Tab.2 6 strong impact points based on Cook distance when 15 outliers exist in the point cloud
當然,當點云中異常點較多時,擬合精度和可靠性會降低。通過多次試驗,當有17 個異常點時,無論異常數據在整體點云的哪個位置,15 號點(異常點)的Cook 值始終較小,導致作為異常數據的15 號點被選為擬合點。當擬合點中混入異常數據,對于后期的最小二乘平面擬合不利,精度必然降低。試算發現,該情況下,參數估計中誤差在10-3的數量級,精度明顯下降。這時可以通過適當增加選取的擬合點來提高精度。
1)基于Cook 距離的點云數據平面擬合精度較高,穩定性較好,在一定范圍內不會因為某個數據點的變化而導致整個平面的變化。當粗差點在30%內時,可以保持擬合結果的可靠性,和真實平面相當接近。同時,在平面特征明顯的區域使用該方法可以大幅度縮減點云,精簡數據。
2)在最小二乘進行平面擬合過程中,擬合點并不是越多越好,選取適量并有效的擬合點才是應用最小二乘方法的關鍵。
3)當異常點超過30%,中誤差會下降很快,并且擬合出的平面和原始平面差距較大。在三維激光點云數據中,異常點數超過這一限值的情況并不多,然而,對于某些復雜情況,則需要將該方法和其他簡單的濾波方法結合使用,以期達到較高的建模精度。同時,基于Cook 距離的最小二乘也可以進行點云去噪,即通過計算,Cook 距離值較大的點即為誤差較大點或粗差點。
1 張啟福,孫現申.三維激光掃描儀測量方法與前景展望[J].北京測繪,2011,(1):39-42.(Zhang Qifu and Sun Xianshen.Measuring principle and developmental prospect of 3D laser scanner[J].Beijing Surveying and Mapping,2011,(1):39-42)
2 石銀濤,程效軍,張鴻飛.地面三維激光掃描建模精度研究[J].河南科學,2010,2(2):182-186.(Shi Yintao,Cheng Xiaojun and Zhang Hongfei.Study on the accuracy of terrestrial 3D laser scanning modeling[J].Henan Science,2010,2(2):182-186)
3 張毅,閆利,崔晨風.地面三維激光掃描技術在公路建模中的應用[J].測繪科學,2008,9(5):100-102.(Zhang Yi,Yan Li and Cui Chenfeng.Application of terrestrial 3D laser scanning to highway modeling[J].Science of Surveying and Mapping,2008,9(5):100-102)
4 官云蘭,程效軍,施貴剛.一種穩健的點云數據平面擬合方法[J].同濟大學學報(自然科學版),2008,7(7):981-984.(Guan Yunlan,Cheng Xiaojun and Shi Guigang.A robust method for fitting a plane to point clouds[J].Journal of TONGJI University(Nature Science),2008,7(7):981-984)
5 潘國榮,等.三維激光掃描擬合平面自動提取算法[J].同濟大學學報(自然科學版),2009,9(9):1 250-1 255.(Pan Guorong,et al.Fitted plane automatic extraction algorithm of 3-D laser scanning[J].Journal of Tongji University(Nature Science),2009,9(9):1 250-1 255)
6 蔡來良,吳侃,張舒.點云平面擬合在三維激光掃描儀變形監測中的應用[J].測繪科學,2010,9(5):231-232.(Cai Lailiang,Wu Kan and Zhang Shu.Application of point cloud plan fitting to deformation monitoring using 3D laser scanner[J].Science of Surveying and Mapping,2010,9(5):231-232)
7 丁旭,等.基于Cook 距離的GPS 高程擬合點優選[J].科技創新導報,2010,(20):81-82.(Din Xu,et al.GPS elevation fitting point optimization based on cook distance[J].Science and Technology Innovation Herald,2010,(20):81-82)
8 R Dennis Cook.Detection of influential observations in linear regression[J].Techonmetrics,1997,2(1):15-18.
9 田保光.最小二乘估計中的Cook 距離與相關系數[J].貴州師范大學學報(自然科學版),1993,(2):10-15.(Tian Baoguang.Cook Distance and Correlation Coefficient in Least Square Estimator[J].Journal of Guizhou Normal University(Natural Science),1993,(2):10-15)