楊志剛,張世奇
(1.廣東省國土資源測繪院,廣東廣州510500;2.中國地圖出版社,北京100054)
在攝影測量與遙感、模式識別、計算機視覺及數字圖像處理等領域中,線特征提取是一個十分基礎和重要的環節[1]。對于一幅高分辨率遙感影像,如何選擇最合適的線特征提取算法具有重要的意義。
本文以高分辨率遙感影像為數據源,通過對幾種具有代表性的線特征提取算法的試驗,分析各種算法的參數自適性,并且從自適性、速度、穩定性、可靠性、自動化程度等5個方面對各種算法的特性、適用場合等進行分析和比較,為對影像的進一步分析及影像匹配打下基礎。
Hough變換是一種基于變換域的直線提取方法,它從直線的特性出發,考慮能唯一確定直線的兩個參數ρ、θ,將直線變換到參數空間中,通過檢測參數空間中的極值點來確定直線的參數,從而檢測出影像中的直線[2]。
相位編組法是一種基于梯度相位特征的直線提取方法。提出此算法的Burns等認為邊緣不僅存在于灰度變化劇烈的地方,在灰度變化緩慢的地方也存在邊緣[3]。不同于大多數直線提取算法,對于梯度的特征,該方法以梯度的相位而不是梯度幅度為主要的判斷標準,梯度幅度只是一個輔助條件。然后根據梯度的相位信息對點進行編組,并用最小二乘法擬合出直線。
直線作為邊緣的一部分,是特殊的一類邊緣特征,因此,在邊緣檢測的基礎上進行直線提取是十分可行的。本算法在邊緣檢測的基礎上,對邊緣線進行跟蹤,形成鏈表以獲得每條線的位置、端點等信息,在清除圖像中短小的邊緣后,將鏈表中的曲線分割成直線并繪制出來,達到從影像中提取直線的目的[4]。
選用高分辨率遙感影像及人工測試影像,包含房屋、道路、裸地等地物,具有特征明顯的直線,且分布均勻,數量較多,適合作為線特征提取的基礎影像,如圖1所示。

圖1 高分辨率遙感影像
調整參數以研究每種算法的參數自適性,并從自適性、速度、穩定性、可靠性、自動化程度等5個方面對各種算法進行分析比較。
參數自適性主要是判斷提取的特征對設置參數的反映程度,即參數變化對特征提取的影響程度[5]。若參數變化對特征的提取影響較大,則該算法參數自適性較弱。
(1)Hough變換
Hough變換提取直線時需要設置的參數為檢測閾值T、步距θ0。其中,θ0表示直線上點的梯度方向變化的容忍范圍,一般取1弧度,并不是直線提取中的決定性參數;算子中最主要的參數為檢測閾值T,表1顯示了在步距一定時,檢測閾值T對于提取數量的影響。

表1 Hough變換參數自適性
從表1中可以看出,隨著檢測閾值T的改變,直線的數目有較大程度的變化,即閾值的設定對于提取結果的數目有很大影響,表明Hough變換的參數自適性較弱。
(2)相位編組法
相位編組法提取直線時需要設置的參數為檢測閾值Tm、Tn。其中,Tm表示衡量梯度方向的閾值;Tn表示衡量直線支持區內,每條直線上的像素個數的閾值。表2顯示了檢測閾值Tm、Tn對于提取數量的影響。

表2 相位編組法參數自適性
從表2中可以看出,隨著Tm、Tn中任意一個的數值改變,直線的數目都有較大程度的變化,表明相位編組法的參數自適性較弱。
(3)邊緣分割法
邊緣分割法提取直線時需要設置的參數為檢測閾值Tm、Tn。其中,Tn表示將曲線分割成直線的閾值,并不是直線提取中的決定性參數;Tm表示衡量直線最小長度的閾值,超過這個長度的直線將被剔除。表3顯示了檢測閾值Tm對直線提取數量的影響。

表3 邊緣分割法參數自適性
從表3中可以看出,隨著Tm數值的改變,提取結果的數目有較大程度的變化,表明邊緣分割法的參數自適性較弱。
通過對以上3種算法的參數自適性分析,可以得出3種算法的自適性都不是很強,每種算法之間也沒有很大差別。
提取速度是檢測算法性能的一項重要指標。由于遙感影像的數據量大,對其進行運算的算法就更要滿足一定的速度要求,否則算法的實用性就會大大降低。對試驗影像進行測試,統計每種算子運算所需的平均時間,結果見表4。

表4 線特征提取算子時間
從表4中可以看出,對于相同的影像,相位編組法的速度最快,邊緣分割法速度最慢。
穩定性是檢測算法性能的一項重要指標,是指影像的角度、噪聲等對算法結果的影響程度,若在角度和噪聲等因素的影響下,算法仍能提供較好的結果,則表明此算法的穩定性好[6]。算法的穩定性可以用檢測算子提取特征的重復率來表示,重復率越高,算子的穩定性越好。
(1)旋轉不變性
對同樣的影像進行旋轉,將影像進行直線提取,對于同一種算法,參數設為一致。統計每張影像上的直線數,以及與原影像相比直線重復的數目,計算成重復率,結果見表5。

表5 線特征提取算子旋轉不變性
從表5中可以看出,3種算法都比較容易受到旋轉角度的影響。究其原因,Hough變換和邊緣分割法中首先都要對影像邊緣進行提取,而提取邊緣時所用的Canny算子受影像旋轉角度的影響較大,導致直線提取的結果也受到角度變化的影響。對于相位編組法,因其首先要計算梯度的方向角,而梯度的方向角是通過影像中水平和豎直方向的梯度計算而來,隨著影像的旋轉,水平和豎直方向的梯度自然有變化,因此計算出的梯度方向角也會隨之變化,最終導致結果受到旋轉角度的影響。因此,3種算法的旋轉不變性都較弱。
(2)抗噪性
對同樣添加了高斯噪聲和椒鹽噪聲的影像進行直線提取,對于同一種算法,參數設為一致。結果如圖2所示。

圖2 高斯噪聲和椒鹽噪聲影響下直線提取結果
從圖2中可以看出,高斯噪聲和椒鹽噪聲對3種算法都有一定程度的影響。對于高斯噪聲而言,邊緣分割法提取效果最好,能夠提取出有效的直線,且提取錯誤較少;Hough變換和相位編組法的效果都不好,Hough變換提取直線的個數減少,且提取錯誤率增加;相位編組法雖然錯誤率不高,但直線的數量急劇減少。對于椒鹽噪聲而言,相位編組法的效果最好,在保證了提取數量的同時具有較好的可靠性;邊緣分割法其次,雖然提取數量較多但錯誤數也很多;Hough變換的效果最差,提取出的直線基本都是錯誤的。
總體來說,3種算法都具有一定程度的抗噪性。其中,Hough變換和邊緣分割法對高斯噪聲的抵抗性更好,是因為在提取直線的過程中用到的Canny算子會進行高斯濾波;相位編組法對椒鹽噪聲的抵抗性更好,是因為椒鹽噪聲對梯度方向的影響較小。因此,在對噪聲較多的影像進行直線提取前,對其進行降噪處理是十分必要的。
特征的可靠性是指有效特征數占總特征數目的百分比。提取的有效特征數占總特征數目的比率越高,算法的可靠性就越好。對高分辨率遙感影像進行直線提取,統計每種算法提取出的有效直線數見表6。

表6 線特征提取算子可靠性
從表6中可以看出,Hough變換可靠性最好,其次是相位編組法,邊緣分割法的可靠性最差。相位編組法可靠性略低的原因是由于算法認為灰度變化緩慢的地方也存在邊緣,以梯度的方向作為主要判斷標準,若閾值設定不當,會造成提取出不明顯的邊緣而忽略明顯邊緣的情況;邊緣分割法可靠性最低的原因是影像中有些地物本就不由直線構成,若強行將曲線邊緣分割成直線,只會使可靠性降低。
算法的自動化程度是指運行時無須人工干預的程度。一個算法運行時需要人工干預的程度越高,它的自動化程度就越低。一般來講,算法需要人工干預的環節是參數的設置,它直接影響了算法的自動化程度。
統計3種直線提取算法中需要人為設定的參數個數,結果見表7。

表7 線特征提取算子自動化程度
由此可知,3種算法中Hough變換的自動化程度最高,相位編組法和邊緣分割法次之,3種算法都沒有達到完全自動化的標準。
通過對3種直線提取算法的分析,總結出每種算法的特性:
1)Hough變換可靠性較好,自動化程度較高;有一定抵抗高斯噪聲的能力;原理復雜,提取速度較慢,旋轉不變性和參數自適性較弱。當對于可靠性要求較高時,適合采用此算法提取直線。
2)相位編組法原理簡單,提取速度較快;有一定抵抗椒鹽噪聲的能力,且可靠性和自動化程度一般;旋轉不變性和參數自適性較弱。當對于提取速度有較高要求時,適合采用此算法進行直線提取。
3)邊緣分割法原理簡單,自動化程度較高;有一定抵抗高斯噪聲的能力;提取速度很慢,旋轉不變性和參數自適性較弱,可靠性較差。當影像中曲線較少時適合采用此方法。
本文中研究的算法各有優劣,在實際處理圖像的過程中,應當結合算法原理和使用環境,不斷提高算法的適應性,針對不同大小、不同數據源的圖像設定自適應閾值,才能達到理想的提取效果。總的來說,就是要從算法的參數自適性、提取速度、穩定性、可靠性和自動化程度等方面對算法進行改進,從而獲得高效、穩定、有效、智能的算法。
[1]張云生,劉陽,鄒崢嶸.基于Harris興趣值的影像線特征高精度提取方法[J].測繪科學,2013,38(4):72-73.
[2]蘇志祁,尉宇,王濤.改進Hough變換的算法實現[J].現代電子技術,2009,32(10):42-44.
[3]周俊,王仁禮,吳云東.基于邊緣檢測的編組法直線提取[J].測繪學院學報,2004,21(3):181-183.
[4]雷小奇,王衛星,賴均.一種基于形狀特征進行高分辨率遙感影像道路提取方法[J].測繪學報,2009,38(5):457-465.
[5]王啟春,郭廣禮,查劍鋒.基于圖像灰度的點特征提取算子參數自適應研究[J].測繪科學技術學報,2012,29(6):435-439.
[6]余晨,金飛,石娟.基于灰度信號的點特征提取方法比較研究[J].測繪信息與工程,2009,34(6):44-45.
[7]張祖勛,張劍清.數字攝影測量學[M].2版.武漢:武漢大學出版社,2012.
[8]VON GIOI R G,JAKUBOWICZ J,MOREL J M,et al.LSD:A Fast Line Segment Detector with a False Detection Control[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(4):722-732.