吳凱,梁勇,蔡永寧
(濟南市勘察測繪研究院,山東 濟南 250013)
點群目標是空間分布分析的重要對象。在GIS中,單個的點狀目標,只有點位的坐標和屬性信息,其形狀特征可以被忽略不考慮,而整個點群目標則可能具有某些規律的分布特征[1]。空間分布分析過程不考慮單個點狀目標的大小、形狀,主要關心的是群體分布所隱含的空間結構化信息。對點群目標進行研究分析,目的在于提取其空間分布的相關規律,根據空間域內包容分布對象的能力,顧及相互間的影響作用確定最佳設施配置[2]。
在空間點群研究中使用地圖代數距離變換(點群聚類)方法,可將距離與空間度量的尺度聯系起來;可得到各種廣義空間距離概念的識別和生成方法;易于推廣到多種空間,而非僅限于基于數學平面的研究。點群空間分布軸線,在數學上可抽象為點群數據的線性空間分布特征,傳統點群分布軸線的計算,無法處理有迂回曲線,無法挖掘橢球面上的點群分布軸線,現將距離變換的思想應用到點群空間分布軸線提取的研究中,對于點群數據復雜的線性條帶分布(是彎曲或迂回曲線類型),應用基于距離變換的點群密度研究方法,提取分布軸線。
距離在空間分析中是一個非常廣義的概念。它不只是單一地代表兩點間的直線長度,而是被賦予了空間概念下更加豐富的內容。距離變換是將包含實體特征和空間背景的二值圖像轉變成距離圖像,即對二值圖像,將前景中的像素值轉化為該點到達最近背景點的距離。在變換后的距離圖像中,每一個像素值表示該像素離其最近的一個實體像素的距離,具體表現為每個實體的距離波不斷地向外空間擴張,直到與鄰近實體的距離波相遇。
距離變換是計算并標識空間點(對參照體)距離的變換或過程。距離變換是在確定特性的尺度下對全空間的度量。外距變換度量實體圖形外的空間,內距變換度量實體圖形本身空間。它是對空間實體量度性質的總體和全局的把握[2]。
距離變換特性有:
(1)各空間點距離數值上的唯一性。
各個空間點到唯一實體點的距離的平方是正確的;
各個空間點到唯一實體點的距離正確且唯一的;
當空間中有N個實體點時,任一個空間點將在變換中得到它與最近實體點的距離(平方);而當有2個、3個或是若干個實體點到該空間點均為這個最小距離時,則該點即成為距此2點、3點或是若干點的等距點;
(2)平移不變性
指原點群中的點,由于它們是由實體以及相互之間關系決定的,理論上與坐標系關系不大。平移是不變的,具有平移不變性。
(3)局部更動性
當增加或減少新的實體點集時,只與更動“周圍”的實體及其空間有關,這個“周圍”是:對更動點集的點位產生更動距離數值的實體以及面向更動點集一方的空間,這是距離變換的動態特性。
空間分布軸線是點群重要的分布特征信息,在地理空間中,對點群(如城市群、地震點群)提取其空間分布軸線,尤其在城市群研究中,通過提取的分布軸線研究其特征區域帶,對未來的經濟建設布局和社會發展有著非常重要的決策參考價值[3]。
離散點群的空間分布趨勢或走向可以用點群空間分布軸線來表示。分布軸線是一條擬合的直線,可以用來描述離散點群的總體走向趨勢[4]。對于離散點群,可以擬合一條直線L(如圖1所示)或曲線,點群相對于L的距離反映了離散點群在點群走向上的離散程度,而L的走向則描述了點群的總體走向。

圖1 點群空間分布軸線
分布軸線的確定與點群相對于軸線的離散程度有關,點群相對于軸線的離散程度可以用三種不同的距離來度量:垂直距離ev、水平距離eh、直交距離eo。
離散度,在點群分布特征研究中,是對分布中心和分布軸線的補充,反映分布對象聚集程度的重要的空間分布參數。當不同的空間點群具有相同或近似的分布中心和空間分布密度的情況下,可以用不同的離散度來反映點群的空間分布特性,進行補充說明。
設點的平面直角坐標為(xi,yi),在點群分布軸線的研究中,直線方程表示如圖2所示:

圖2 分布軸線為直線
但在復雜的實際情況中,一般使用曲線形式擬合迂回型點群分布。通常采用一般二次曲線形式。二次曲線是一種非常重要的平面曲線,在平面直角坐標系下,由式二元二次方程所表示的曲線:
a11x2+2a12xy+a22y2+2a13x+2a23y+a33=0
(1)
其中二次項系數a11、a12和a22不全為零。二次曲線中除了橢圓(包括圓)、拋物線和雙曲線外,還有其他的曲線。在此以拋物線擬合點群為例進行說明。
在曲線擬合點群方法[5]中,點的平面直角坐標為(xi,yi),其中pi為屬性值,拋物線方程設為:y=ax2+bx+c,屬性加權的殘差平方和表示為:
(2)
表達式中的分母∑pi為常數,對方程的參數估計沒有影響,因此,通過表達式(3)來計算曲線方程的參數a,b,c:
(3)
使S取最小滿足殘差最小二乘,令
(4)
即可得:
(5)
解此方程組即可得到擬合分布軸線的拋物線方程。一般二次曲線對點群進行擬合方法與此相同,通過滿足殘差最小二乘來計算方程參數。
對迂回型點群,首先生成點群分布密度圖,對點群密度圖提取密度值大于0的邊界區域,運用距離變換的方法生成該邊界區域的中軸線;對點群密度圖生成等值線,得到等密度線分布圖,提取將所有點包含的最小密度線,對該距離變換線運用距離變換思想生成中軸線。
在對包含所有點的最小密度線生成的中軸線基礎上,運用最深線提取原理,提取點群分布軸線,其基本思路為:以最小密度線生成的中軸線為基線,作垂直于該中軸線的等間距的劃分線,對每一條劃分線在密度圖上生成剖面線,在剖面圖中的最大密度值處取點,依次取所有劃分線在密度圖上經過位置的最大值點,將所有最大值點進行連線即可得到點群的分布軸線,該方法能更好地描述點群分布,相對于最小密度線的中軸線,這種方法會偏向于點群集聚分布的地方,在該曲線型上能夠滿足所有點的偏差量最小二乘原則。
統計點群相對于點群分布軸線的離散度,可以得到點群相對于分布軸線的偏差量,即點群的離散信息;通過比較不用方法所得軸線偏差量,可以對不同方法所得分布軸線進行評價。
具體的操作流程如圖3所示。

圖3 迂回型點群分布軸線提取流程
首先對空間點群數據求取分布密度圖,在此基礎上對點群密度圖提取密度值大于0的邊界區域以及包含所有點的最小密度等值線,運用距離變換思想分別生成大于0邊界區域的中軸線、最小密度等值線區域的中軸線。實驗結果如圖4所示。

圖4 區域中軸線提取
圖4(c)中,外圍大區域確定的為密度值大于0邊界區域;內圍小區域為包含所有點的最小等密度線區域,應用距離變換對兩種邊界區域提取中間線作為點群的擬合分布軸線分別如圖4(d)和(e),分布軸線1為大于0邊界區域的中軸線;分布軸線2為最小密度等值線區域的中軸線。
用最深線原理提取點群分布的軸線,即提密度最大值分布的軸線,如圖5所示。以最小密度線生成的中軸線(圖4(e)分布軸線2)為基線,作垂直于該中軸線的等間距的劃分線(圖5(a)),對每一條劃分線在密度圖上生成剖面線,在剖面圖中的最大密度值處取點,依次取所有劃分線在密度圖上經過位置的最大值點(圖5(b)),將所有最大值點進行連線即可得到點群的分布軸線(圖5(c)分布軸線3)。

圖5 密度最大值分布軸線提取
對3種不同方法得到的分布軸線進行距離變換,如圖6所示,得到其空間等距離線的示例圖。

圖6 不同分布軸線的距離變換圖
讀取點群在點群分布軸線距離圖上的值,即點群相對于分布軸線的偏差量,便可統計點群相對于點群分布軸線的離散度信息。本文該試驗中選取點數較多,不對每個點的離散度進行一一顯示,僅對所有點相對于不同分布軸線的離差和與離差平方和進行統計分析。統計結果如表1所示。

不同分布軸線離散度對比 表1
通過對點群與不用方法所得分布軸線偏差量的對比分析,可以看出:由密度值大于0的邊界區域所得的中軸線,作為點群分布軸線,其偏差量最大;由包含所有點的最小等密度線所確定的中軸線,作為點群分布軸線,其偏差量適中,效果較好;由最深線原理方法生成的分布軸線偏差量最小,但因為劃分線不夠細密,所得軸線不夠光滑,提取的精度與線的劃分線加密間距有關。運用此方法,可以通過對劃分線進行加密,來得到精度較高的分布軸線。
對實驗地震點群生成密度分布圖,運用熱點分析原理,提取熱點區域,由熱點引導生成分布軸線。對分布軸線作一定范圍的緩沖區,來與實際地震帶比較,分析該方法在地震帶識別中的應用。
將距離變換思想方法應用到地震帶識別實例中,本文對地球系統科學數據共享網中的近2000年來中國地震目錄集成數據[6,7]進行抽取,選取部分地震數據進行研究,因數據量較大,僅選取時間為1980年~2000年、震級大于3級、中國華北地區(34°~42°N,109°~118°E區域范圍)的地震點數據,共684條記錄。地震點實驗數據如圖7所示。

圖7 地震點實驗數據
基于距離變換思想生成的空間點群分布的密度圖,對實驗地震點群生成密度分布圖如圖8所示。

圖8 地震點數據分布密度圖
距離變換方法生成的點群密度圖,因沒有固定距離步長滑動問題,選取合理的影響范圍,生成的密度圖中的密集和稀疏區域間的過渡就會比較平滑,不會出現大量黑斑情況。數學形態學方法中,落入圓內的點數設定對應像素點的灰度值,對兩個像素點而言,灰度值相同,落入搜索圓內的點數目相等,但沒有考慮同搜索圓內點與點分布的差別,沒有體現點與點距離不同而造成的差異;而且分布密集區域內可能有大量由低密度而產生的洞或黑斑;該方法使用受滑動步長的限制,密集和稀疏區域間的過渡通常也大都是不平滑的。
首先對實驗點群數據生成點群分布密度圖,由于實際地震點數據的聚集情況不同,密度值差異明顯。根據研究需要確定等值線的間距,生成密度等值線。本文研究中生成密度圖的灰度值為0~88.66,為方便顯示,選取間距為5生成密度等值線。結果如圖9所示。

圖9 密度等值線
對區域內的不同數值的等密度線進行統計,生成如圖10所示的等密度線數值與個數的變化關系示意圖,其中縱坐標N為不含重疊區的等值線個數,橫坐標H為等密度線數值。由圖10,可以根據確定不同的等密度線數值,提取相應不同個數的熱點區域。

圖10 等密度線個數統計
對密度圖生成等值線,間距根據研究需要可進行調整。通過對等值線選取的控制,獲取不同的熱點區域(如圖11(a)所示),然后由獲取的熱點引導來獲取其分布的大致軸線(如圖11(b)所示)。
圖11熱點引導分布軸線生成示意圖
對有熱點引導獲取的分布軸線作緩沖區(11(d)所示),即可識別出研究區域可能的地震帶位置。集合地震專家劃分的華北地區的地震帶[8,9](郯廬地震帶、汾渭地震帶、內蒙古地震帶、燕山地震帶、京津渤地震帶、華北平原地震帶)進行比較,示意圖如圖12所示。

圖12結果分析圖
由圖12可知,僅對比研究區內的地震帶識別情況,內蒙古地震帶、汾渭地震帶、華北平原地震帶與熱點引導生成分布軸線的緩沖區結果較相近,所生成結果與燕山地震帶位置有偏差。專家在劃分地震帶時會考慮地震震級的大小,本文則主要是在距離尺度上研究地震的分布密度,并由熱點引導求取分布軸線,來識別地震帶分布。熱點引導生成分布軸線的緩沖區較好地表達了地震點的分布狀況,研究區684條地震記錄中有538個點落入作為識別地震帶的緩沖區內,較好地吻合了地震帶的特征。
對密度圖生成等值線,間距調整到較小時,可以獲取更多細節特征。圖13為間距為1時用該方法獲得的熱點,及由熱點引導得到的分布軸線,以該分布軸線相應的緩沖區作為識別的地震帶,能識別出小型地震帶的分布位置。

圖13等值線間距為1時所得熱點及分布軸線
點群的空間分布形態具有多樣性,不同的點群具有不同的空間分布形態。通過分析其在空間中的集中趨勢可以獲取點群的集聚特征信息。點群空間分布軸線是一條擬合的直線或曲線,可以描述離散點群的總體走向。將距離變換的思想應用到迂回型點群空間分布軸線提取的研究中,針對點群分布的特點,獲取點群的分布軸線。在地理空間中,對實際點群,如迂回型或更加復雜的點群提取分布軸線,并結合軸線進一步研究其特征分布區域,對城市建設的發展有著重要的參考意義和價值,這也是需要進一步研究的重點。