摘要:敘述了空間數據立方體空間度量的基本定義;描述了空間度量的聚集概念,并結合具體圖例講述了點狀、線狀、面狀空間度量的聚集過程;解釋了空間數據立方體維上鉆、維下翻、維層次上鉆、維層次下翻的空間度量聚集操作基本原理。
關鍵詞:地理信息系統; 空間數據立方體; 空間度量
中圖分類號:TP301.6文獻標志碼:A
文章編號:1001-3695(2007)07-0013-03
0引言
數字城市的內涵非常廣泛,基礎信息化是其中最重要的建設工作之一。而多維信息空間分析又是基礎信息化中最為基礎的工作內容。它指的是將城市對象的各種數字信息即專題信息和時間信息,以地理空間信息為背景加以整合,形成以地理空間信息、專題信息和時間信息組成的多維信息框架,進而進行城市對象的多維信息空間分析[1]。
以多維信息框架為背景建立的多維信息空間分析,能隨著多維信息的增加或減少(即增加或減少限制條件)發生變化,進行城市對象的精化分析和不同程度的概括分析,產生動態空間分析效果,尤其是地理空間對象的概括分析(如多邊形合并)。分析時加載的多維信息越多,限制條件就越苛刻,分析得到的結果就越精化,即分析結果必須滿足所有條件;反之分析得到的結果就越概括,即分析結果滿足部分條件。前者能滿足人們對城市對象精化分析結果的需求;后者多為匯總性、綜合性等非結構化信息,能滿足人們對城市對象概括分析結果的需求。因此,以多維信息框架為背景建立的多維信息空間分析,能真正滿足人們對城市對象基于多維信息的動態空間分析需求[2]。
GIS不具備高效的多維信息空間分析能力[3]。精化分析時,隨著多維信息框架中專題信息和時間信息的增加,此時常規的GIS空間分析方法與多維信息空間分析方法存在著本質的區別,不能簡單地將前者用于后者;否則空間分析的性能和速度會很低,致使空間分析不實用。概括分析時,以往的GIS主要是用E-R模型設計的,存儲的是高度結構化的細節數據,而概括性的信息多為非結構化數據。通過結構化數據實時計算出適合決策分析的非結構化數據,非常消耗時間,所需進行的計算代價太高,致使空間分析無法使用。
空間數據立方體是實現數字城市中多維信息空間分析最為有效的技術手段。其中空間度量是精化分析和概括分析的空間分析結果表現形式;空間度量聚集是精化分析和概括分析的空間分析結果操作過程。目前,國內外有關研究人員對空間數據立方體的空間度量和空間度量聚集進行了一些卓有成效的研究工作,取得了一些成績[4~11],但是缺乏詳細的描述和研究,包括空間度量定義、空間度量聚集概念、空間度量聚集操作原理的詳細描述。這具有較大的技術難度。
1空間度量定義
目前研究較多的是空間維數據立方體[3](地理空間維、專題維、時間維、數字度量組成)和空間度量數據立方體[3](專題維、時間維、數字度量、空間度量組成)。本文研究的空間數據立方體同時具有地理空間維、專題維、時間維、數字度量、空間度量、地理空間維和空間度量表示同一地理空間要素。
空間數據立方體將來自于不同領域的(地理空間信息、專題信息1、…、專題信息n、時間信息)按維的形式構成一個人們很容易理解的數據立方體[1];用(地理空間維、專題維1、…、專題維n、時間維)多個維數來描述一個地理空間對象,每個維彼此垂直,采用空間數據立方體特有的分析操作原理進行分析,用戶所需的聚集結果就發生在維的交叉點上。由于(地理空間維、專題維1、…、專題維n、時間維)多個維確定的某一個對象往往是一地理空間對象,所以描述該聚集結果就得用空間度量來表術。空間數據立方體能執行地理空間對象的空間聚集操作,如空間合并、空間重疊、空間相交和空間覆蓋等空間度量聚集操作[4]。本文只討論空間合并的空間度量聚集操作。
眾所周知,地理空間對象由不同數量的點、線、面空間目標集合描述[12]。由此可見,空間度量就是由空間數據立方體地理空間維、專題維、時間維描述的某一地理空間對象,隨著多維信息發生增加或減少而產生的動態空間目標集合;空間度量聚集就是對該空間目標集合進行的空間合并、空間重疊、空間相交和空間覆蓋等操作。因此,隨著地理空間維、專題維、時間維中多維信息的增加或減少,產生由精化到概括或由概括到精化的空間度量聚集結果。它是通過空間數據立方體的維上鉆、維下翻來實現的[13]。
2空間度量聚集概念
眾所周知,地理空間對象分為點狀地理空間對象、線狀地理空間對象、面狀地理空間對象[12],每一對象分別由不同數量的點、線、面空間目標進行描述。因此,點狀、線狀、面狀地理空間對象的空間度量聚集示意圖如圖1~3所示。
圖1~3中黑色圈形符號代表選中,加粗直線代表選中,加粗多邊形代表合并的多邊形。由圖得知,已知空間數據立方體地理空間維、專題維、時間維組成的多維信息,當增加多維信息(增加限制條件)時,滿足這些多維信息條件的空間目標肯定減少,結果是被選中的空間目標數量減少,產生精化分析結果;當減少多維信息(減少限制條件)時,滿足這些多維信息條件的空間目標肯定增加,結果是被選中的空間目標數量增多,產生概括分析結果。由于同時滿足某一多維信息條件的點狀和線狀地理空間對象不具備相鄰性,當進行空間度量聚集時,不發生點狀和線狀空間目標的空間合并操作,產生點狀或線狀空間目標的聚類效果,空間目標數量多;而面狀地理空間對象具備相鄰性,當進行空間度量聚集時,只要相鄰的兩個多邊形目標信息(屬性)條件相同,將產生多邊形空間合并操作,所以空間目標數量反而減少。實際上是空間目標數量增多,只是被空間合并了而已。
地理空間對象的目標形狀不同,空間度量聚集方式和結果圖形顯示方法不同。分為四種:①空間數據立方體的地理空間維、專題維、時間維共同聚集出數字度量。此時地理空間維對應的地理空間對象目標不發生空間位置、空間形狀、空間關系和數量上的變化,并作為地理圖形背景,顯示數字度量的結果。②空間數據立方體的地理空間維、專題維、時間維共同聚集出點狀空間度量。此時地理空間維對應的地理空間對象目標不發生空間位置、空間形狀、空間關系上的變化,只發生點狀空間目標數量上的變化,產生被聚集的點狀空間目標集合。其本身作為地理圖形背景,顯示點狀空間度量的聚集結果。③空間數據立方體的地理空間維、專題維、時間維共同聚集出線狀空間度量,此時地理空間維對應的地理空間對象目標不發生空間位置、空間形狀、空間關系的變化,只發生線狀空間目標數量上的變化,產生被聚集的線狀空間目標集合。其本身作為地理圖形顯示背景、顯示線狀空間度量的聚集結果。④空間數據立方體的地理空間維、專題維、時間維共同聚集出面狀空間度量。此時地理空間維對應地理空間對象的面目標將發生空間位置、空間形狀、空間關系和數量上的變化,即進行多邊形合并操作,產生更大的多邊形區域,并作為地理圖形顯示背景,顯示面狀空間度量的聚集結果。
3空間度量聚集操作
聚集就是改變空間數據立方體的維數或維的層次,變換分析的概括度,主要滿足用戶基于多維信息的概括分析。空間度量聚集主要采用鉆取分析。它包括維上鉆、維下翻和維層次上鉆、維層次下翻[1]。維上鉆就是去掉某一維或若干個維,即減少空間數據立方體的維數;而維下翻則相反,它是在維上鉆的基礎上相應地新增一維或若干個維,即增加空間數據立方體的維數。維層次上鉆就是在某一維上將低層次的細節數據概括到高層次的匯總數據上,空間數據立方體的維數不變;而維層次下翻則相反,它在某一維上從高層次的匯總數據深入到低層次的細節數據上進行觀察,同樣空間數據立方體的維數不變。假設用(維1,維2,…,維n)代表(地理空間維,專題維1,…,專題維n,時間維),下同。
3.1維上鉆
維上鉆操作就是在具有(維1,維2,…,維n)空間數據立方體的基礎上,綜合一個或更多的維(維1,維2,…,維m),使這一個或更多的維的成員值為“ALL”,聚集出相應度量的過程。其中m<n和地理空間維除外。這樣,提高了度量數據的綜合或抽象水平,從多維信息中抽取出了更具概括性的度量數據。對于非空間度量,維上鉆操作的結果就是得出更具概括性的數字度量;對于空間度量,維上鉆操作的結果就是得出更具概括性的空間度量,即執行地理空間對象的空間目標集合聚集操作,如產生較大的多邊形合并操作。維上鉆操作功能圖如圖4所示。
3.2維下翻
維下翻操作是維上鉆操作的逆操作,由概括性的數據到更精化的數據,滿足用戶在了解概括性數據的前提下又想進一步知道精化數據的需求。維下翻操作必須建立在維上鉆操作的基礎上。基于(維1,維2,…,維n)的空間數據立方體,在已上鉆空間數據立方體(維1,維2,…,維m)基礎上(其中m<n),再額外產生一個或更多的維(維1,維2,…,維k,度量),使這一個或更多的維具有成員值,并計算出相應度量的過程。其中m<k≤n和地理空間維除外。這樣降低了度量數據的概括或抽象水平,提高了度量數據的細節度,表示了低等級的度量聚集數據。對于非空間度量,維下翻操作的結果就是得出更精化的數字度量;對于空間度量,維下翻操作的結果就是得出更精化的空間度量,即得出上一個上鉆操作前地理空間對象空間目標聚集集合。維下翻操作功能圖如圖5所示。
3.3維層次上鉆
維層次上鉆操作是在具有(維1,維2,…,維n)空間數據立方體的基礎上,不綜合任何一個或更多的維,在空間數據立方體的維層次上進行聚集,即在某維的層次鏈上按照其維的成員從低等級到高等級進行精化到概括(地理空間維也不除外),聚集出相應的度量過程。這樣也可提高度量數據的概括或抽象水平,從多維信息中抽取出概括性的度量數據。對于非空間度量,維層次上鉆操作的結果就是得出概括性的數字度量;對于空間度量,維層次上鉆操作的結果就是得出概括性的空間度量,即執行地理空間對象空間目標集合的聚集操作,如產生較大的多邊形合并操作。值得注意的是,維上鉆操作和維層次上鉆操作產生的度量概括度不同,前者比后者高。維層次上鉆操作功能圖如圖6所示。
3.4維層次下翻
維層次下翻操作是維層次上鉆操作的逆操作,由維層次上較概括性的數據到較精化的數據。維層次下翻操作必須建立在維層次上鉆操作的基礎上。基于(維1,維2,…,維n)的空間數據立方體,在維層次上鉆的基礎上,不增加任何一個或更多的維。其維的成員值從概括到精化,即在某維的層次鏈上其維的成員從高等級到低等級,地理空間維也不除外,并計算出相應度量的過程。這樣降低了度量數據的概括或抽象水平,提高了度量數據的細節度,表示了低等級的度量聚集數據。對于非空間度量,維層次下翻操作的結果就是得出精化的數字度量;對于空間度量,維層次下翻操作的結果就是得出精化的空間度量,即得出上一個維層次上鉆操作前地理空間對象空間目標聚集集合。值得注意的是,維下翻操作和維層次下翻操作產生的度量細節度不同,前者比后者細。維層次下翻操作功能圖如圖7所示。
4結束語
在空間數據立方體中,空間度量始終是一個比較抽象的概念,對從事GIS研究與開發的人員來講這也是個比較新的研究領域。本文用較通俗的語言描述空間度量定義、空間度量聚集概念、空間度量聚集操作原理,并結合具體的點狀、線狀和面狀地理空間對象實例講述點狀、線狀、面狀空間度量的聚集過程,希望能起到拋磚引玉的作用。
參考文獻:
[1]鄒逸江. 空間數據立方體分析操作原理[J] .武漢大學學報:信息科學版,2004,29(9):822-825.
[2]鄒逸江.多維空間分析的關鍵技術——空間數據立方體[J]. 地理與地理信息科學,2006,22(1):12-16.
[3]鄒逸江. 空間數據立方體的研究[D]. 武漢:武漢大學, 2002:3-120.
[4]STEFANOVIC N, HAN Jiawei. Object-based selective materialization for efficient implementation of spatial data cubes[J]. IEEE Transactions on Knowledge and Data Engineering, 2000,12(6):1-21.
[5]SHEKHAR S, TAN X. Map cube: a visualization tool for spatial data warehouses[EB/OL]. http://www.cs.umn.edu/research/shashi-group/.
[6]ZHOU Xiaofang, HAN Jiawei. Efficient polygon amalgamation me-thods for spatial OLAP and spatial data mining: proc.of the 6th International symposium on SSD[C].USA:[s.n.], 1999:121-125.
[7]PAPADIAS D. Efficient OLAP operations in spatial data warehouses, HKUST-CS01-01[R]. Hong Kong:[s.n.], 2001:65-69.
[8]KAMP V, SITZMANN L. A spatial data cube concept to support data analysis in environmental epidemiology: proc.of the 9th SSDBM’97[C]. Canada:[s.n.], 1997:234-238.
[9]WANG Baoying, PAN Fei. EfficientOLAP operations for spatial data using peano trees: proc.of DMKD’03[C]. San Diego:[s.n.], 2003:126-130.
[10]PRASHER S, ZHOU Xiaofang. Multiresolution amalgamation: dynamic spatial data cube generation: proc.of the 15th Australasian Database Conference(ADC2004),Conference in Research and Practice in Information Technology[C]. Dunedin, New Zealand:[s.n.], 2004:345-349.
[11]RAUBER A, TOMSICK P, RIEDEL H, et al. Integration geo-spatial data into OLAP systems using a set-based quad-tree representation: proc.of the 9th SSDBM’97[C]. Canada:[s.n.], 1997:256-260.
[12]鄒逸江.空間數據立方體多維信息空間分析實例[J]. 計算機應用研究,2007,24(2):199-202.
[13]鄒逸江,楊曉平.空間數據立方體的技術框架研究[J].計算機應用研究,2006,23(10):27-29.
[14]鄒逸江.客戶機/服務器的地圖復雜對象數據庫系統設計[J].測繪學報,1999,22(3):251-256.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”