寧方貴,劉媛媛
(水利部松遼水利委員會,吉林長春 130021)
1998年,著名的“數字地球”概念提出的同一年,張勇傳院士在我國率先提出了“數字流域”的概念[1]。盡管諸如美國田納西河、非洲尼羅河、歐洲多瑙河及我國的黃河、長江等大江大河都進行了數字流域的研究、工程建設及管理,并取得了一定的成就,但作為“數字地球”一個最近似的、完善的、結構體系龐大而全面的縮影,“數字流域”的概念和標準體系結構至今尚無定論。李紀人在《中國數字流域》一書中給予了如下定義:“‘數字流域’將是一個以流域空間信息為基礎,以流域水循環機制為紐帶,以流域水事務管理為驅動,融合流域內各種數字信息的系統平臺,是對真實流域及其相關現象的統一的數字化重現”[2]。對流域的數字化重現和研究,基底在于流域空間及非空間數據的信息化及建立其上的流域模型,其發展根本立足于水利空間數據庫的建設和有效使用。得益于飛速發展的數據庫技術,水利專題空間數據庫也進行了相當的建設,但受種種原因的牽制,目前大多數水利空間數據庫都存在各種數據問題,有些僅為某單一項目服務,重復建設嚴重;有些建立后難于實際應用,形成數據閑置;社會化服務和產業化程度低,不能有效服務于多層次業務需求。避免進行表面化建設和盡快解決相應建設環境是水利空間數據庫建設的當務之急,也是“數字流域”發展建設的根本所在。本文從建設中存在的問題和需要強化的方面對水利空間數據庫建設進行了探討。
水利空間數據庫建設一般僅需考慮存儲內容,其數據存儲模式及數據模型交由應用軟件服務商考慮和提供。目前大部分數據庫建設都以服務于對應項目為目的,專題專庫,針對性較強,但擴展性低,通用度低,缺少在統一規劃下,對流域基礎信息與各類水利專題信息兼收并蓄,在行業內部跨專業建設,在行業間有選擇的控制建設的數據庫,既因重復性建設形成資金和資源浪費,又因業務分割導致割據式建設,沒有形成以應用為推動,以服務多層次多部門業務需求為要求,以滿足流域開發水資源保護利用綜合效益最大化為優化目標的綜合空間數據庫,難以推動“水利信息化資源整合與共享”的進程和“數字流域”整體發展步伐。
通常使用的以某一比例尺成果圖進行建設成果展示的方式使得建設中對展示效果的期望超過數據建設本身。在數據庫建設中,往往沒有考慮不同比例尺和分辨率對數據精度的要求和限制,對數據進行過度的精化或概化,并且由于數據來源和數據質量控制等因素,使數據建設中摻入大量無法追溯的人為干擾因素,可能導致類似于改變真實數據空間布置及產生設計上的二義性等問題。使用單一比例尺數據可能受到顯示條件的限制,而使用多套比例尺數據又必須嚴格控制和規范其數據一致性、數據拓撲關系及空間匹配,否則將帶來極大的數據混亂,這是項目建設中無法避免會遇到的問題之一。現實空間存在復雜性,任何數字化技術都不可能完全表達其本貌,紙質地圖制作使用地圖概括用于因地圖比例尺變化引起的表示內容及復雜度的增減。GIS多尺度、多層面特性的介入,GIS軟件數據分層存儲和無極縮放、可控制顯示條件的功能在一定程度上解決了比例縮放帶來的要素之間的空間競爭,但單一比例下的縮放必然忽略空間要素增減的“有效性”。行業要義是軟件供應商無法深刻理解的,通用型商業軟件也無法做到合理衡量行業空間對象概括適用程度。只能由空間數據庫建設者和使用者綜合考慮數據來源、應用需求和質量控制等問題,形成存在合理冗余的匹配業務應用的空間數據庫。如果忽略建設目標、數據精度及內涵,元數據及數據處理手段等配套文檔記錄,單方面從圖形的連貫和美觀來決定建設方案將會帶來“內容矛盾”、“冗余建設”、“人為錯誤”等問題。
當前建設中,數據結構仍然停滯在單一的簡單數據結構層面,即點、線、面的矢量存儲結構,柵格數據僅以圖片的形式作為展示背景使用。矢量結構假定坐標空間為連續空間,通過記錄坐標的方式對空間要素進行描述,當空間要素被描述為線或邊界時,這種結構會呈現位置明顯、結構緊湊等優點,合適用來描述水系數據。但對于連續性對象如流域土壤類型分布、溫度分布、土壤墑情分布、冰雪覆蓋范圍等情況的描述及需要網絡分析的如污染物流動、防洪預案中人員疏散和物質調集等應用需求就顯得有些力不從心,并使得空間數據庫陷入單純提供分布展示的瓶頸和尷尬,使GIS在項目應用中浮于淺層展示功能而沒有充分使用和發揮其空間分析功能。與柵格數據相比,矢量數據存儲格式因軟件環境不同而存在較大差異,數據格式轉換中可能會帶來錯誤和數據丟失。數據之間是分離的,并且,同種空間地物的不同存儲結構將對應用產生不可預計的影響。另一方面,數據空間信息空洞,信息挖掘忽略空間本質而浮于表面;其對應的屬性數據也僅限于空間位置、級別類型等,缺少對應于模型空間特性的屬性,例如點的障礙度和可通過量極值、線的流量和允許方向、連通度及時間性質等,而這些信息對于進行流域內水量、水利工程等項目的科學實時聯合調度,以獲得在可持續發展前提下的利益最大化流域開發成果;應對突發事件及動態分析模擬等能夠起到較大的支撐作用。
多時相性常常被數據建設者作為數據拼接和融合問題去考慮,而忽略其作為GIS處理對象本身的特質。實際問題本身通常也是動態、具有時間維度的。數據庫的時效應該是兩面的。一方面,多渠道來源的數據進入數據庫,必須嚴格規范其時間戳管理,為數據使用和更新提供時間標記保障;另一方面,大量自動測報系統的項目實施帶來了急速增長的動態監測管理信息,水利工程建設帶來的建筑物及相應設施空間信息變更、屬性數據連續的問題,以及數據本身所具有的生命期、發生序列及消亡點,也要求其時間標記具有明確的語義。這種時間標記包含屬性數據項時間標記、實體時間標記、數據庫時間標記[3]等,不僅為數據溯源和數據更新維護提供了信息支持,也為有效管理具有時間變化特性的數據,對其進行歷史狀態重現、演變跟蹤、趨勢預測做好了準備。
目前空間數據庫的數據組織和模型仍然是以面向地圖為主,而不是面向客觀空間實體及其時空關系[4];空間數據與屬性數據處于弱聯系狀態。盡管兩者在一定程度上實現了一體化存儲,但并未得到實質上的有機融合;部分空間數據和信息尚未以更適當的方式進行建設和存儲,數據表義模糊。這些問題的存在使得基于GIS建立的應用系統或流域模型存在數據庫與模型庫相互獨立的情況。因此,應充分考慮業務需求,使空間數據庫的建設有利于流域模型的建立與維護,使兩者緊密結合、有效集成,在某一程度上為模型參數的精度和更新,模型的效率和適用性提供保障。
水利專題空間信息的標準和規范目前尚且存在大量空白,盡快有效填補這些空白是當前水利空間數據庫建設亟待解決的重要的外部環境問題。這影響到數據建設和共享兩方面的進程,應盡快建立具有實際指導意義的理論框架,并在此基礎上引進共享機制。盡管已經實現了大量水利信息共享服務系統和公眾信息服務系統,但信息壁壘,尤其是對研究和決策起重要作用的策略信息并沒有得到良好的共享和使用。這里固然有部門業務利益壟斷的原因,也有數據運營建設理念上的誤區。在信任和誠信的前提下,打破信息壁壘,交換取得可靠的數據也是對潛在資源挖掘的一種增值行為。通過一系列數據資源共享及保密機制的協議和契約,形成數據資源的優勢互補、優勢相長、風險共擔、水平式有效雙向或多向流動。可以增強部門之間對彼此業務意圖、需求和執行步驟的理解,分攤和控制建設成本,在一定程度上改變原有建設模式和建設步驟,產生利于知識經驗分享和移動的寬松環境以及共同的可持續競爭優勢。
水利空間數據庫作為“數字流域”數據庫集群建設的核心,它的有效建設和應用,對行業信息化、集約化發展有著不可替代的影響和作用。社會區域化、多極化發展在客觀上要求在一定的地理范圍內打破行業限制、消除分歧和障礙,促使數據資源在一定框架內自由流動和有機配置。流域管理機構作為所在流域的水行政主管部門,既有突出的專業特點,又與區域層面交叉重疊,需要從高層面綜合考慮如何為防汛抗旱、水資源開發保護、水環境決策及與水相關的社會經濟研究提供大量可靠的可高效訪問的數據,從整體進行控制和理順。因此應以流域機構為數據中心,協同區域分中心建設具有統一結構規劃、數據組織標準化、數據含義清晰、研究單元合理、可同時滿足商用價值與科研支持、現實領域問題分析解決能力的水利空間數據庫,使其為行業集約化和社會化發展服務。
[1]王光謙,劉家宏 .數字流域模型=The DigitalW atershed Model[M].北京:科學出版社,2005.
[2]李紀人.中國數字流域[M].北京:電子工業出版社,2009,6.
[3]鄔倫.地理信息系統-原理、方法和應用[M].北京:科學出版社,2001.
[4]吳信才.面向網絡的新一代地理信息系統[M].北京:科學出版社,2009.