馬 逍
(貴州省水利水電勘測設計研究院有限公司,貴陽 550002)
考慮到水庫移民工程的復雜性,工程的具體實施與社會環境和自然資源均有聯系[1]。水庫移民工程在不同領域涉及的信息類型眾多,既包含移民屬性數據,又有地理數據、區域設施數據等[2],這些數據對工程推進的順利程度均有較大影響。為了更好地管理水庫移民工程數據,針對空間數據和非空間數據構建可以集中管理的數據庫至關重要。文獻[3]針對歷史數據庫建設質量進行研究,生成一種可以控制數據庫質量的數據庫模型構建方案。基于現代化管理技術,按照數據質量將待管理數據劃分為多個層級,以此為依據建立數據庫模型。但是,該數據庫模型查詢效率較低。文獻[4]采用HBase管理技術設計一種關系型空間數據庫模型,基于傳統數據庫存儲模型,結合HBase轉換規則,將空間矢量數據轉化為可以被統一管理的數據。按照HBase的反范式化特點,實現對傳統數據庫模型的優化。但是,該模型管理操作過于復雜。文獻[5]結合可視化技術與GIS地理信息系統,建立符合工程數據管理需求的數據庫模型。引入日本的數據庫模型建設經驗,與國內數據庫模型設計內容相結合,獲取數據庫模型具體設計流程。但是,該模型的應用拓展性較差。
本文以水庫移民工程數據管理為研究重點,提出以GIS為基礎的數據庫模型。經過數據處理、數據分類及編碼、數據庫模型邏輯以及數據庫訪問機制,完成數據庫模型整體設計。以期有效提升數據查詢效率,并在水庫移民工程推進過程中發揮巨大作用。
考慮到水庫移民工程數據的多樣性,本文以QuickBird數據為主要數據源,設計數據校正、數據融合相結合的處理方案[6]。
本文采用幾何校正的方式進行水庫移民工程基礎地理數據精度糾正,結合地面控制點坐標與多項式變換方法,明確實際信息與采集信息之間的對應關系[7]。根據水庫建設區域的實際環境特點,將幾何校正的控制點選在寬度為0.5 m左右的小道。再通過多項式變換方法變換數據的幾何位置,具體公式為:
(1)
式中:(a,b)為像點的像平面坐標;(α,β)為像點對應地點的大地坐標;η、μ為多項式系數。
其中,系數可以通過最小二乘法進行計算,而多項式變換過程中系數數量,與階數的聯系可以表示為:
(2)
式中:φ為控制點數量;f為階數。
基于上述多項式變換方法,在ERDAS 8.7處理軟件的作用下完成水庫移民工程數據的幾何校正,確保每個控制點的殘余誤差低于0.2。
數據處理后進行融合處理,本文采用IHS變換融合技術,從RGB彩色空間變換角度入手,將數據映射到HS空間內,實現數據融合,這一融合算法主要包括正變換式和反變換式兩部分。其中正變換式為:
(3)
(4)
(5)
式中:P為明度;E為色度;S為飽和度;R為紅色;G為綠色;B為藍色;RGB為整個彩色空間;m1、m2為彩色變換中間變量。
以正變換式為基礎,將數據融合的反變換公式表示為:
(6)
將水庫移民工程涉及的基礎地理數據處理完成后,參考實際研究區域的主要地理要素,以村為單位進行數據無縫鑲嵌,與其他非空間數據一起,作為后續數據庫模型構建的基礎。
除上述處理的基礎地理數據外,水庫移民工程數據庫還包括移民屬性、土地利用現狀等多種數據信息[8]。為了便于數據管理和查詢,本文在數據庫模型構建過程中,針對所有數據進行分類,將數據庫劃分為空間數據庫、屬性數據庫兩大部分。
其中,空間數據庫內的數據信息包括淹沒區分析和基礎地理位置分析,均包含明顯空間位置特征。這部分數據可以在工程推進過程中,作為移民安置規劃的設計參考。而屬性數據庫的設計主要是為了存儲移民相關信息[9],按照水庫移民工程數據的實際性質,將其劃分為移民損失調查表、工程建設表等多個獨立統計表。數據具體分類結果見圖1。

圖1 水庫移民工程數據分類圖
按照圖1所示的水庫移民工程數據分類圖完成數據分析后,進行數據編碼。采用常用的符號,分別表示不同的空間要素,這一過程中需要保證數據編碼可以讓人們能夠統一識別,最直觀的編碼產物就是數據代碼[10]。合理的數據編碼體系,可以提升水庫移民工程數據庫的信息共享效率。實際編碼過程中,可以將基礎地理數據集、土地利用現狀數據集等作為第一級數據分類,而每個子數據集的內容作為第二級數據分類。為了加強數據庫模型建立數據庫的實際應用效果,將二級數據分類編碼信息與其對應的一級數據分類編碼應該有所關聯,按照這一原則,將整體水庫移民工程數據進行連接。
數據庫邏輯設計是水庫工程數據庫模型構建的重要內容,本文從數據庫使用者的角度,設計以GIS為基礎的數據庫模型。針對空間數據的表達內容,通過矢量存儲、柵格存儲兩種方法保存數據信息。其中,基礎地理數據和移民專題數據均屬于矢量數據,按照分層的組織形式管理這部分數據,并采用合理的對象標識符與相關的損失調查數據進行連接。
本文采用Arc SDE設計一個空間數據庫引擎,將水庫移民工程數據庫分解為多個空間特征要素集。每個特定的要素集內均保存著符合專題內容的二維矢量數據,形成多個要素類。在空間數據庫引擎設計過程中,本文融合GIS地理信息系統,根據現實世界到計算機的轉換原理,形成GIS數據模型。通過研究可知,GIS數據模型包括概念、邏輯、物理3種數據有機聯系層次,見圖2。
考慮到當前GIS技術的發展情況,本文設計的數據庫模型邏輯不再根據模型層次進行直接操作,而是針對圖2所示的層次進行深入分析,生成對象關系型數據庫模型。水庫移民工程數據庫模型設計過程中,在GIS技術的作用下,可以將空間實體轉化為相應的空間對象,且空間對象具有點、線、面等某一類公共屬性。結合空間知識對象原理,在水庫移民工程數據中獲取包含信息量最高的領域空間知識。

圖2 空間數據模型的3個層次
結合GIS地理信息系統和對象關系概念,生成的工程數據庫模型,從領域空間知識應用的方向,設計與對象相關的技術,有效結合點、線、面3種空間概念,將數據分類及編碼結果分別保存至對象內部,作為空間對象的內部屬性。通過關系模型,完成空間對象的有效擴展,與水庫移民工程實際環境相結合,建立符合外部屬性管理要求的空間實體要素。在GIS數據庫模型邏輯設計過程中,按照關系模型一體化保存的模式,從數據屬性入手管理空間數據。本文采用對象最小化原則,從點、線、面3個角度分析,將水庫工程數據庫保存內容描述為不同類型的空間對象,并針對空間對象進行物理存儲。根據數據屬性邏輯管理各種數據,除了運用空間關系將空間內部屬性封裝在對象中外,還可以采用關系模型表達的方式,將土地用途、元數據等外部屬性知識,直接附加到空間對象上。根據GIS地理信息系統和空間對象擴展關系,得到空間數據庫模型,見圖3。

圖3 基于GIS的空間數據庫模型
依托于GIS地理信息系統生成圖3所示的數據庫模型,再結合統一管理要求,對數據庫進行命名。為了加強數據管理和查詢能力,本文根據數據管理要求,利用Geo-digital管理模式建立數據庫命名策略,并將該命名策略應用在數據表命名、圖層命名等多方面。
深入分析GIS數據庫模型邏輯可知,水庫移民工程數據信息之間存在較強的關聯性,在工程數據庫模型實現過程中,需要考慮數據的從屬關系,以此為基礎建立數據層次關系。之后,利用唯一鍵和缺省值等約束條件,設計水庫移民工程數據統計表,以及工程數據圖形屬性統計表,并且表與表之間可以實現實時信息變化。從空間數據和屬性數據兩個角度進行分析,前者以圖形數據為主,分析主體數據與屬性數據之間的聯系,描述水庫移民工程數據的特點。而屬性數據可以僅僅指代屬性表,多個屬性表并列、具有從屬關系屬性表結合形成的鏈狀表也可以被稱為屬性數據。這一過程中,圖形數據和屬性數據存在對應關系。
工程涉及數據存儲完成后,數據庫模型實現的最后一個步驟就是數據查詢,本文利用數據庫訪問機制完成數據讀取。根據計算機技術當前發展情況可知,水庫移民工程實施過程中,工程規劃、信息網絡發布以及可視化實現均需要通過訪問數據庫得以實現。本文采用C/S結構構建數據庫模型,便于后續工作過程中數據信息提取。此外,工程數據庫模型的實現采用B/S結構作為外部Internet,有利于數據的遠程處理和發布。從數據庫使用人員的角度來看,數據庫讀取內容最好都是以對象的形式存在,并且以數據表的形式呈現這部分讀取的對象信息。按照上述設計的工程數據庫模型讀取機器,見圖4。

圖4 數據訪問結構示意圖
同時,為了提升用戶讀取信息的效率,本文設計在圖4所示的數據訪問結構中添加多個中間層接口。這些中間層接口均由數據庫后臺人員進行管理,利用中間層接口向用戶提供標準的數據內容,便于用戶應用數據進行專業工作。根據圖4可知,數據庫內每個對象都不是獨立的,通過字段訪問對象表內記錄信息,獲取所需數據。當訪問信息存在其他表格內時,數據庫訪問機制會反饋給用戶指向信息,向用戶表明數據獲取方式。并且,每個對象表之間都存在聯系,總體構成鏈狀數據結構,連接數據庫中每一張數據表。
本文以水庫移民工程為研究重點,提出基于GIS的數據庫模型,為了驗證該模型可行性,針對某一水庫移民工程建立數據庫,并進行數據庫模型應用效果分析。
本次實例分析選定的研究區域為廣西壯族自治區內紅水河流域。據調查,該流域每年年徑流量在517×108m3左右,是水力資源最豐富的區域之一。隨著區域內水電站建設數量的不斷增加,水電水庫必然會導致區域內居民生活受到淹沒,急需開展水庫移民工程。根據本文提出的數據庫模型,在GIS技術的作用下采集紅水河流域空間信息,并建立空間數據庫,作為移民規劃的基礎。紅水河流域具體情況見圖5。

圖5 紅水河流域概況圖
紅水河流域內修建的水庫位于龍灘水電站附近,總庫容達到162.1×108m3,且年平均發電量為156.7×108kW·h。該水庫修建完成后,可以充當紅水河流域的骨干工程,兼具發電、航運等多種功能。經過計算可知,該水庫工程的建立會導致龍灘水電站附近約4 000 km2的面積受到淹沒,影響11個縣人民群眾的生產生活。為了確保水庫移民工程的順利進行,需要對該區域的土地利用情況、移民屬性等多種數據進行清查,合理轉化為GIS數據并保存在數據庫內,有利于指導后續移民工作的進行。
水庫移民工程數據庫模型的應用,需要基于GIS采集的空間信息來建立,轉化為符合工程要求的數據庫。首先,針對采集和處理完成的空間數據進行驗收,將合格的數據分類保存至不同的空間數據庫內。這一過程中,為了便于后續數據查詢和調取,以鄉為單位設置獨立的要素數據集,并對每個村劃分要素圖層,數據集的屬性字段設置見表1。

表1 要素圖層屬性字段設置表
數據庫的設計是為了支持水庫移民工程決策的實現,對采集數據進行分類組織編碼后,本文提出的GIS空間數據庫模型設計邏輯,生成紅水河流域水庫移民工程數據庫。應用模型得到的數據庫實際顯示界面見圖6。

圖6 數據庫顯示界面
圖6中,工程數據庫內包含村組、鄉鎮、安置點、主要公路以及庫區設施等多種相關數據,可以通過點擊的方式獲取水庫移民所需的數據,并在頁面下方獲取坐標信息。紅水河流域水庫移民數據庫的建立,充分表明了本文設計模型的可行性。
為了更好地展現本文所提出模型的優越性,采用常規工程數據庫模型建立原始數據庫,以基礎地理數據、土地利用現狀數據以及移民屬性數據為測試用例,對比兩種模型構建的數據庫的數據查詢性能。其中,紅水河流域水庫移民工程所涉及的基礎地理數據包括50多萬條,土地利用現狀數據包括3萬多條,而移民屬性數據高達400萬條。針對上述數據發送查詢口令,查詢響應時間見圖7。

圖7 數據查詢響應時間對比圖
從圖7可以看出,本文設計模型生成的數據庫在實際應用過程中,查詢響應時間遠遠低于原始數據庫,從原始的9、4.9、2.2 s降低至2.9、2與0.8 s。實例分析結果表明,本文提出的水庫移民工程數據庫模型在實際應用中,數據查詢響應時間降低63.53%,提升了數據庫查詢效率。
由于水庫移民工程涉及多種類型的數據,工程數據庫的設計是不可或缺的內容。本文采用GIS技術構建了一種新的數據庫模型,依托于GIS技術加強對工程數據庫的管理與維護。根據實際工程應用結果可以發現,按照模型要求生成數據庫,完成了數據的有效存儲和提取,數據查詢響應時間大大縮短。