周瑩
摘要:本文首先簡要分析了異構分布式數據庫系統,指出了異構數據庫的差異與分類,最后探討了異構分布式數據庫系統的具體設計思路,望能為此領域研究有所借鑒。
關鍵詞:異構分布式數據庫;全局數據字典;查詢優化
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2018)07-0220-01
受各因素影響,許多大中型企業當中的各個職能部門,均會使用滿足自身實際需要的不同數據庫系統,即使是一個事先有著嚴密安排,尤其是有著全面信息規劃的企業部門,其無論是在人事變遷方面,還是在時間推移上,均會造成不同程度,甚至多樣性的異構數據庫并存狀況。針對那些普通用戶而言,他們希望把充斥于各個層次的異構特性均屏蔽掉,他們不需要去深入了解各物理數據庫系統當前的分布狀況,同時也不需要明白其基礎結構構成;除此之外,也不需要自己去匯總結果及轉換數據,在實際操作中,僅需經簡單操作,有目的性的進行全局查詢,便能從中得到比較滿意的結果。針對此種技術來講,其實為一個能夠與各種數據庫之間,構建更為緊密的關系,還能根據實際需要,與各種數據庫間進行準確、細化的區分。本文就分布式異構數據集成系統及其設計思路作一探討。
1 異構分布式數據庫系統淺析
異構分布式數據庫系統實為一個擁有相同或不同數據模型,邏輯完整,并且還具有比較典型的站點自治性,在物理層面上,有規律的分散于幾個臺,且彼此均與計算機當中的數據庫系統有著緊密關聯。需要指出的是,在異構分布式數據庫系統中,在各節點處分布的數據庫系統,其擁有諸多特性,如擁有分布透明性、自治性與獨立性,用戶對數據庫的操作,類似于在本地進行操作,不需要太過注重具體細節,比如物理位置等;除此之外,它在邏輯與物理上,能夠根據實際需要,以一種合理、妥當的方式,屏蔽掉各數據庫之間所存在的差異,因此,能夠較好的幫助、引導用戶,以一種科學方式,借助數據操作語言(DML),對各種數據庫展開操作與處理。
當前,在達成此數據庫系統的體系結構方面,有2種比較可行的操作方法:(1)對于不同類型的異構型數據庫,都設置有比較實用且有效的用戶交互接口,不需要進行集成處理與分析。此方法可行且簡便,但是對于用戶而言,則難以比較透明的去對數據進行訪問,且當增加新的異構數據庫時,需使用戶接口增加,因而較為繁瑣。(2)基于各成員數據庫上,能夠形成一個具有全局性質的操作模式,最終達到對該系統實施有效控制的目的。針對此全局模式來講,其由諸多數據庫構成。當將此模式建好之后,便可根據實際需要,實時或有選擇性的訪問各數據庫。
2 異構數據庫的差異及分類分析
2.1 異構數據庫的差異
對于異構數據庫而言,在其內部往往充斥著各種類型的數據庫,如同數據模型不同廠商的同質異型數據庫及不同物理模型的數據庫,從根本上來講,要想把異構數據庫借助于網絡而連接起來,使其數據資源共享,便需將其差異找出來。當前,許多因素均會數據庫差異,比如系統控制方式、計算機硬件、網絡結構與操作系統等。
2.2 異構數據庫的分類
基于傳統層面來考量,異構數據庫在劃分上,主要是依據數據共享的廣度以及模式類型來開展的,此外,還借助于各種能夠訪問數據的工具來劃分。(1)對于充斥于異構數據庫的相關模式而言,主要有兩種,其一為全局模式,其二是局部模式。(2)針對異構數據庫系統當中的數據共享而言,其層次有2種,其一,在整個組件數據庫架構體系當中,連接特定的或有針對性的數據項,其二,在整個組件數據庫體系中,與模式之間存在緊密關聯的數據項。針對那些密切相關與模式的數據項,要想實現數據的連接,便需要時刻保持與此些模式約束方面的一致性。(3)數據訪問方式的劃分:查詢多數據庫系統;查詢一個集中的數據倉庫;在組件數據庫中瀏覽數據。
3 異構分布式數據庫系統的設計
3.1 系統總體結構
在實際操作中,針對異種數據庫而言,要想達成彼此之間的訪問,數據集成為其關鍵所在。針對數據集成來講,就是根據實際需要,以多個異種數據庫為對象,將其當作一個比較典型且實用價值高的邏輯數據庫,并用此來處理各類數據。針對虛擬數據庫集成技術來講,其便是一個比較實用且高效的解決方法;針對此方法來講,其將指針設置于中心位置,而針對數據而言,則仍設置在原先指定的位置。針對此種新路徑、新途徑而言,可以比較好的解決掉傳統數據所存在的存儲問題。
對于全局數據字典來講,其在整個數據集成架構當中,往往處于中心位置,發揮著關鍵作用。而在全局數據字典體系中,可以獲得一個以分布數據為對象且應用價值高的邏輯視圖,針對其作用而言,即把所存在的語義差異較好的解決掉,并根據實際需要,為異構數據流提供所需要的支持與服務,因而不僅有SQL能力,還具有較好的分布查詢優化功能。
3.2 異構分布式數據庫系統集成實現
針對整個集成環境而言,其核心即為調節器。針對本文所設計的調節器來講,其就是一個基于人工智能技術,所開發出的實用性軟件模塊,其內嵌了知識模塊,因而能夠更好的處理各種信息源。在問題空間中,其核心任務便是搜索,其借助于以組件數據庫為基礎的元數據及信息源,對與之相關的庫、表加以明確,并進行有針對性的分解查詢,使之成為數據庫的子查詢。在實際操作中,尤其是在明確數據源時,在選擇調節器時,需選擇那些已經得到相應優化的數據源;在此過程中,需考慮如下內容:其一,在物理上,需盡量減少數據流量;其二,基于邏輯層面,將與查詢有關聯的數據庫等考慮在內,并對執行的序列進行查詢。
針對調節器來講,從基礎層面來分析,其即為用問題空間,有選擇性與目的性的描述用戶所提交的查詢任務。對于問題空間來考量,從根本上來講,其就是一個比較典型的狀態集,用于明確或闡述任務的當前情況及狀態。對于一個操作符而言,其所代表的實際就是完成任務所需要采取的具體手段。比如以某個狀態為對象,根據當前情況及現實需要,對其進行一次算符操作,且形成一個全新的、目的明確的狀態。
4 結語
綜上,針對異構數據庫的聯合使用來講,其除了在數據庫原先應用中起到至關重要的作用外,還是未來新應用領域核心部分。針對其領域來講,不僅有數字出版、電子商務,而且還有地球觀測系統等。而以異構數據庫為典型代表,且作用日漸凸顯的異構信息源,其在實際應用中的互用與集成,有力推動著其在數據庫未來應用中的作用發揮。
參考文獻
[1]郗海龍,楊延雙.基于XML的分布式異構數據庫數據同步系統應用研究[J].沿海企業與科技,2009,(2):38-40.
[2]高玉蘭,姚世軍,江瀾.基于ontology的分布式異構數據庫集成研究[J].計算機工程與設計,2008,29(19):4906-4909.
[3]鄭南,鄭扣根.支持分布式異構地理數據共享與集成的GIS設計與實現[J].計算機應用研究,2004,21(8):200-202.