夏傳鯤 劉思青 王穎峰
在“SG186”工程體系的框架下,河南省電力公司已經統一建設了省公司數據倉庫,但目前使用者的主體對象是省公司的用戶,如何此基礎上構建地市數據倉庫,從體系結構和數據冗余度等方面來看,我們可以有以下三種形式
第一,集中式。在省公司的機房中再建一套地市綜合數據庫系統,以實現地市的決策分析需要,采用單個物理數據庫中存貯用來查詢和分析的綜合數據,所有業務系統網省層次部署,地市不部署任何系統。采用此方式可以降低數據抽取的網絡負擔,但數據訪問時需要較好的網絡支持,但價格昂貴,開發周期長,需要解決數據抽取、實體化視圖維護等問題。
第二,分布式數據倉庫。各數據成分分散在多個不同的物理數據庫中。即在每個地市建立綜合數據庫,每個站點是一個自治的本地數據倉庫,決策在本站點內部完成。省公司的中心站點上設有全局數據倉庫,可進行全局決策。這種實現方式包含有大量的數據冗余,對數據的裝載和更新等處理極其復雜。
第三,虛擬數據倉庫。類似于分布式數據倉庫,其在中心站點上存放的不是各地市供電公司的具體數據,而是描述這些數據的指針。終端用戶通過指針的方式,利用適當的工具直接在虛擬的數據倉庫中獲取數據。它不需要對數據進行預先抽取、綜合,也沒有數據維護等問題,且建造周期短、投資小。
一、虛擬數據倉庫的數據理論基礎
(一)%l選擇
%l選擇也稱為限制,即從大的數據倉庫集合中進行過濾和篩選。
%lF(R) = {t | t∈R∧F(t) = TRUE}
選擇關系具體的語句的形式如下:
SELECTR.a1,…,R.an
FROMR
WHERER.name =鶴壁(或者R.code =100000033)
(二)%i投影
%i投影是從大的數據倉庫集中的關系R中選擇若干屬性組成新的關系。記作如下:
%in(R) = {T[A] | t∈R}
其中A為R中的屬性列。在我們建設地市鶴壁的虛擬數據倉庫中,投影關系主要用于以下場合,即是在省公司數據倉庫中有一些地市不用關心的屬性,通過投影關系的限定,作為地市的只關注自己范圍內的信息和屬性,極大地保證了省公司數據的安全性。
二、虛擬數據倉庫的體系結構
虛擬數據倉庫通常采用三層結構:
(一)展現層
實現如何把數據庫系統中的數據和分析結果提供給最終用戶。按照用戶的分析需求,使用報表、即席查詢、多維分析和數據挖掘進行數據展現。展現層是采用IBMCognos8.1作為前端的展現分析工具。虛擬數據倉庫透明地支持各種不同需求的終端用戶,通過語義層在展現層可以實現整個組織的統一視圖。
(二)映射層
1.應用程序接口:采WebService的方式向數據的需求者提供基于XML文件接口,實現虛擬數據倉庫的跨應用數據共享。
2.數據庫接口:采用數據庫物理視圖實現數據映射,通過視圖可方便地對數據進行重組。另外,將這些數據同業務規則捆綁在一起,可滿足機構中某一方面特定應用的查詢。
(三)數據層
表示實際的數據來源。它們既可以是各種類型的數據庫,也可以是文檔、記錄、聲音、圖象數據。它們當中既有實時數據,也有歷史數據;既有專門的業務數據,也有局部綜合數據;在地市數據倉庫的建設中,數據源包括省公司數據倉庫系統、地市特有數據應用。
三、虛擬數據倉庫的作用
第一,有利于降低地市數據倉庫的建設成本,虛擬數據倉庫節省了服務器、存儲設備和軟件平臺的投資。
第二,虛擬數據倉庫有利于省公司數據倉庫的實用化建設。
第三,虛擬數據倉庫充分利用了省公司的實體數據倉庫資源,建設速度快,縮短了建設周期。
第四,維護方便,虛擬數據倉庫通過映射和指針技術,保證了與省公司數據倉庫的一致性,加強了數據集中的管理、保證了數據的單一出口和數據的正確性,增強了數據共享的能力,從而獲得完整的業務數據視圖;
第五,通過跟蹤分析這些業務數據信息,管理層可以預定企業盈利、生產、安全等方面的計劃,增強企業領導決策能力。
四、虛擬數據庫的應用
自從虛擬數據倉庫概念提出以來,它已經在金融、保險、軍事等部門得到了廣泛的應用。通過在河南省電力公司鶴壁地市建設虛擬數據中心,很好地實現了地市的領導輔助決策支持系統,不僅建設周期短,而且建設成本低,維護方便。可見,電力企業領域特別是在“SG186”工程的推動下,在網省兩級數據中心已經全面的基礎上,實現數據的唯一性與共享性,建立統一的安全體系,保證數據及業務系統的訪問安全,完善數據交換體系,實現數據中心間的級聯,提升經營決策的管理能力等領域,虛擬數據倉庫也有廣泛的應用前景。