摘要:以原有網(wǎng)絡為基礎,利用計算機技術(shù)、網(wǎng)絡技術(shù)、通信技術(shù)等先進的信息化手段和工具,將原有教學資源通過數(shù)據(jù)庫集成技術(shù)進行整合。實現(xiàn)從環(huán)境到活動到資源的全部數(shù)字化,在傳統(tǒng)校園的基礎上,構(gòu)建一個數(shù)字化校園,拓展現(xiàn)實校園的時間和空間維度。
關(guān)鍵詞:數(shù)字化校園
數(shù)據(jù)庫
數(shù)據(jù)庫集成
異構(gòu)數(shù)據(jù)庫
中圖分類號:TP311.13
文獻標識碼:B
文章編號:1002-2422(2010)03-0078-02
1校園數(shù)字化過程中存在的問題及原因
現(xiàn)在的數(shù)字化校園,因為信息化水平的差異,有些部門的數(shù)據(jù)是自己通過服務器加硬盤方式進行管理,形成了數(shù)據(jù)孤島。有些數(shù)據(jù)雖然存放在存儲器上,但是因為各自維護,重復投資,管理壓力也比較大。所以有必要建立統(tǒng)一的數(shù)據(jù)中心,整合服務器和存儲資源,建立有效的訪問和管理機制,提高整個學校的信息化水平。
究其根本原因是缺乏一個描述資源元數(shù)據(jù)及其內(nèi)容結(jié)構(gòu)的統(tǒng)一標準和有效手段。要對這些資源進行統(tǒng)一高效的利用就需要進行資源的標準化,用統(tǒng)一的標準來描述和管理這些資源。異構(gòu)數(shù)據(jù)庫的集成問題便成為解決這是相關(guān)的多個數(shù)據(jù)庫系統(tǒng)的集合,可以實現(xiàn)數(shù)據(jù)的共享和透明訪問,每個數(shù)據(jù)庫系統(tǒng)在加入異構(gòu)數(shù)據(jù)庫系統(tǒng)之前本身就已經(jīng)存在,擁有自己的DBMS。
2解決辦法
2,1異構(gòu)數(shù)據(jù)庫的集成
異構(gòu)數(shù)據(jù)庫的集成中,異構(gòu)數(shù)據(jù)庫的各個組成部分具有自身的自治性,實現(xiàn)數(shù)據(jù)共享的同時,各數(shù)據(jù)庫系統(tǒng)仍保有自己的應用特性、完整性控制和安全性控制。隨著異構(gòu)數(shù)據(jù)庫數(shù)據(jù)交換集成技術(shù)及其應用的不斷發(fā)展,分布式環(huán)境中異構(gòu)數(shù)據(jù)庫的訪問和集成已經(jīng)成為研究的重要組成部分。分布式異構(gòu)數(shù)據(jù)庫交換集成技術(shù)的根本目標是協(xié)調(diào)數(shù)據(jù)資源的共享。在分布式異構(gòu)環(huán)境中存在眾多資源,這些資源的特性及資源所處的環(huán)境各不相同。交換集成技術(shù)的根本任務之一就是任務調(diào)度:根據(jù)各資源節(jié)點的狀態(tài)、網(wǎng)絡通信性能等參數(shù),把不同的任務以合理的方式分配到相應的資源結(jié)點去完成。任務調(diào)度在操作系統(tǒng)等領(lǐng)域進行過很多研究,但由于分布式環(huán)境中資源的多樣性、自治性和動態(tài)性,使得分布式異構(gòu)環(huán)境下的任務調(diào)度比傳統(tǒng)環(huán)境下的調(diào)度要復雜得多。雖然隨著分布式數(shù)據(jù)交換集成技術(shù)的發(fā)展以及資源服務化,在某種程度上統(tǒng)一了資源的呈現(xiàn)方式,簡化了任務調(diào)度的接口,但分布式異構(gòu)環(huán)境中資源的自治性和動態(tài)性依然存在。而且,由于服務所依賴的協(xié)議層次較多,這反而增加了任務的響應時間,就使得在高延遲、高動態(tài)、高自治的分布式異構(gòu)環(huán)境下進行調(diào)度、提高分布式異構(gòu)數(shù)據(jù)庫的吞吐率成為一個困難問題。
異構(gòu)數(shù)據(jù)庫,通俗的說是物理上分散而邏輯上集中的數(shù)據(jù)庫,屬于分布式數(shù)據(jù)庫的一種。從數(shù)據(jù)管理的角度出發(fā)有兩種異構(gòu)形式,即平臺異構(gòu)和語義異構(gòu)。平臺異構(gòu)包括操作系統(tǒng)、DBMS、網(wǎng)絡等方面。語義異構(gòu)包括數(shù)據(jù)邏輯表示和數(shù)據(jù)庫互作兩方面,其中數(shù)據(jù)邏輯表示涉及到所使用的數(shù)據(jù)模型、數(shù)據(jù)模式、數(shù)據(jù)表結(jié)以及數(shù)據(jù)類型,按照節(jié)點數(shù)據(jù)庫采用的數(shù)據(jù)模型分類可以分為勻質(zhì)的和非勻質(zhì)的。如果各節(jié)點數(shù)據(jù)庫采用相同的數(shù)據(jù)模型,則稱該分布式數(shù)據(jù)庫是勻質(zhì)的,否則稱為非勻稱的。在勻質(zhì)系統(tǒng)中,如果各節(jié)點又采用相同的數(shù)據(jù)庫管理系統(tǒng),則稱為同構(gòu)的系統(tǒng),否則就稱為異構(gòu)式系統(tǒng)。本文所研究的異地異構(gòu)數(shù)據(jù)庫是基于DBMS分別是Oracle和SQLserver,所以更準確的來說應該稱之為勻質(zhì)的異地異構(gòu)關(guān)系型數(shù)據(jù)庫。
2,2數(shù)據(jù)同步
數(shù)據(jù)同步是將當前狀態(tài)的最終結(jié)果數(shù)據(jù)回傳至相關(guān)節(jié)點,并更新對應的數(shù)據(jù)以維護數(shù)據(jù)的一致性,忽略事務的執(zhí)行過程細節(jié)。同步的特征為:高級別的本地自治、數(shù)據(jù)的松散一致性、不保存事務的狀態(tài)、需沖突檢測和解決機制、支持異構(gòu)環(huán)境。
2,3異構(gòu)數(shù)據(jù)庫的互聯(lián)
同時異構(gòu)數(shù)據(jù)庫的互聯(lián)也是一個問題。異構(gòu)數(shù)據(jù)庫的互聯(lián)并不簡單,有許多因素都可以產(chǎn)生數(shù)據(jù)庫系統(tǒng)之間的差異性,如計算機硬件、操作系統(tǒng)、網(wǎng)絡通信和協(xié)議、DBMS及數(shù)據(jù)模型等。其中,源自數(shù)據(jù)庫系統(tǒng)自身的差異可以分為兩大類,即DBMS的差異和數(shù)據(jù)語義的差異。
(1)DBMS的差異
數(shù)據(jù)模型的不同是DBMS差異的一個重要方面。關(guān)系數(shù)據(jù)庫、層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫,以及新出現(xiàn)的面向?qū)ο髷?shù)據(jù)庫,所采用的數(shù)據(jù)模型各不相同,由此而導致數(shù)據(jù)結(jié)構(gòu)、約束和數(shù)據(jù)語言等差異。
(2)數(shù)據(jù)語義的差異
數(shù)據(jù)語義的差異主要源于不同數(shù)據(jù)庫對相同或相關(guān)數(shù)據(jù)的理解、解釋及使用的不一致性。譬如,在兩個數(shù)據(jù)庫中,對同一個屬性名的具體含義、定義不同或?qū)ν粚傩缘臄?shù)據(jù)值在兩個數(shù)據(jù)庫中的精度定義不同,都可能引起語義差異。
鑒于此方面的問題,需要用到ODBC技術(shù),ODBC即開放數(shù)據(jù)互聯(lián)(Open Database Connectivity)。目前所面對的是一個多廠商異構(gòu)數(shù)據(jù)庫的環(huán)境。異構(gòu)數(shù)據(jù)庫間互聯(lián),允許用戶任意使用第三方數(shù)據(jù)庫產(chǎn)品已經(jīng)成為越來越迫切的需求。ODBC是一種用來在相關(guān)或不相關(guān)的數(shù)據(jù)庫管理系統(tǒng)中存取數(shù)據(jù)的標準應用程序接口,ODBC為應用程序提供了一套高層調(diào)用接口規(guī)范和基于動態(tài)鏈22的運行支持環(huán)境。
2,4 XML語言在數(shù)據(jù)庫集成方面的應用
為了較好地解決校園應用系統(tǒng)間系統(tǒng)資源集成分布和異構(gòu)等問題,使得數(shù)據(jù)信息的交互變得更為透明,在數(shù)據(jù)庫集成方面還會用到XML,由于XML良好的可靠性與互操作性,確保了網(wǎng)絡中信息的傳輸與交互,加上XML是基于WEB工作設計的,更適于網(wǎng)絡化環(huán)境。因其標記可根據(jù)需求由企業(yè)自由定制,有極大的靈活性,可形成針對各行業(yè)特點的不同標記集。XML的結(jié)構(gòu)性、可擴展性、自描述性、簡單性等多種特性,使之表示數(shù)據(jù)的方式真正做到了獨立于應用系統(tǒng),不受任何特殊的軟件或者硬件平臺限制,并且這些數(shù)據(jù)能重復使用,簡單易懂,成為交換各種結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化信息的良好方式。此外,XML本身突出表現(xiàn)數(shù)據(jù)結(jié)構(gòu)和語義的特點,使其自然地與數(shù)據(jù)庫結(jié)合在一起。一旦將XML數(shù)據(jù)文件結(jié)構(gòu)與數(shù)據(jù)庫關(guān)系關(guān)聯(lián)起來,不但可以保留關(guān)系數(shù)據(jù)表的結(jié)構(gòu)信息,還可以利用XML文檔的優(yōu)勢在網(wǎng)絡及數(shù)據(jù)庫間交換數(shù)據(jù),并解決不同數(shù)據(jù)庫系統(tǒng)及數(shù)據(jù)關(guān)系、語義定義等數(shù)據(jù)表達方面的差異,如對應關(guān)系表中字段內(nèi)容不同、字段命名不同、數(shù)據(jù)類型不同等。
在數(shù)字化校園中有大量數(shù)據(jù)需要處理分析,把這些數(shù)據(jù)放到數(shù)據(jù)庫中。并將XML數(shù)據(jù)庫相聯(lián)系。日前許多數(shù)據(jù)庫技術(shù)。都支持事務,并發(fā)控制,查詢語言。安全機制,二次開發(fā)接口等,且內(nèi)部存儲模型是基于XML文檔樹形結(jié)構(gòu),而非關(guān)系模型。
在XML中間件解決方案中,無論是內(nèi)部的還是外界的數(shù)據(jù)交互請求均以XML形式遞交給中間件(分布式系統(tǒng)服務),由中間件實現(xiàn)與具體數(shù)據(jù)庫的交互,中間件對數(shù)據(jù)庫操作的結(jié)果仍然通過XML的形式反饋給請求者,而這一過程中的所有處理細節(jié)都被屏蔽了。
數(shù)據(jù)庫到XML的映射技術(shù)通過關(guān)系模式映射為XML模式、關(guān)系模式的提取和重構(gòu)、映射結(jié)構(gòu)、模式映射、數(shù)據(jù)嵌入、數(shù)據(jù)分割等技術(shù)來實現(xiàn)。
XML模式到關(guān)系模式的映射技術(shù)亦為數(shù)據(jù)轉(zhuǎn)換步驟,第一步是建立元素樹。第二步是映射轉(zhuǎn)化。映射轉(zhuǎn)化分首先,確定元素有向樹中哪些節(jié)點映射為表,哪些映射為表的列,根元素是數(shù)據(jù)庫的名稱,而其屬性是有關(guān)關(guān)系數(shù)據(jù)庫的一些描述。其次,將XML Schema中的簡單元素定義和屬性定義映射為列約束,包括數(shù)據(jù)類型映射和域值約束映射。最后,主關(guān)鍵字約束、引用關(guān)鍵字約束、唯一鍵約束的映射。主關(guān)鍵字約束、唯一鍵約束對應關(guān)系模式中的主鍵,引用關(guān)鍵字約束對應關(guān)系模式中的外鍵。第三步是生成sOL語句。第四步為XML文檔數(shù)據(jù)的錄入。解析XML數(shù)據(jù)文檔,根據(jù)Schema的映射結(jié)果,將數(shù)據(jù)合成SOL中的INSERT語句插入到數(shù)據(jù)庫中。至此XML模式已經(jīng)完整的轉(zhuǎn)化為關(guān)系模式,包括模式轉(zhuǎn)換和數(shù)據(jù)入庫兩部分。
3使用模型實現(xiàn)
如何在應用異構(gòu)數(shù)據(jù)庫系統(tǒng)間進行數(shù)據(jù)同步,是數(shù)字化校園中必須解決的關(guān)鍵問題。針對數(shù)據(jù)同步過程中存在的兩個主要問題:數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)傳輸問題。在模型的實現(xiàn)過程中要解決了以下的幾個問題:
(1)格式映射規(guī)則的定義。(2)異構(gòu)數(shù)據(jù)庫的支持。(3)數(shù)據(jù)傳輸?shù)撵`活性。(4)數(shù)據(jù)請求的自動響應。
4結(jié)束語
數(shù)字化校園中異構(gòu)數(shù)據(jù)源集成的首要任務就是為集成系統(tǒng)設計一個通用模型,對來自不同數(shù)據(jù)源的各種數(shù)據(jù)進行表示,從而便于進行統(tǒng)一處理;其次則應考慮數(shù)據(jù)的轉(zhuǎn)換問題,將來自不同數(shù)據(jù)源的各種數(shù)據(jù)轉(zhuǎn)換成集成系統(tǒng)能進一步處理的統(tǒng)一格式;另外還必須定義通用模型上的基本運算,完成數(shù)據(jù)提取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)傳輸、數(shù)據(jù)接收以及如何控制管理幾個具體過程。