徐海東
隨著計算機應用領域的不斷拓展和多媒體技術的發展,數據庫已是計算機科學技術中發展最快、應用最廣泛的重要分支之一,數據庫技術的研究也取得了重大突破,他已成為計算機信息系統和計算機應用系統的重要的技術基礎和支柱。
由于用戶應用需求的提高、硬件技術的發展和Internet/Intranet提供的豐富多彩的多媒體交流方式,促進了數據庫技術與網絡通信技術、人工智能技術、面向對象程序設計技術、并行計算技術等相互滲透,互相結合,成為當前數據庫技術發展的主要特征,形成了數據庫新技術。
面向對象的方法和技術對數據庫發展的影響最為深遠,起源于程序設計語言,把面向對象的相關概念與程序設計技術相結合,是一種認識事物和世界的方法論,他以客觀世界中一種穩定的客觀存在實體對象為基本元素,并以“類”和“繼承”來表達事物間具有的共性和他們之間存在的內在關系。
面向對象數據庫系統將數據作為能自動重新得到和共享的對象存儲,包含在對象中的是完成每一項數據庫事務處理指令,這些對象可能包含不同類型的數據,包括傳統的數據和處理過程,也包括聲音、圖形和視頻信號,對象可以共享和重用。面向對象的數據庫系統的這些特性通過重用和建立新的多媒體應用能力使軟件開發變得容易,這些應用可以將不同類型的數據結合起來。面向對象數據庫系統的好處是支持WWW應用能力。
然而,面向對象的數據庫是一項相對較新的技術,尚缺乏理論支持,他可能在處理大量包含很多事務的數據方面比關系數據庫系統慢得多,但人們已經開發了混合關系對象數據庫,這種數據庫將關系數據庫管理系統處理事務的能力與面向對象數據庫系統處理復雜關系與新型數據的能力結合起來。
分布式數據庫系統是分布式技術與數據庫技術的結合,在數據庫研究領域中已有多年的歷史和出現過一批支持分布數據管理的系統,如SDD1系統、DINGRES系統和 POREL系統等。
從概念上講,分布式數據庫是物理上分散在計算機網絡各結點上,而邏輯上屬于同一個系統的數據集合。他具有數據的分布性和數據庫間的協調性兩大特點。系統強調結點的自治性而不強調系統的集中控制,且系統應保持數據的分布透明性,使應用程序編寫時可完全不考慮數據的分布情況。
無疑分布式是計算機應用的發展方向,也是數據庫技術應用的實際需求,其技術基礎除計算機硬、軟件技術支持外,計算機通信與網絡技術當然是其最重要的基礎。但分布式系統結構、分布式數據庫由于其實現技術上的問題,當前并沒有完全達到預期的目標,而客戶/服務器(Client/Server,C/S)體系結構卻正在風行,廣義的理解,C/S也是一種分布式結構,按照C/S結構,一個數據處理任務至少是分布在2個不同的部件上完成。
C/S結構把任務分為2部分,一部分是由前端(Frontend,即Client)運行應用程序,提供用戶接口,而另一部分是由后端(Backend,即Server)提供特定服務,包括數據庫或文件服務、通信服務等??蛻魴C通過遠程調用或直接請求應用程序提供服務,服務器執行所要求的功能后,將結果返回客戶機,客戶機和服務器通過網絡來實現協同工作。C/S結構具有性能優越、保護投資、易于擴展和保證數據完整性等優點。
當前,C/S技術日臻完善,客戶機與服務器允許有多種選擇,這樣計算機系統就可以實現橫向集成,即將來自不同廠家的、不同領域內的最好的產品集成在一起,組成一個性能價格比最優的系統。當前已有多種數據庫產品支持C/S結構,其中Sybase是較典型的代表。
知識數據庫系統的功能是如何把由大量的事實、規則、概念組成的知識存儲起來,進行管理,并向用戶提供方便快速的檢索、查詢手段。因此,知識數據庫可定義為:知識、經驗、規則和事實的集合。知識數據庫系統應具備對知識的表示方法;對知識系統化的組織管理;知識庫的操作;庫的查詢與檢索;知識的獲取與學習;知識的編輯;庫的管理等功能。知識數據庫是人工智能技術與數據庫技術的結合。
模糊性是客觀世界的一個重要屬性,傳統的數據庫系統描述和處理的是精確的或確定的客觀事物,但不能描述和處理模糊性和不完全性等概念,這是一個很大的不足,為此,開展模糊數據庫理論和實現技術的研究,其目標是能夠存儲以各種形式表示的模糊數據,數據結構和數據聯系、數據上的運算和操作、對數據的約束(包括完整性和安全性)、用戶使用的數據庫窗口用戶視圖、數據的一致性和無冗余性的定義等都是模糊的,精確數據可以看成是模糊數據的特例;模糊數據庫系統是模糊技術與數據庫技術的結合,由于理論和實現技術上的困難,模糊數據庫技術近年來發展不是很理想,但他已在模式識別、過程控制、案情偵破、醫療診斷、工程設計、營養咨詢、公共服務以及專家系統等領域得到較好的應用,顯示了廣闊的應用前景。
工程數據庫是一種能存儲和管理各種工程圖形,并能為工程設計提供各種服務的數據庫。它適用于CAD/CAM、計算機集成制造(CIM)等通稱為CAX的工程應用領域。工程數據庫針對工程應用領域的需求,對工程對象進行處理,并提供相應的管理功能及良好的設計環境。
工程數據庫管理系統是用于支持工程數據庫的數據庫管理系統主要應具有以下功能:(1)支持復雜多樣的工程數據的存儲和集成管理;(2)支持復雜對象(如圖形數據)的表示和處理;(3)支持變長結構數據實體的處理;(4)支持多種工程應用程序;(5) 支持模式的動態修改和擴展;(6)支持設計過程中多個不同數據庫版本的存儲和管理;(7)支持工程長事務和嵌套事務的處理和恢復;
在工程數據庫的設計過程中,由于傳統的數據模型難于滿足CAX應用對數據模型的要求,需要運用當前數據庫研究中的一些新的模型技術,如擴展的關系模型、語義模型、面向對象的數據模型。
統計數據是人類對現實社會各行各業、科技教育、國情國力的大量調查數據。采用數據庫技術實現對統計數據的管理,對于充分發揮統計信息的作用具有決定性的意義。統計數據庫是一種用來對統計數據進行存貯、統計(如求數據的平均值、最大值、最小值、總和等等)、分析的數據庫系統。多維性是統計數據的第一個特點,也是最基本的特點。其次,統計數據是在一定時間(年度、月度、季度)期末產生大量數據,故入庫時總是定時的大批量加載。經過各種條件下的查詢以及一定的加工處理,通常又要輸出一系列結果報表。這就是統計數據的“大進大出”特點。 統計數據的時間屬性是一個最基本的屬性,任何統計量都離不開時間因素,而且經常需要研究時間序列值,所以統計數據又有時間向量性;第四,隨著用戶對所關心問題的觀察角度不同,統計數據查詢出來后常有轉置的要求。
對于廣大的數據庫用戶來講,主要有兩方面的要求:(1)希望得到自己所需要的數據或信息;(2)能夠方便地接受和使用這些數據或信息。前一類要求應通過工程的硬、軟件環境支持和高質量的數據庫設計來達到;后一類要求則應為用戶提供良好的用戶界面和完善的應用支持來達到。但值得注意的是,任何數據庫系統的建設,其最根本的問題還是對應用領域中基礎數據的識別與組織,如果做不到這一點,是很難做出讓用戶滿意和認可的數據庫系統的。因此,數據庫系統建設中的數據規劃、面向應用領域的全面數據分析和全面數據庫設計,將是系統建設中的頭等大事。
[1]張小平,馬垣,于淼.數據倉庫在高校教務系統的應用研究[J].鞍山師范學院學報,2003.
[2]高居泰,左映華,李晉宏.OLAP與數據挖掘一體化的研究與應用[J].北方工業大學學報,2005.
[3]吳少敏,馮建生.寶鋼數據挖掘系統[J].寶鋼技術,2001.