摘要:本文收集了有關數據庫技術發展趨勢與方向的文獻。并對這些文獻進行整理,討論了數據庫發展的主流及趨勢問題。
關鍵詞:數據庫技術;發展;現狀;趨勢;數據倉庫
中圖分類號:TP312文獻標識碼:A文章編號:1009-3044(2008)05-1pppp-0c
1 引言
處于“互聯經濟”的今天,無論是個人、群體還是企業都必須通過互聯才能相互影響,才能謀求發展或尋找機遇。也許Internet能將企業、客戶、合作伙伴以及潛在的業務往來者以最優的方式連接起來,但怎樣才能在它們之間提供滿意的信息獲取與提交方式,其中,數據庫技術將扮演重要的角色。
2 數據庫技術發展的現狀— 關系數據庫技術仍然是主流
2.1 目前國內外發展現狀
在數據庫技術的當前及未來發展里程中,數據倉庫以及基于此技術的商業智能無疑將是大勢所趨。IBM的實驗室在這方面進行了10多年的研究,并將研究成果發展成為商用產品。除了用于OLAP(聯機分析處理)的后臺服務器DB20LAP Server外,IBM還提供了一系列相關的產品,包括前端工具,形成一整套解決方案。其它數據庫廠商在數據倉庫領域也毫不示弱方法各有不同。Informix也是類似,在其動態服務器IDS(Informix Dynamic Server)中提供一系列相關選件,如高級決策支持選件AdvancedDecision Support Option,OLAP選件擴展并行選件Extended Parallel Option等,并認為這種體系結構嚴謹,管理方便,索引機制完善,并行處理的效率更高,其中數據倉庫和數據庫查詢的SQL語句的一致使用戶開發更加簡便;而微軟則是在其SQIServer7.0中集成了代號為Plato柏拉圖)的OLAP服務器,與上述公司不同的是,Sybase提供了專門的0LAP服務器SybaselQ,并將與數據倉庫相關工具打包成Warehouse Studio.
從中國的數據庫市場來看,大部分數據庫系統的建立是用來進行傳統的OLTP業務。也有一些企業建立了數據倉庫系統,但真正發揮效用的卻不多見。和TCP/IP,SMTP,Java等相比,尚不存在可靠的、完善的、被廣泛接受的數據倉庫標準,影響了數據倉庫項目的實施。
2.2 關系數據庫技術仍然是主流
關系數據庫技術出現在20世紀70年代,經過80年代的發展到90年代已經比較成熟,在90年代初期曾一度受到面向對象數據庫的巨大挑戰,但是市場最后還是選擇了關系數據庫。無論是《ORACLE 公司的Oracle 9i、IBM公司的DB2,還是微軟的SQL Server等都是關系型數據庫。Gartner Dataquest的報告顯示關系數據庫管理系統(RDBMS)的市場份額最大,2000年RDBMS的市場份額占整個數據庫市場的80%,這個比例比1999年增長了15%。這組數據充分說明RDBMS仍然是當今最為流行的數據庫軟件。
3 數據庫技術發展的趨勢
3.1 下一代數據庫技術的發展主流— 面向對象的數據序技術與關系數據序技術針對關系數據庫技術現有的局限性,理論界現在主要有三種觀點:
(1)面向對象的數據庫技術將成為下一代數據庫技術發展的主流。
(2)將面向對象的數據庫技術引入關系數據庫中— 面向對象的關系數據庫技術。
(3)演繹面向對象數據庫技術。
3.2 數據庫技術發展的新方向——非結構化數據庫。
非結構化數據庫是部分研究者針對關系數據庫模型過于簡單,不便表達復雜的嵌套需要以及支持數據類型有限等局限,從數據模型人手而提出的全面基于因特網應用的新型數據庫理論。他們認為這種數據庫的最大區別就在于它突破了關系數據庫結構定義不易改變和數據定長的限制,支持重復字段、子字段以及變長字段并實現了對變長數據和重復字段進行處理和數據項的變長存儲管理,在處理連續信息(包括全文信息)和非結構信息(重復數據和變長數據)中有著傳統關系型數據庫所無法比擬的優勢。但研究者認為此種數據庫技術并不會完全取代現在流行的關系數據庫,而是它們的有益的補充。
3.3 數據庫技術發展的又一趨勢— 數據庫技術與多學科技術的有機結合
有學者指出:數據庫與學科技術的結合將會建立一系列新數據庫,如分布式數據庫、并行數據庫、知識庫、多媒體數據庫等、這將是數據庫技術重要的發展方向。其中,許多研究者都對多媒體數據庫作為研究的重點,并認為多媒體技術和可視化技術引人多媒體數據庫將是未來數據庫技術發展的熱點和難點。
3.4 未來數據庫技術及市場發展的兩大方向—數據倉序和電子商務
部分學者在對各個數據庫廠商的發展方向和應用需求的不斷擴展的現狀進行分析的基礎上,提出數據庫技術及市場在向數據倉庫和電子商務兩個方向不斷發展的觀點。他們指出:從去年開始,許多行業如電信、金融、稅務等逐步認識到數據倉庫技術對于企業宏觀發展所帶來的巨大經濟效益,紛紛建立起數據倉庫系統。在我國提供大型數據倉庫解決方案的廠商主要有。Oracle, IBM, Sybase, CA及Informix等廠商,巳經建設成功并已收回投資的項目主要有招商銀行系統和國信證券系統等。目前,國內外學者對數據倉庫的研究正在繼續深人。與此同時,一些學者將數據庫技術及市場發展的視角瞄準電子商務領域,他們認為:現在的信息系統逐漸要求按照以客戶為中心的方式建立應用框架,因此勢必要求數據庫應用更加廣泛地接觸客戶,而Internet給了我們一個非常便捷的連接途徑,通過Internet我們可以實現所謂的。One-One Marketing和。One-One business,進而實現e-busines.因此,電子商務將成為未來數據庫技術發展的另一方向。
3.5 數據庫技術的實踐性發展— 面向專門應用領域的數據庫技術
許多研究者從實踐的角度對數據庫技術進行研究,提出了適合應用領域的數據庫技術,如工程數據庫、統計數據庫、科學數據庫、空間數據庫、地理數據庫等。這類數據庫在原理上也沒有多大的變化,但是它們卻與一定的應用相結合,從而加強了系統對有關應用的支摔能力,尤其表現在數據模型、語言、查詢方面。部分研究者認為,隨著研究工作的繼續深人和數據庫技術在實踐工作中的應用,數據庫技術將會更多朝著專門應用領域發展。
4 當代與未來數據庫研究的熱點一數據挖掘、知識發現與數據倉庫
隨著計算機網絡技術及Internet應用的日趨普及,勢必要求數據庫系統的應用平臺向Web平臺遷移,最終達到全球數據信息共享的目的,如何實現數據庫平臺與Web平臺的無縫對接即對Web數據庫技術的研究已成為近期研究的熱點.國內外學者對數據倉庫技術以及與之相關的數據挖掘和知識發現進行了大量的研究和論述。從數據庫中發現知識(KDD)(即知識發現)的核心技術就是數據挖掘(DM)。數據挖掘是目前發展極為迅速的一個研究領域,它綜合了機器學習、統計分析和數據庫技術,是為數據庫中數據的決策型使用服務的。如何擴充數據庫系統的功能,使之包括數據挖掘能力,是當前數據庫界的一個熱點,具體說來,就是研究簡單的查詢原語和新一代查詢優化技術。實際上,數據倉庫技術所要研究和解決的問題就是從OLAP系統、異構分散的外部數據源、脫機的歷史業務數據中獲取數據,處理后為數據分析和管理決策提供應用服務。部分研究者認為要推動數據倉庫技術的發展就需要將數據挖掘和數據倉庫協同起來工作。他們認為:一方面,數據倉庫技術可以迎合和簡化數據挖掘過程中的重要步驟,提高數據挖掘的效率和能力,確保數據挖掘中數據來源的廣泛性和完整性。另一方面,數據挖掘技術已經成為數據倉庫應用中極為重要和相對獨立的方面和工具。目前,國內對數據倉庫、數據挖掘等數據庫技術的研究正在緊鑼密鼓地進行,該技術的發展無疑將會推動新一輪的數據庫技術的發展。
5 數據庫發展前景與展望
5.1 智能化
計算機科學主要目標是使計算機與人的界面盡量靠近人這邊。因此,要盡量提高計算機的智能水平。智能化是計算機科學各個分支的研究前沿。在數據庫方面,智能化的工作是將人工智能技術與數據庫技術相結合,即演繹數據庫知識庫研究。目前的主要困難在于遞歸查詢處理無法取得滿意的性能,硬件技術的革命(大內存、并行機、高速存取的外存儲器)將是提高知識庫查詢效率的重要因素。
5.2 多媒體
多媒體數據處理的困難很多,即使是一般的復雜對象目前也還不能很好地處理。多媒體數據的建模、存儲和多媒體數據庫的查詢及查詢處理等都是需要我們研究解決的內容。
5.3 網絡化
信息分布方面主要是分布式數據庫系統的研究。分布式數據庫從20世紀70年代開始研究,但是一直沒有出現商品化的分布式數據庫系統,這說明了它的難度。當前比較好的具有數據分布特征的數據庫管理系統是Client/Server體系結構的系統(如:SYBASE,ORACLE7等)。但新的計算機應用又對它提出了新的要求,智能化、新型事務模型、多媒體數據的處理、高速信息通訊、數據源的高度透明性等將是新型的分布式數據庫系統的重要研究內容。
5.4 與軟件工程的結合
到目前為止,數據庫設計與應用程序設計是分離的,并且在具體的應用系統開發中,往往由2個小組各行其事。其后果是一方面的優良設計不得不放棄,導致系統性能低下或用戶要求無法滿足。面向對象技術是二者結合的有效手段。但是,良好地結合還需要很長時間的努力。處理的數據越來越龐大、計算機網絡越來越復雜、系統的智能水平越來越高是計算機系統發展的總趨勢。因此,未來的信息管理系統的特征將是處理復雜對象、分布、智能。在復雜對象處理方面,面向對象數據庫、多媒體數據庫將會由于廣泛的應用背景和強大系統實驗而迅速發展。在數據分布方面,客戶/服務器數據庫系統將快速發展,并在應用上取得良好效果。在智能化方面,數據庫和人工智能將在各自的領域不斷發展、不斷取得新的成果。二者結合方面的研究將不斷地利用二者的成果研制出新型的系統。任何時候兩方面的結合都是必要的。
6 結論
從對有關數據庫技術發展文獻的調研和綜述可以看出:目前,國內外大部分研究者對數據庫技術集中于以下幾方面當前數據庫技術發展的主流問題;未來數據庫技術的發展主流問題;數據庫技術與學科技術結合發展的問題;數據庫技術在專業應用領域中的發展向題;數據庫技術發展的新趨勢問題;數據倉庫技術與數據挖掘技術。我們從信息集成、數據流管理、傳感器數據庫技術、半結構化數據與XML數據管理、網格數據管理、DBMS自適應管理、移動數據管理、微小型數據庫、數據庫用戶界面等方面分別討論目前數據庫領域研究方向的發展現狀、面臨的問題和未來趨勢。
在眾多新技術應用中,對數據庫研究最具影響力,推動數據庫研究進入新紀元的無疑將是Internet的發展。Internet中的數據管理問題從深度和廣度兩方面對數據庫技術都提出了挑戰。從深度上講,在Internet環境中,一些數據管理的基本假設不再成立,數據庫研究者需要重新考慮在新情況下對傳統技術的改進。從廣度上講,新問題的出現需要我們開拓思路,尋求創新性的技術突破。
參考文獻:
[1]王珊,薩師煊.數據庫系統概論(第4版)[M].高等教育出版社,2006.5.
[2]黃義弘,黃文鈺.數據庫系統原理與設計[M].清華大學出版社,2005.5.
[3]楊繼業,楊偉,董彥芳,等.數據庫發展綜述[J].山西氣象,2002,第2期(總第59期).
[4]向海華,數據庫技術發展綜述[J].現代情報,2003年12月第12期.
[5]聶哲,數據庫發展新技術[J].Computer Era 2002第12期.
[6]周宇葵,杜方冬.數據庫發展之現狀[J].現代圖書情報技術,2000年第5期.
[7]李新安.數據庫技術發展前景展望[J].山東電力高等專科學校學報,第8卷(2005).
收稿日期:2008-01-02
作者簡介:殷云霞(1981-),女,安徽中醫學院醫藥信息工程學院,助教,合肥工業大學碩士研究生,研究方向:計算機應用。