李磊 山東省青島第二衛生學校,山東省 膠州市 266300
多媒體數據庫技術綜述
李磊 山東省青島第二衛生學校,山東省 膠州市 266300
隨著多媒體技術的發展和廣泛應用,多媒體數據越來越多地被引入到數據庫中,從而形成了多媒體數據庫。由于多媒體數據具有數據量大、內容復雜、非結構化的特點,如何對這些數據進行有效的管理和利用,是多媒體數據庫要解決的主要問題。本文在介紹多媒體數據給數據庫管理帶來的問題的基礎上,綜述了多媒體數據庫及其關鍵技術。
多媒體數據;多媒體數據庫;關鍵技術
隨著多媒體技術和網絡技術的迅速發展以及社會信息化程度的不斷提高,承載信息的媒體也逐步表現出多樣化、數字化、交互化和集成性等特點,如圖形、圖像、音頻、視頻、動畫等被稱為多媒體數據的載體。
多媒體數據庫是與傳統數據庫不同的數據庫,它是為了實現對多媒體數據的存儲、檢索和管理而出現的一種新型的數據庫技術。在多媒體數據庫中,媒體可以進行追加和變更,并能實現媒體的相互轉換,用戶在對數據庫的操作中,可最大限度的忽略媒體間的差別,實現多媒體數據庫的媒體獨立性。
簡單的說,多媒體數據庫是按一定方式組織在一起的可以共享的相關多媒體數據的集合,簡稱MDB(Multimedia Database)。與傳統數據庫應用中的主流數據庫系統——關系模型數據庫相比,多媒體數據庫中的數據是非格式化的、不規則的且數據量大,沒有統一的取值范圍,沒有相同的數量級,也沒有相似的屬性集。
在傳統的數據庫中引入多媒體數據并對其操作,是一個極大的挑戰。這不是一個只要把多媒體數據加入到數據庫中就可以完成的問題。由于多媒體數據具有不同于傳統數據的一些特點,這樣給數據庫的管理就帶來了許多問題,主要有以下幾個方面:
2.1 多媒體數據量大且媒體之間的差異也極大,從而影響數據庫的組織和存儲方法
一幅彩色圖像,即使在壓縮的情況下,也需要幾K甚至幾十K或幾百K字節的數據量,而字符型數值等數據可能僅有幾個字節的數據量。只有組織好多媒體數據庫中的數據,選擇設計好合適的物理結構和邏輯結構,才能保證磁盤的充分利用和應用的快速存取。
2.2 數據非格式化
多媒體數據基本上都是二進制形式,數據本身沒有嚴格的數據結構,即為非格式化數據或非結構化數據。必須另外加入一些描述和解釋,否則難以利用。這種描述和解釋不是數據本身,而是關于數據的數據,即元數據。元數據的生成是多媒體數據庫管理中的一個重要而突出的問題。
2.3 媒體種類的增多增加了數據處理的困難。
每一種多媒體數據類型都要有自己的一組最基本的概念(操作和功能)、適當的數據結構和存取方法、以及高性能的實現。但除此之外也要有一些標準的操作,包括各種多媒體數據通用的操作及多種新類型數據的集成。不同媒體類型對應不同數據處理方法,這便要求多媒體數據庫管理系統能不斷擴充新的媒體類型及其相應的操作方法。
2.4 不同的查詢機制和方法
傳統的數據庫查詢只處理精確概念和查詢,相對簡單且易于實現。但在多媒體數據庫中非精確匹配和相似性查詢將占相當大的比重。媒體的復合、分散、時序性質及其形象化的特點,注定要使數據庫不再是只通過字符進行查詢,而必須要采用特征匹配和模糊匹配的查詢機制和方法。
多媒體數據庫具有傳統數據庫所不具有的特性和結構以及要實現的功能要求,因此,多媒體數據庫包含了許多不同于傳統數據庫的新技術,其中主要技術有多媒體數據建模技術、多媒體數據存儲管理技術、多媒體數據的壓縮/還原技術和多媒體數據查詢技術,其關鍵內容是多媒體數據建模技術。
3.1 數據建模
數據模型(Data Model)是數據庫管理系統中用于提供信息數據表示和操作手段的形式構架,數據模型通常由數據結構、數據操作、和完整性約束三部分組成。
多媒體數據要比傳統數據復雜的多,因此在選擇數據模型時必須考慮這些特性。多媒體數據模型要支持非結構化數據(如視頻、聲音)的表示及其屬性特征的描述;支持多媒體的表現建模,即多媒體數據模型應能表示各種媒體對象間的語義關系、時態關系和空間關系。多媒體數據模型主要采用關系數據模型的擴充、面向對象的數據模型和超媒體數據模型。
3.2 數據存儲管理技術
多媒體數據存儲管理技術是指根據多媒體數據的使用頻率和速度等要求,將數據采用分級存儲的方案。由于多媒體數據量非常龐大,考慮到系統的性能價格比,往往可以將少數極常用的數據存于RAM 中,常用的數據存于硬盤,而光盤和磁帶庫則作為二、三級庫。大對象一般是分頁面進行管理的。多媒體對象的存儲關鍵問題是能夠快速定位,對超媒體文檔和超媒體數據記錄進行隨機存取。目前比較流行的存取方法是B+樹和Hash方法。為滿足視頻等連續媒體的時域約束需要,還應設法提高磁盤的讀寫速度,減少讀寫的延時及抖動。
3.3 數據的壓縮與還原技術
多媒體數據壓縮與還原技術是指數據壓縮比、壓縮/解壓縮速度以及簡捷的算法。以壓縮/解壓縮后的數據是否與壓縮前的原始數據完全一致作為標準,可以把數據壓縮方法劃分為無失真壓縮(可逆壓縮)和失真壓縮(不可逆壓縮)兩類。多媒體信息的數據量要遠遠大于傳統媒體,例如:一幅1024×768 ×24位色的圖像需要2.4M字節存儲,相當于一本一百萬字的小說的存儲容量。因此在計算機中,結構化數據如文字、數值是編碼后進行存放,非結構化數據如圖形、圖像、視頻和音頻也必須進行壓縮存儲。比如要實現視頻數據的管理,首先必須解決的問題就是壓縮編碼和解碼,目前MPEG、AVI、H.261以及Quick Time等壓縮標準的壓縮比例可以達到50:1~200:1。由于多媒體數據的壓縮,在對它們進行編輯時,數據的長度會引起變化,這不僅會給數據重新存入帶來問題,還會引起媒體間的不同步,故還應采取適當的方式,對被編輯的媒體進行局部的重編碼,以保持原來的大小。
3.4 數據查詢技術
多媒體查詢技術(MSQL)是指多媒體數據庫采用結構化查詢語言的技術。MSQL是一個功能強大的查詢語言,它有助于用戶高效操縱多媒體數據庫,實現數據庫與應用程序間的相互獨立,并且對于用戶是友好的。多媒體數據庫查詢語言不僅能用關鍵字進行檢索,還可以處理基于內容的非精確查詢或模糊查詢。
多媒體數據庫是一門非常綜合的技術,它幾乎涵蓋了計算機及電子領域的所有學科。隨著社會信息化程度的提高和相關技術的發展,多媒體數據庫技術對社會生產、生活的影響也越來越大。現在,無論是數字圖書館、數據倉庫、數據挖掘、科學可視化、電子商務、遠程教育、醫療、媒體服務等學科都能找到多媒體數據庫直接或潛在的應用價值。因此,無論從研究價值還是應用前景上看,多媒體數據庫技術的研究都處于信息科學和技術發展前沿,并將在研究的挑戰性、活躍性及應用的廣泛性方面起著舉足輕重的領導作用。
[1] 胡曉峰,吳玲達等.多媒體技術教程.北京:人民郵電出版社,2002
[2] 黃志軍,曾斌.多媒體數據庫技術.北京:國防工業出版社,2005
[3] 鐘玉琢,沈洪等.多媒體技術及其應用.北京:機械工業出版社,2003
[4] 段英風,楊春華.多媒體數據庫及應用.青海氣象,2005年第2期
[5] 孫凌,高大利.有關多媒體數據庫的技術研究.福建電腦,2003年第12期
[6] 李澤建,許亮.淺析多媒體數據庫技術的發展和展望,昆明理工大學學報.2002年第2期
[7] 王桂東.多媒體數據庫技術的研究.濰坊學院學報,2002年第4期
[8] 李逸波.多媒體數據庫技術.北京:機械工業出版社,2004
10.3969/j.issn.1001-8972.2011.17.038