莫 雪
(新華通訊社廣西分社,廣西 南寧 530022)
多媒體數據是指多種媒體,如數字、正文、圖形、圖像和聲音的有機集成。其中數字、字符等是格式化數據,文本、圖形、圖像、聲音、視頻等是非格式化數據。多媒體數據的數據量十分龐大,各種數據之間的語義聯系非常復雜,表達形式多樣。
隨著多媒體技術及其支撐技術的飛速發展,多媒體應用領域越來越廣,所以,對多媒體信息進行快速高效的處理顯得非常迫切。由于多媒體數據種類繁多,傳統的數據庫難以對這些媒體信息進行處理和管理,因而,產生了一種全新的數據庫——多媒體數據庫。
多媒體數據庫(MMDB, Multimedia Database)是一個由若干多媒體對象所構成的集合,這些數據對象按一定的方式被組織在一起,可為其他應用所共享。
多媒體數據庫是能夠有效實現多媒體數據的存儲、讀取、檢索等功能的數據庫系統,它繼承了傳統數據庫的一些優點,并能對具有時空關系的數據進行同步和管理。
數據模型是數據庫系統的核心,從總體發展上看,多媒體數據庫的數據模型可分為如下3類:①關系數據模型;②面向對象數據模型;③擴充的關系數據模型。
關系數據模型以關系代數作為其理論基礎,發展至今已能夠非常完善的處理傳統的結構化數據。但是多媒體數據庫里包含了大量的圖形、圖像、聲音和視頻等非結構化數據,這些數據結構異常復雜,且大部分不能用關系模型表示。因此關系數據模型在處理這些數據時就難以適用了。
面向對象數據模型對非結構化數據進行表示和操作非常方便,但是其技術沒有關系數據模型那樣成熟,理論研究和應用開發中還有很多問題需要解決。并且需要從底層重寫代碼,開發工作量大、周期長,由于這些問題的局限,當前使用面向對象數據模型開發多媒體數據庫系統還主要應用在大公司指定開發的專用項目上,對于一般多媒體數據庫系統開發項目來說,應用面向對象數據庫模型來進行開發,從技術和經濟條件上來講都是不適用的。
使用擴充的關系數據模型來進行多媒體數據庫系統的開發是當前最常用也是最成熟的方法。在傳統的關系數據模型中引入了面向對象的思想、超文本(hypertex1)模型或超媒體方法,就解決了圖形、圖像、聲音和視頻等非結構化數據不能用關系模型表示的問題。
多媒體數據庫管理系統 MMDBMS(MultiMedia DataBase Management System)是一個以多媒體數據庫為基礎的多媒體應用。該應用能夠完成對多媒體數據庫的各種操作及管理功能,如對MMDB的定義、創建、查詢、訪問、刪除等。
針對多媒體應用的靈話性,人們希望MMBBMS能提供多種方式的“模糊”查詢手段,具體描述如下:
2.1.1 基于元數據的查詢
元數據在這里是指數據庫條目的外在屬性,比如作者姓名、創建時間以及標題等。在VOD(點播視頻)應用中,這種方式的查詢可以是:“請列出由×××在2007年出席的重要會議”這種類型的查詢可以用傳統的DBMS技術來實現。
2.1.2 基于注釋的查詢
注釋是指對數據庫條目內容的文字描述。查詢時一般給出關鍵字或一些自由文本,而檢索是基于查詢與內容注釋的相似性。這種方式的查詢實例是這樣的:“請放映一下東盟自由貿易區成立時的視頻片段。”這種類型的查詢要求事先對所有數據庫條目都恰當地進行注釋,然后用傳統的IR技術進行處理。視頻數據、腳本和字幕均可作為注釋。
2.1.3 基于特征的查詢
特征是指多媒體數據的統計信息,如音量、顏色分布及紋理等。這種方式的查詢實例可以是這樣:“請放映一個音量分貝在××至××的視頻幀。”其中××可以是某個給定的聲音分貝分布的直方圖。處理這類查詢,傳統的DBMS已無能為力了,數據庫條目的有關統計信息必須事先收集、整理并存儲。
2.1.4 用實例查詢
用多媒體數據對象來進行查詢,這個對象可以是一個靜止圖像、一張草圖或一個聲音片段。這種方式的查詢實例可以是這樣的:“請放映一段視頻,其中有類似×××的場景。”這種類型的查詢中如果包含有數據對象的空間和時間關系,處理時可能會非常復雜,要支持這么多種復雜的查詢方式,多媒體數據庫引擎需要有全新的體系結構。
根據上一節描述的MMDBMS所支持的查詢方式,本文給出圖1所示的MMDBMS體系結構。其中主要的組成都分有:
2.2.1 用戶圖形接口
MMDBMS的用戶接口可以通過Internet或圖形界面訪問。網頁登陸界面可以用Java applets來構造。這個用戶接口支持用戶用圖形方式進行基于內容的查詢,同時也支持傳統的文本方式的查詢。
2.2.2 索引子系統
索引子系統以多媒體數據及相關文本注釋作為輸入,通過數據分析子系統,提取低層多媒體特征信息(如顏色、紋理、形狀等),加上一些重要的文本描述信息(如作者姓名、類屬、主題等),并將這些內容存儲在特征數據庫中。
2.2.3 數據分析子系統
數據分析子系統的功能是提取重要的低層多媒體數據特征,如音量、顏色、紋理、形狀等。
2.2.4 特征數據庫
特征數據庫中的條目內容包括低層特征數據及高層的文字描述數據。
2.2.5 查詢處理器
查詢處理器從圖形用戶界面接受查詢語言,通過特征數據庫進行計算評估,然后向用戶返回匹配最好的多媒體數據。這里所指的查詢語言必須能利用低層特征數據及文字描述來表達復雜的查詢方式,傳統的SQL肯定不能勝任。
2.2.6 存儲子系統
存儲子系統完成對文本、視頻、音頻、圖像等數據庫數據的定義、創建、查詢、訪問、刪除等管理功能與操作。

圖1 MMDBMS的體系結構圖
我所在的工作單位——新華通訊社,作為國內最權威的新聞媒體單位、黨和人民的耳目喉舌和國家、世界性的通訊社,每天都擔負著采集、發布、管理各類多媒體新聞數據信息的重大任務。新華社采集的信息包含文字、圖片、聲音、視頻等多種媒體數據,涉及政治、外交、經濟、文教、科技、法律等各個領域,并具有信息量大、權威、準確、及時、豐富等特點。
新華社多媒體數據庫始建于1999年,采用TRS全文檢索的核心技術,2002年,TRS公司與新華社技術局再次合作實施了新華社多媒體數據庫英文檢索引擎的提速改造,提速后的系統對于多媒體數據庫的全文檢索能夠達到3 s~5 s左右響應。目前,多媒體數據庫中已經存儲了數千萬條多媒體信息,數據容量接近8 T,內容涵蓋中、英、法、西、阿、俄等九大主流語種,以文字信息為主,包含圖片、圖表和音視頻信息能,真正實現多媒體互動、數據準確、傳輸高效、檢索便捷。
新華社多媒體數據庫底層采用TRS和Oracle協同工作的解決方式,由TRS完成千萬級數據的索引檢索服務,由Oracle 完成信息制作流程,檢索方式分為本地聯機檢索和遠程網絡檢索兩種方式,可進行精確檢索、模糊檢索、全文檢索、對各檢索入口項實行任意聯合組配檢索;可實現多級檢索,逐級細化檢索條件,直至命中滿意的檢索結果;能夠對檢索結果排序;提供中英文全文檢索功能,中文按詞進行全文檢索,具有智能詞庫機制;對圖片可按分類號、作者、拍攝時間、拍攝地點、照片文字說明等項檢索,其中文字說明項可實現中文按詞全文檢索,支持邏輯庫功能,支持跨庫檢索,支持文字資料和圖片資料的系統鏈接。
新華社多媒體數據庫作為新華社核心存儲的地位也在不斷加強,從以前分散的存儲逐步向統一存儲、統一管理、統一服務方向發展。在這個過程中,新建設的其他應用系統中,TRS也積極的參與了廣泛的應用研究,并在很多系統中直接集成了TRS全文檢索的核心功能,以保證數據的檢索性能和統一數據的要求。
新華社的多媒體數據庫管理分內外兩個庫。“內庫”,即待編稿庫,與各分社的地方子庫連接,新華社所有記者采集的稿件、素材都要進入待編稿庫。我們從國內外搜集到的有價值的圖片資源、歷史資料、網上和外報外刊的新聞信息、音視頻資料等數據資源,也要分類、整理入庫,并以待編稿庫為依托建立起全社統一的采編平臺,使文字、圖片、圖表、音頻、視頻新聞信息可在同一界面上顯示、編輯、互動,供各編輯部和所有編輯選擇、編輯、加工和利用;“外庫”,即成品稿庫,新華社所有新聞信息產品都要進入成品稿庫,并以成品稿庫為依托建立起全社統一的營銷平臺,通過分社營銷平臺與用戶連接,供廣大用戶選擇、采用,成為新華社新聞信息產品營銷的總出口。記者采寫、搜集的新聞信息素材要源源不斷地進入待編稿庫,經過編輯部門的編輯、加工變成產品后源源不斷地進入成品稿庫,再經過營銷人員的工作將數據庫新聞信息產品源源不斷地進入市場,提供給用戶;同時,及時反饋用戶意見,采編人員再根據用戶意見不斷改進,提高多媒體數據庫各類新聞信息產品的質量。
1 馬新娜、樊金生.嵌入式實時數據庫系統的研究與設計[J].微計算機信息,2006(8):3~4
2 馮玉才.多媒體數據庫研究動態[J].計算機世界報,1997(3):12~13
3 鐘玉、蔡蓮紅.多媒體計算機基礎及應用[M].北京:高等教育出版社,1999
4 王森、肖健宇.MODB的對象數據模型[C].全國第五屆多媒體學術年會論文集,1996.9:1~5
5 王森、肖健宇.多媒體MIS對MDBMS的功能需求及OODBMS對多媒體MIS的支持[J].計算機工程與應用,1997.33(10):5l~54
6 張彬.與時俱進 實現新聞信息服務模式創新[J].新聞業務研究,2002(2):15~16