謝守鳳
摘 要:多媒體數據庫在檔案管理中具有重要的作用,因此,要特別重視檔案多媒體數據庫建立中的主要工作,即數據的采集和存入數據庫方法。
關鍵詞:檔案;多媒體;數據庫
從目前學校檔案管理現狀看,還有大量有價值的檔案沒有轉變成電子形式。現在,信息傳媒日益發展,有文字、圖像、圖形、聲頻、視頻等等,如果把這些信息變成電子形式,組成一個功能齊全的數據庫系統,進行傳統的利用服務或者借助Web的傳輸機制提供即時的信息服務就相當方便了,這將給檔案事業帶來極大的社會效益和經濟效益。下面,就建立檔案多媒體數據庫談幾點拙見。
一、多媒體數據庫在檔案管理中的作用
多媒體技術的特征是集成性、交互性、控制性、實時性、直觀性、虛擬性,它已經廣泛運用在社會的各個角落。一個學校建校至今保存的檔案數量種類繁多,而且新的檔案還在不斷地產生。傳統的管理方式不僅雜瑣,而且利用率較低,如果沒有進行有效的管理,這些檔案不僅難以真正反映學校發展的歷史軌跡,也難以成為學校日常工作、學習的得力助手。但現在計算機多媒體技術的介入,使得我們建立大型檔案管理數據庫成為可能。
(1)多媒體數據庫有利于檔案存儲。檔案多媒體數據庫是以數字形式存儲檔案信息的,數字化的檔案信息容易進行存儲、顯示、編輯、打印等操作。雖然這種多媒體信息需要很大的空間來存放,但光盤、磁帶的海量存儲技術為多媒體檔案數據庫的發展提供了便利,幾張光盤就可裝下一個小型的檔案館變成可能。
(2)多媒體數據庫有利于檔案保護。檔案多媒體數據庫可以保護原件、修復破損件。數據庫建成后,大量的利用服務就可以轉移到計算機上進行了,調用原件的次數減少,它們的機械損害的機會也就相應減少。而在建庫的過程中,一些破損的傳統檔案也可以得到修復,如利用字跡恢復技術對模糊字跡進行恢復;電子檔案的編輯、數據恢復也更加方便。隨著光盤等存儲介質耐久性研究的進展,多媒體檔案的保護將越來越完善。
(3)多媒體數據庫有利于檔案檢索。多媒體技術的交互性和實時性,是提高檔案檢索水平的秘密。便捷的操作界面、簡易的輸入方式,使一般用戶檢索基本沒有什么障礙。除了人們習慣的傳統文字上的題名、責任者、主題詞等多個檢索入口外,有了多媒體技術的支撐,人們還可以把聲音、圖形、圖像、動畫等多種媒體形式作為檢索標志。目前,對多媒體信息的檢索方法有全文檢索法、特征描述法、模糊識別法、特征矢量法和超文本法等。檢索的效率大大提高,檔案人員的工作量也可大大減少。
(4)多媒體數據庫有利于檔案編研。有了海量的數據庫,檔案編研工作自然比從前簡單了。例如:制作檔案館指南,館藏檔案介紹等只需文字的剪剪貼貼、稍加潤色,再增加一些聲頻、視頻服務及實時的鏈接就基本完成。而以前耗時耗力的專題編研的資料收集工作,現在也只需輸入檢索詞,幾秒鐘內信息就鋪天蓋地而來,通過高級檢索,編研檔案信息的靈活度還是較高的。由于多媒體技術的集成性、交互性的特點,我們的編研成果集圖、文、聲、像為一體,人機交流方便快捷,其市場前景比傳統編研成果好得多。
(5)多媒體數據庫有利于檔案信息交流。用傳統的方法是很難實現館藏的規模傳遞的,多媒體數據庫是展示各檔案館館藏的大型倉庫,也使規模傳遞成為可能。如今,多媒體存儲技術的發展,光盤、磁帶的廣泛運用,使得檔案信息的傳遞與交流變得極為方便;再加上環球的網絡,就使多媒體檔案信息的遠距離資源共享也只需在鼠標的輕輕點擊中完成。
二、檔案多媒體數據庫的建立方法
檔案多媒體數據庫的建立需要學校檔案部門與數據庫建設技術人員的協同工作,他們的主要工作有兩方面:一是將多媒體檔案數據通過各種輸入設備,輸入到計算機中,進行數字化、壓縮處理,存儲在計算機存儲設備中。這就是數據的采集。二是將已存儲在計算機中的多媒體檔案數據存入數據庫中,以便數據庫管理系統的管理和訪問。
(1)檔案數據采集的方法。檔案數據的采集或者說數據準備是建立一個良好系統的基礎。因為目前學校檔案館的館藏量較大,因而在數據錄入之前,要根據利用者的需求對非電子檔案進行鑒定,確定出轉換與不轉換成電子形式的檔案及轉換先后的大致界限,對已經是電子形式的檔案也要簡單鑒定后再轉移到數據庫中。這樣,便于利用價值高的檔案盡早最大限度地提供利用。然后,才是數據的正式錄入、存儲和編輯的工作。數據的錄入、存儲與編輯分基本數據和原文兩部分,工作人員依據檔案鑒定人員提供的鑒定結果順序錄入與存儲。基本數據的錄入方式有:用選擇、聯想式的鍵盤錄入,這種方法速度較慢,但數據經過人工判斷,質量一般較高;用智能方式自動錄入責任者、標題、主題詞、發文字號、主題曲、主要圖表、主要圖像、主要影像及半自動方式錄入內容提要等基本信息。這些基本數據按檔案全宗原則,分類存儲在各個子數據庫中。對此,檔案多媒體數據庫要進行如下設計:基本數據的編輯分卡片編輯和快速編輯,通過提示給出條件,很快找到編輯點進行編輯,條件給定是在條件框圖中完成,它應當打破系統的條件給出必須是固定幾項的束縛,由編輯者給出條件并任意組合。為了防止表達式書寫錯誤,系統還應在表達式類型和關系符上都加入出錯處理,確保表達式書寫正確。原文錄入是通過掃描儀將非電子文件一頁頁錄入、壓縮,存儲。其編輯在掃描過程中或掃描后進行,一旦刻入光盤后就不能再編輯。
(2)檔案數據存入數據庫的方法。檔案多媒體信息存入數據庫的方法有兩種:基于文件的方法(File Based)和二進制域(BLOB:Binary Large Object,二進制大對象)的方法。基于文件的方法適用于大數據量的檔案,比如多媒體數據等,它將數據信息分成兩部分:數據的基本信息(比如文件位置、文件名等)以及檔案數據的具體內容。其中數據的基本信息存儲在數據庫中,具體檔案數據存儲在其他位置,例如:硬盤、光盤等。檢索數據時,根據數據庫中的數據基本信息得到數據文件的位置,從而獲取該檔案數據。這種方法容易實現,它減輕了數據庫的壓力,方便檔案信息的修改,但是我們需要額外的開銷來維護檔案數據文件。
二進制大對象方法是把檔案數據作為數據庫的一個字段存儲于數據庫中。這種技術將檔案數據當做數據庫的普通字段,操作該字段與其他一樣,這樣更利于我們的檢索讀取。但是,另一方面,這種技術將大數據存儲于數據庫中,增加了數據庫的開銷,數據庫延遲相對要大,而且不利于檔案數據的修改。
當前學校的檔案多媒體的存儲方法兩者皆有,它根據檔案的類別而采用相應的存儲方法。檔案多媒體數據庫和信息系統的開發,用的是基于二進制大對象方法的多媒體數據庫,這有利于檔案信息的建立以及統一管理;而在檔案的前期編研、對外提供多媒體信息共享時,對檔案的操作較多,但是要求的技術較低,適合采用基于文件的方法。
目前,學校檔案多媒體數據庫應用廣泛,但是在實施時仍然存在一些問題:如檔案多媒體數據庫的有關標準的制定,不同檔案多媒體數據庫之間的兼容性,以及檔案多媒體數據庫的備份、安全性等等。這些問題,影響著檔案多媒體數據庫的維護以及進一步推廣。
參考文獻:
[1]李勝娟,孫炳文.多媒體技術在科技檔案信息管理中的應用[J].情報學報,1998(6).
[2]盛春梅,王原.多媒體技術在檔案信息管理中的作用[J].浙江檔案,2000(7).
(莆田第五中學)