摘 要:元數據在網絡信息組織和檢索方面具有重要作用,目前元數據在世界范圍內的應用越來越廣。本文介紹了元數據的基本情況,探討了元數據在數字圖書館中的運用。
關鍵詞:元數據;數字圖書館;數字化資源
1 元數據的概念及特點
元數據的英文名稱為Metadata。迄今為止對于元數據人們并沒有完全統一的定義,最常規的定義為:元數據就是關于數據的數據(data about data)。在哈佛大學數字圖書館項目里,其定義為:元數據是幫助查找、存取、使用和管理信息資源的信息。在這個定義里,元數據既適合于電子資源,又適合于非電子資源;不僅包括編目信息,也包括其他管理和存取資源的信息。國際圖聯IFLA的定義為:“元數據就是關于數據的數據,即指任何用于幫助網絡電子資源的識別、描述和定位的數據。”
元數據具有三個特征:(1)元數據是一種編碼體系,它能根據某種標準來對文獻中的詞及其他元素進行編碼,從而揭示、描述文獻的這些基本元素。(2)元數據不僅可以描述數字化信息的內容特征,而且可以描述數字化信息的基本屬性,使得數字化信息得以被有效傳播、交流和利用。(3)元數據為數字化信息資源建立了一種機器可理解的框架。
2 類型與格式
隨著WWW的不斷發展,網絡信息資源呈不斷增多的趨勢。但隨之而來的問題是,人們在海量的信息環境中,信息的查找和檢索變得越來越困難。在數字圖書館系統中,常用的元數據有五種類型:①管理型元數據是用來管理與支配信息資源的元數據,如信息收集、版權與翻版跟蹤、排架信息等;②描述型元數據是用來描述與識別信息資源的元數據,如記錄編目、尋找幫助、專題等;③保存型元數據是與信息資源保存管理有關的元數據,如資源的物質條件、數字資源的保存行為);④技術型元數據是與系統怎樣運行有關的元數據,如硬件與軟件,數字化信息的格式等;⑤使用型元數據是與信息資源用戶層次和類型有關的元數據,如用戶記錄、用戶使用跟蹤等。
網上數字資源比較常用的元數據格式有:①藝術作品描述類目。主要應用于藝術作品、珍善本和其它三維作品。②建筑文獻基礎/建筑圖樣咨詢組格式。作為描述建筑圖樣類目的指南,能為描述與訪問建筑文獻信息提供指標。③美國視覺資料協會核心類目。主要用來描述網絡環境下的藝術、建筑、手工藝等藝術類視覺資料。④藝術與文化遺產數據輸出格式。用于文化藝術類作品及珍善本等的著錄。⑤美國機讀目錄格式USMARC格式是目前適用于書目記錄數據系統最完善、類 目最復雜、標準最嚴密的元數據格式。⑥都柏林核心數據(Dublin Core)。Dublin Core是國際組織Dublin Core Meta Data Initiative擬定的用于標識電子資源的一種簡要目錄模式,目的是為改善萬維網資源的索引與檢索而提供的基本信息或者說元數據。
對于一個元數據格式來說,它由多層次的結構組成,具體如下:(1)內容結構,對該元數據的構成元素及其定義標準進行描述。(2)句法結構,定義結構以及如何描述這種結構。(3)語義結構,定義元素的具體描述方法。
3 元數據作用
元數據是數字信息資源組織的重要工具,它在數字信息資源組織方面的作用主要體現在以下幾個方面:(1)描述作用。它最基本的功能就在于對信息對象和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎。(2)描述作用。元數據包含有關網絡信息資源位置方面的信息,由此便可確定資源的位置之所在 ,促進了網絡環境中信息對象的發展和檢索。(3)發現作用。在著錄的過程中,將信息對象中的重要信息抽出并加以組織,賦予語意,并建立關系,使檢索結果更加準確,從而有利于用戶識別資源的價值,發現其真正需要 的資源。(4)評估作用。元數據提供有關信息對象的名稱、內容、年代、等基本屬性,使用戶在無需瀏覽信息對象本身的情況下,就能夠基本了解和認識信息對象,參照有關標準即可對其價值進行必要的評估,作為存取與利用的參考。(5)選擇作用。根據元數據所提供的描述信息,參照相應的評估標準,結合使用環境,用戶便能夠做出對信息對象取舍的決定,選擇適合用戶使用的資源。
4 元數據在數字圖書館中的應用
由于傳統的圖書館目錄信息與Dublin Core元數據集有對應性,故圖書館的目錄模式可以向Dublin Core靠攏。圖書館較長時間以來采用MARC格式交換書目數據,MARC格式僅僅用于圖書館系統間的數據交換,MARC格式不能取代系統的內部格式,這些異構系統要想在網絡環境下實現互聯,還必須采用Z39.50,而且,MARC的有關字段是可以自動轉為Dublin Core 元數據的。
元數據在數字圖書館中的應用主要表現在以下幾個方面:(1)對信息資源進行組織與檢索。要有效利用數字圖書館的數字收藏,必須對其進行著錄與標引,得到提示其內外部特征的元數據,科學地將其組織起來,以便用戶快速、準確地找到所需信息。(2)作為設計與維護數據庫的工具。在進行數字圖書館的數據庫設計時,設計人員須查看每個可能成為數據來源的系統的物理結構、邏輯模型和業務規則等,這個進程就是元數據的搜集進程。(3)作為用戶使用數字圖書館的向導。通過公布描述數據庫的元數據,可使用戶無需瀏覽信息對象本身,就能對信息對象有基本了解和認識,從而作為取舍的標準。
[參考文獻]
[1]郭兆紅,王歡,呂精巧.DC元數據在數字圖書館中的應用分析[J].農業圖書情報學刊.2009(09).
[2]盧笑明,唐琳,李學鳴.元數據與圖書館數字資源組織管理[J].農業網絡信息.2010(12).
[3]門建華.元數據在數字圖書館中有效利用關鍵技術分析[J].現代情報.2008(11).