那旭東
(長春工業大學圖書館,吉林長春 130012)
隨著計算機技術、因特網的迅猛發展,人類知識信息資源的海量增加,數字化信息正以前所未有的速度不斷增加,人們獲取知識信息的方式也隨之發生了巨大變化,數字圖書館也就應運而生,并逐步由傳統圖書館向數字圖書館過渡轉變。
圖書館原來那種一成不變的管理方式已經適應不了以動態和開放為特征的新型方式,因此,整個圖書館的管理模式、工作環境、作業流程及服務手段都會隨之改變,圖書館通過搭建數字應用系統平臺,對數字信息資源進行采集、加工整理并提供服務,圖書館與讀者之間的供需關系變得更加密切,一切與知識資源相關的要素都將被有機地整合起來,形成一種面向需求、適應變化的圖書館知識管理機制。在這種不斷變化的新環境下,元數據作為一種有效的資源描述方法便會越來越顯示出它的重要性和實用性。
元數據是描述數據的數據[1],專門用來描述數據的內容、特征和屬性,并對數據進行管理,結構化的數據是數字圖書館信息組織的根本。具體概括起來,元數據對資源對象的作用主要有描述和管理兩個方面。
2.1.1 描述元數據
描述元數據用于描述或標識信息資源對象的內容、屬性和外觀特征,并對這個對象進行定位、管理,且有助于發現與獲取數據。由于描述元數據屬于應用范圍最廣、應用頻率最高的元數據類型,通常也可以把描述元數據直接稱為元數據。針對每一個具體的數字資源的元數據,也稱為元數據記錄。描述元數據是整個元數據體系中最主要的元數據,應用廣泛,可以根據不同的學科、主題、資源類型、用途等編制不同的描述元數據標準。
2.1.2 元數據元素項
一個元數據由許多完成不同功能的具體數據描述項構成,這些具體的數據描述項又稱元數據元素項或元素。如題名、責任者、日期、唯一標識符等都是元數據中的元素。
2.1.3 修飾詞
修飾詞是組成元素的最小術語單位。包括:
語義修飾詞:簡稱修飾詞,對元素的語義進行修飾,提高元素的專指性和精確性。
編碼體系修飾詞:用來幫助某個術語值的上下文信息或解析規則。其形式包括受控詞表、規范表或者解析規則。
2.1.4 描述元數據規范
描述元數據規范也可以稱元數據規范、元數據標準,是描述某類資源的具體對象時所有規則的集合。一般包括完整描述一個具體對象時所需要的數據項集合,以及數據項的語義定義、著錄規則和計算機應用時的語法規則。
2.1.5 元數據規范設計指南
元數據規范設計指南是設計制定某類特定資源所用的元數據規范需要遵照的規則和方法。元數據規范設計指南是抽象化的元數據,它從更高層次上規定了元數據的功能、結構、格式、設計方法、擴展規則、語義語法規則、元數據規范的結構格式等多方面的內容,以保證各種元數據規范的一致性和整體性,在更大范圍內實現數字圖書館之間的互操作和數據共享。
元數據的結構主要指內容結構、語法結構和語義結構。
內容結構是指元數據的元素、修飾詞及其屬性、定義,其中可包含用于描述的通用的核心元素,用于描述某一類型資源的資源類型核心元素,用于描述某個具體對象的個別元素,以及揭示對象標識、版權等內容的管理性元素。
語法結構是指元數據的格式結構及其描述方式。例如用于文本編碼的內容元數據TEI就包含了4個部分:頭標、正文前內容、正文、正文后附錄。目前,主要是采用XML語言和RDF框架用于標識和描述元數據的這種格式結構。
語義結構主要是指元數據的元素及其修飾詞的定義方法。在這方面可以借鑒采用ISO/IEC11179標準,按以下10個方面定義:
名稱(Name):元素名稱;
標識(Identifier):元素唯一標識;
版本(Version):產生該元素的元數據版本;
注冊機構(Registration Authority):注冊元素的授權機構;
語言(Language):元素說明語言;
定義(Definition):對元素概念與內涵的說明;
選項(Obligation):說明元素是限定必須使用的還是可選擇的(必備性);
數據類型(Data type):元素值中所表現的數據類型;
最大使用頻率(Maximum Occurrence):元素的最大使用頻次(可重復性);
注釋(Comment):元素應用注釋,用于說明子元素情況[2]。
數字圖書館是將圖像、文字、聲音等信息數字化,并通過網絡傳輸,從而使信息資源能夠全球共享[3]。簡單地說,數字圖書館就是以數字形式存儲和處理信息的圖書館[4]。對數字資源的組織和管理是數字圖書館建設的重點,元數據作為提供信息資源或數據的一種結構化的編碼數據,是其進行的基礎[5]。
數字圖書館無論在哪個環境和層面上,都與元數據密不可分,或者說元數據在數字圖書館中時刻都存在和發揮著作用。
在數字資源產生、制作、管理、發布、保存的過程中,元數據在各個環節上發揮著作用。
3.1.1 元數據對數字對象的描述
即對具體對象的內容和外觀特征進行格式化揭示和描述。例如一本數字化圖書的篇名、作者、出版者、大小等,以便于用戶的發現和尋找。
3.1.2 元數據對數字對象的管理
即對數字對象進行管理的相關信息的格式化揭示和描述,包括在檢索、存取與顯示一個數字對象時所需的管理信息,如對象的標識符;數字的權限管理如版權信息;文件的格式、大小、壓縮算法等特征;文件的上下文相關信息;在資源數字化或顯示、利用時的軟硬件環境信息等。
3.1.3 元數據對數字對象之間結構的描述
一般來講,數字對象很少是一個實體的,通常來說是個復合對象。例如一篇數字格式的學位論文,有Word格式、PDF格式,PDF格式又分為供免費使用的文件以及必須經過許可才能使用的全文文件,這樣一篇學位論文就對應了3個實體對象,因此,需要對這些對象之間的關系和結構進行格式化揭示、描述和組織。
3.1.4 元數據對數字對象保存的描述
當資源需要存儲和長期保存時,就要對其制作信息、保護條件、轉換方式、遷移方法、仿真環境、封裝方法、保存責任以及其它相關技術細節進行描述和揭示。
在用戶使用數字圖書館的過程中,元數據的主要作用是在門戶網站和應用系統中支持對信息的檢索和發現。在這個過程中,元數據可以發揮如下的作用。
3.2.1 提供準確和快速的檢索
由于有了元數據,可以通過字段檢索快速準確地得到檢索結果,而不是“全文檢索”后又要在大量的檢索結果中大海撈針一般尋找自己所需的信息。所謂字段檢索,即指定檢索詞出現的字段,是指在元數據中被標引過的,例如作者、文摘、主題詞、篇名、刊名、書名、出版者、出版年、圖像格式等。
3.2.2 提供知識導航功能
在數字圖書館門戶網站上為用戶建立基于某一知識體系的資源導航服務,即由系統從元數據的某一特定字段中抽取相關內容,并提供一個樹狀結構的概念等級體系,用戶可以沿著這棵“樹”進入不同的分支,到達葉子節點,并在節點看到資源結果列表。
3.2.3 提供資源索引功能
資源索引功能是指將元數據中某一字段中的概念按字母順序線性排列起來,不分等級。用戶通過檢索可以定位在索引中的任意某個位置,并瀏覽在這個位置附近的所有詞語,進而查詢所需詞語對應的結果列表。
3.2.4 在報道和揭示服務中的作用
元數據也可以對服務過程、服務項目等進行揭示和報道。例如,一個大學數字圖書館門戶網站的服務內容元數據就包括:統一認證、書目檢索、統一檢索、學科導航、資源類型導航、全文獲取服務、咨詢服務、用戶培訓、在線幫助、個性化定制、動態消息、網站介紹、網站索引、站內檢索、相關鏈接等。這個門戶元數據既是設計數字圖書館門戶時使用的元數據,也向用戶全面科學地揭示了數字圖書館的相關服務。
下面是用都柏林(Dublin Core)元數據對一篇網頁進行描述的實例。

3.2.5 在數字資源開放存取的作用
所謂“開放存取”是針對傳統的基于訂閱的出版模式而言的,即是指由作者直接在線出版論文,在互聯網公共領域里可以被免費獲取,允許用戶閱讀、下載、拷貝、傳遞、打印、檢索、超級鏈接,并為此建立索引或者用于其它任何合法用途[6]。它是基于互聯網的一種新型學術交流方式和出版模式[7],也是一種行之有效的學術出版模式,這其中包括正式發表論文的后印本,正式出版的著作、教材、會議論文集與研究報告等學術成果,非正式出版的論文的預印本、學位論文、工作論文、各種原始數據和元數據、教學參考資料、照片、圖表、地圖以及數據庫、政府出版物、網站等。
元數據揭示的是數字對象的內容、特征和屬性,那么在元數據加工制作的過程中,就必須遵循相關的規則和格式,這些規則和格式的集合就是元數據規則。
隨著各種元數據標準的出現,元數據的互操作性問題也就逐漸顯現出來。元數據的互操作性的好壞直接影響了各種不同信息資源的檢索、共享和互相兼容性。元數據的互操作主要是通過語義互操作和結構與語法的互操作來實現的[8]。例如,以Dublin Core的15個核心元素為基礎,使不同元數據中相似相近的元數據元素相互映射,從而實現了語義上的互操作。又比如資源描述框架RDF的制定為元數據在互聯網的應用提供了一個基礎結構,使不同元數據間可以互相操作,可擴展標記語言XML,又為元數據在語法上提供了互通性,用RDF/XML創建元數據格式時,借用其它元數據集的一些元素,增加了元數據間語義的互通性,很容易就實現了互操作。
由于元數據規范的應用,保持了元數據結構的一致性,為信息的有效組織、元數據之間的互操作、元數據的廣泛應用和共享奠定了基礎,使數字圖書館的可持續發展成為可能。
數字圖書館作為信息時代的產物正處在篷勃發展的階段,而元數據是數字圖書館許多關鍵技術的基礎,有了這個基礎,數字圖書館的信息管理才能更趨合理化和科學化,資源的利用率也會大大提高。
[1] 王英芬.元數據模式組織網絡信息資源研究[J].農業圖書情報學刊,2009(11):50-52.
[2] 肖瓏,趙亮.中文元數據概念與實例[M].北京:北京圖書館出版社,2007.
[3] 龔永紅.DC元數據及其在數字圖書館建設中的應用[J].科技情報開發與經濟,2010,20(31):78-80.
[4] 夏立新,黃曉斌.數字圖書館導論[M].北京:科學出版社,2009.
[5] 盧笑明,唐琳,李學鳴.元數據與圖書館數字資源組織管理[J].農業網絡信息,2010(12):70-71.
[6] 陳紅星,張淑芳.網絡原生數字資源:概念特征與類型[J].圖書館學刊,2010(5):1-4.
[7] 關萍,吳立東.開放獲取運動在高校圖書館的發展策略[J].黑龍江科技信息,2010(35):188-189.
[8] 吳開華,邢春曉,羅德胤.數字圖書館元數據研究[J].中國圖書館學報,2002(3):43-46.