王杰
摘 要:隨著數字信息資源的不斷發展和和極大豐富,為數字圖書館建設提供了堅實的基礎,相關標準與規范研究是數字資源建設不可回避的問題。本文介紹和分析了數字資源系統服務與數字資源長期保護的標準、規范,希望有助于建立適應我國數字圖書館建設所需要的標準規范描述體系。
關鍵詞:數字資源;數字圖書館;標準;規范
1 數字資源系統服務的標準規范
任何數字資源的價值都體現在它對用戶的服務。但是與資源組織的規范描述類似,服務也長期被視為本地化間題而沒有成為標準規范的目標。隨著網絡化的發展,信息服務本身已打破本地局限,它的技術因素和管理機制成為制約其實際開展和被有效利用的關鍵因素之一。人們開始利用標準規范來約束數字資源系統的服務機制,以保障系統服務在網絡空間的可使用性和系統之間的互操作性。
1.1 系統服務的標準規范層次
數字信息系統服務涉及多個層次,粗略地可分為:接人條件,即用戶要接人系統所必須具備的技術條件;數據傳輸條件,即用戶要與系統交換數據內容所必須具備的技術條件;數據檢索條件,即用戶要對系統數據內容進行檢索所必須具備的條件;數據應用條件,即用戶要利用系統提供的數據內容所必須具備的技術與管理條件。
1.2 接人條件和傳輸條件的標準規范
①用戶服務接人條件的基本規范屬于W3C Web Accessibility Initiative的范圍,WAI提出和提供了一系列的建議和參考規范,例如Content Accessibility Guidelines和User Agent Ac-cessibility Requirements等,以保障用戶能方便地獲取系統服務。根據WAI的建議,許多描述體系提出了接人條件的具體標準,例如NOF要求所有資源都應通過支持HTTP協議和HT-語言的通用Web瀏覽器來讀取,而且應能采用WAI建議的方式來保障殘疾人的使用(例如提供純文本版)。如果系統服務需要使用其他通信協議,系統應提供Web瀏覽器(實際上是HTTP協議)與這些協議的接口。如果系統服務要用到額外的插件,系統應保證沒有這些插件的用戶仍然能使用相應的服務(作為補救措施,系統可提供獲取相應插件的鏈接或登記服務系統)。
②數據傳輸條件主要涉及:所傳輸的數據內容是否能用標準語言和格式封裝,封裝后的數據文件是否通過標準網絡協議傳輸,所傳輸的數據文件是否能被通用瀏覽器解讀。描述體系多要求文本數據內容采取HTMI,XHTML,XML方式封裝,其他內容數據采用標準格式
(例如TIFF,JPEG,MPEG,WAV等),封裝后的數據文件采用HTTP或FTP等標準協議傳遞。
實際上,圖書館界也在開發基于XML和HTTP協議的元數據交換機制,例如LC的METS o
1.3 關于檢索條件的標準規范
檢索是數字圖書館服務的基本形式,也是制約數字圖書館系統互操作的主要因素。目前,多數描述體系除了要求提供基于HTTP/HTML的檢索機制外,沒有進一步規定更為詳細的檢索機制。但是,HTTP/HTML檢索機制在支持異構系統的豐富檢索功能和分布系統的集成檢索方面受到較大制約,所以多種分布環境下異構系統檢索機制不斷被提出來,有些甚至在相當大范圍內得到應用。
Z39.50是面向圖書館著錄數據檢索的公共標準,長期以來在圖書館自動化建設中發揮了重要作用。但由于Z39. 50協議的復雜性,多數系統在具體應用它時都選擇采用了其中部分功能、檢索式格式、檢索參數和語義定義等,從而使采用不同Z39.50功能和參數的系統仍然不能互操作。為避免這種情況,一些圖書館聯合起來建立Z39. 50應用協議,具體規定這些圖書館在使用Z39. 50協議時必須遵守的具體功能、格式、參數和語義定義,例如Bath Pro-file和One Profile等。另一方面,由于Z39.50屬于專用的M2M(Machine To Machine)協議,不能方便地嵌人Web環境尤其是用戶 Web瀏覽器,所以在數字圖書館建設中并沒有成為主流。考慮到這種限制,ZIG開始探索適應開放環境的Z39. 50檢索技術,包括基于XML的.50編碼方式XER和基于HTTP的ZNG機制。許多分布檢索體系還采用或實驗了其他機制,例如X500/LDAP, WHOIS++以及SDLIP和STARTS等和CrossROADS,IMESH等跨網關檢索系統。
從2000年起,OAI作為一種開放檢索機制開始得到廣泛重視和應用。它的淵源可追溯到NCSTRAL及其Dienst協議和Handle命名體系,最后以OAMHP協議來具體實現。它要求數字資源系統能夠用DC元數據描述數字對象(或將本地元數據轉換為DC元數據),并提供這些元數據的開放搜尋。目前NSDL通過OAMHP來建立它的核心集成系統,通過由此生成的元數據庫來支持對多個數字資源系統的檢索。歐洲各國也開始研究和推動OAI機制的應用。
1.4 關于數據應用條件的標準規范
數據應用條件主要涉及用戶系統能否方便有效地使用所檢索的數據內容,這可以通過采用標準數據格式在一定程度上解決。但是許多數據內容(例如GIS數據、計算數據、統計數據、虛擬現實數據等)由于產生方式、內容構成、用途和管理要求等方面的原因,往往要求有必要的軟件模塊(可表現為瀏覽器插件)來進行處理。為了支持通用用戶系統(例如通用瀏覽器)對這類數據內容的方便處理,有關系統正探索多種方式,包括建立共享插件登記系統和在元數據中描述所需系統軟件及其鏈接信息,使得用戶可以在調用使用數據對象時可調用相應的處理軟件。不過,作為數字圖書館領域整體,目前對此還沒有成熟的解決方案。反之,WK等機構正探索用XML開放標記語言來描述這些復雜的數據內容,例如SVG,SMIL,SSML見(Speech Synthesis Markup Language) ,VRML(Vir-tual Reality Modeling Language)等,支持基于XML的用戶系統對各種復雜數據內容的處理。
1.5 分布數字對象機制的標準規范
面對開放和分布的數字信息服務環境,數字圖書館界一直在探索基于分布對象機制的數字圖書館體系,將各種數字資源系統或服務系統視為一個數字對象,建立標準的界面定義機制,對它們的界面、功能、數據流、傳輸協議等進行規范描述,然后通過開放的搜尋和調用機制來實現對分布、異構和變化的數字信息系統的發現、調用和配置。最初的努力傾向于建立在CORBA,J2EE,DCOM等方式上,但現在的趨勢正走向Web Services方式,利用XML對數字信息系統進行規范描述,利用登記系統實現這些描述信息的公共登記和開放搜尋,通過開放協議支持基于規范描述的信息系統調用、配置和利用。正在建立的這方面的標準規范包括WSDL,WSFL,UDDI等。數字圖書館界已經提出“開放數字圖書館”的概念,可以通過機制來更靈活地實現各種數字信息系統的方便和智能的互操作,保障各種系統在整個網絡空間的可使用性。
2 數字資源長期保護的標準規范
數字信息長期保護涉及保存數字比特流、信息格式、信息處理環境、信息內容驗證管理機制、信息組織機制等相關內容和機制等一系列任務。圖書館界及檔案、博物等領域已開始提出一系列框架和規范,重要成果包括:
2.1 美國RLG提出了數字資源長期保護的問題框架,比較全面地對存在問題、研究方向、可能技術和管理措施等進行了描述,并建立了長期保存責任框架。
2.2 美國空間數據系統咨詢委員會提出了開放檔案信息系統參考模型(OAIS ),已被普遍接受為數字信息長期保存系統基本構架,并已作為ISO標準草案。該模型提供了一個功能框架和一個信息框架,前者包括攝取模塊、長期存儲模塊、數據管理模塊、檢索傳遞模塊和系統管理模塊,后者包括通過攝取模塊獲得的存交信息單元(SIP)、經過處理后用以存儲的存儲信息單元(AIP)、檢索時提交的傳遞信息單元(DIP)。該模型已在眾多圖書館的數字信息保存項目中得到應用。
2.3 美國RLG/OCLC聯合提出了可信賴數字存儲庫的屬性要求,界定了符合OAIS要求的數字信息長期保存系統應該具備的基本條件和責任體系。
2.4 許多研究或試驗項目提出了專門支持數字信息長期保護的元數據格式,例如CE-DARS,PANDORA/NLA,NEDLIB格式,RLG/OCLC也根據OAIS模型和這些格式提出了由內容信息、保護描述信息和封裝信息組成的長期保護元數據結構,并已提出了自己的內容信息元數據的建議。
各國數字圖書館建設、尤其是大范圍合作項目,都在項目啟動初期致力于建立數字信息資源建設的標準規范描述體系,指導、協調和約束參與項目建設的各個單元對標準規范的選擇和采用。我們也應參照這一成功經驗,在對我國的實際標準規范應用環境和制定程序進行分析的基礎上,建立適應我國數字圖書館建設所需要的標準規范描述體系。
參考文獻
[1] 齊洋,湯珊紅.國內外數字圖書館標準規范建設研究[J].情報理論與實踐,2010(12)
[2] 郝曉蔚,沈玉蘭.國內外數字圖書館標準規范建設情況概述[J].情報探索,2007(8)
[3] 林忠娜,葛丹陽.我國數字圖書館標準規范的構建[J].圖書館界,2014(5)