摘 要:主要探討了數(shù)字圖書館的體系結(jié)構(gòu)與數(shù)字圖書館信息組織的主要模式,并分析了各個(gè)模式的特點(diǎn)。
關(guān)鍵詞:數(shù)字圖書館;結(jié)構(gòu);模式;體系結(jié)構(gòu)
中圖分類號:TP271+.82文獻(xiàn)標(biāo)識碼:A文章編號:1672-3198(2008)01-0267-02
1 數(shù)字圖書館的基本概念
關(guān)于數(shù)字圖書館的定義, 目前而言,還是仁者見仁,知者見者,說法不一。但大多數(shù)研究者認(rèn)為, 數(shù)字圖書館并不是空間意義上的“館”, 而是一種擁有多媒體內(nèi)容的信息資源, 它的存在方式是將文字、圖像、聲音等信息數(shù)字化, 并通過互聯(lián)網(wǎng)向用戶方便快捷地提供信息知識的服務(wù)技術(shù)。數(shù)字圖書館與傳統(tǒng)圖書館的最大不同就在于: 它變用戶的集中為信息服務(wù)的集成。對于不同的使用對象來說, 數(shù)字圖書館表現(xiàn)出不同的特征和功能, 因而對數(shù)字圖書館的理解自然就各不相同。所以, 數(shù)字圖書館的共有特征可以概括為:收藏?cái)?shù)字化;操作計(jì)算機(jī)化;傳遞網(wǎng)絡(luò)化;信息資源存取自由化;信息資源共享化; 結(jié)構(gòu)連結(jié)化?;诖耍?我們可以把數(shù)字圖書館簡述為: 對有高度價(jià)值的文本、圖像、語音、音響、影像、影視、軟件和科學(xué)數(shù)據(jù)等多媒體信息進(jìn)行收集, 進(jìn)行規(guī)范性的整理加工, 進(jìn)行高質(zhì)量的保存和管理,實(shí)現(xiàn)知識增值, 并提供在廣域網(wǎng)上高速橫向跨庫連接的電子存取服務(wù)系統(tǒng)。
2 數(shù)字圖書館的體系結(jié)構(gòu)
體系結(jié)構(gòu)是數(shù)字圖書館建設(shè)的關(guān)鍵, 它關(guān)系到系統(tǒng)的信息組織(即數(shù)字對象的存儲) 和檢索方式。影響數(shù)字圖書館體系結(jié)構(gòu)的因素有很多, 包括社會與法律環(huán)境、通訊基礎(chǔ)設(shè)施和網(wǎng)絡(luò)技術(shù)、軟件工程、硬軟件環(huán)境、系統(tǒng)安全、訪問權(quán)限、數(shù)字對象類型和數(shù)量等方面。美國數(shù)字圖書館研究的重要成果之一是提出了建設(shè)數(shù)字圖書館的八項(xiàng)原則, 并得到了學(xué)術(shù)界的普遍認(rèn)同。這八項(xiàng)原則是:
(1)數(shù)字圖書館的技術(shù)框架存在于法律和社會的框架之內(nèi)。
由于社會網(wǎng)絡(luò)進(jìn)程的不斷加快, 數(shù)字圖書館將存在于一個(gè)廣泛的經(jīng)濟(jì)、社會和法律框架內(nèi)。這就意味著:法律體系必須根據(jù)迅速變化的經(jīng)濟(jì)和社會框架制定新的法律,包括知識產(chǎn)權(quán)、通訊法、國際法等; 數(shù)字圖書館的體系結(jié)構(gòu)必須能夠保護(hù)著者和所有者的權(quán)利, 考慮所涉及的經(jīng)濟(jì)、社會和法律問題。
(2)數(shù)字圖書館概念的統(tǒng)一理解。
數(shù)字圖書館中的對象稱為數(shù)字對象(Digital Object),它們存儲在倉儲(Repository), 用句柄(Handle) 來標(biāo)識。存儲在數(shù)字對象中的信息稱為內(nèi)容(Content), 內(nèi)容被分為數(shù)據(jù)(Data), 關(guān)于數(shù)據(jù)的信息稱為屬性( Property) 或元數(shù)據(jù)(Metadata)。作為基礎(chǔ)的體系結(jié)構(gòu)應(yīng)和保存在數(shù)字圖書館中的信息相分離數(shù)字圖書館中的內(nèi)容是多種多樣的, 可以是文本、圖片、動畫、音頻資料、計(jì)算機(jī)程序、模型設(shè)計(jì)或多種類型構(gòu)成的復(fù)合資料。存儲在數(shù)字圖書館中的這些信息內(nèi)容往往和數(shù)字圖書館的體系結(jié)構(gòu)相分離。適合于各種資料類型的特征是由體系結(jié)構(gòu)規(guī)定的。這種特征通常包括適用于某類資料的特定的格式、協(xié)議和權(quán)限管理等。
(3)名字和標(biāo)識符是數(shù)字圖書館的基本建構(gòu)塊。
名字用于標(biāo)識數(shù)字對象, 登記數(shù)字對象中的知識產(chǎn)權(quán), 記錄所有權(quán)的變化, 在引用、檢索和對象鏈接中不可缺少。名字是唯一的, 長期保持。句柄系統(tǒng)用于標(biāo)識數(shù)字對象。用于標(biāo)識用的字符串稱為標(biāo)識符。
(4)數(shù)字圖書館不僅僅是二進(jìn)制數(shù)位的集合在數(shù)字圖書館中信息存儲為數(shù)字對象, 不能簡單地把數(shù)字對象看成是二進(jìn)制數(shù)位的集合。數(shù)字對象可由兩部分構(gòu)成: 內(nèi)容和元數(shù)據(jù)。一個(gè)數(shù)字對象可含有多種類型的內(nèi)容如文字、圖像、聲頻等。復(fù)雜的數(shù)據(jù)類型可由簡單類型構(gòu)成。元數(shù)據(jù)包括句柄、權(quán)限、訪問方式、數(shù)字簽名、交易日志等。(5)數(shù)字圖書館對象使用時(shí)和存儲時(shí)的形態(tài)可能完全不一樣。
數(shù)字對象在使用時(shí)的形態(tài)和存儲形態(tài)可能完全不同。例如, 圖像可以小波形態(tài)存儲, 使用時(shí)利用小波生成圖像。音樂作品可以曲譜的形式直接傳送給用戶, 也可在倉儲中用合成器演奏后將聲頻信號傳給用戶。數(shù)字圖書館的體系結(jié)構(gòu)必須仔細(xì)區(qū)分生成的原始數(shù)字對象、存儲在倉儲中的數(shù)字對象和提交用戶的數(shù)字圖像。
(6)倉儲應(yīng)保管好所存儲的信息。
數(shù)字對象包含有價(jià)值的知識產(chǎn)權(quán), 倉儲中的數(shù)字對象含有是否允許其在特定的經(jīng)濟(jì)和社會框架中被存儲的信息。倉儲必須妥善管理, 提供參考引用、安全控制等措施, 以確保對數(shù)字對象的操作的合法性。用戶通過倉儲訪問協(xié)議與倉儲交互, 以屏蔽倉儲的內(nèi)部結(jié)構(gòu)和數(shù)字對象的存儲形式。
(7)用戶需要的是供人利用的知識作品, 而非供機(jī)器處理的數(shù)字對象數(shù)字對象是數(shù)字圖書館的基本元素, 但用戶需要的往往是更為抽象的數(shù)據(jù)項(xiàng)。
3 數(shù)字圖書館的主要模式
目前, 圖書館用來處理數(shù)字存取的主要模式是以網(wǎng)絡(luò)為中心的用戶機(jī)P服務(wù)器(CPS) 模式和由此而演化來的Web 為中心的瀏覽器PWeb 服務(wù)器P數(shù)據(jù)庫(BPSPD) 模式,后者也稱為Web 模式。世界上已運(yùn)行的數(shù)字圖書館系統(tǒng)大多采用這兩種模式。用戶機(jī)P服務(wù)器模式通過消息傳遞機(jī)制對話, 由用戶機(jī)向服務(wù)器提出請求, 服務(wù)器進(jìn)行相應(yīng)處理計(jì)算后將結(jié)果傳遞回用戶機(jī)。在此種模式中, 服務(wù)器往往只負(fù)責(zé)數(shù)據(jù)庫的管理和查詢, 因此客戶機(jī)任務(wù)比較繁重, 須配備大量的軟件, 尤其是較多的客戶機(jī)軟件和應(yīng)用程序。在這種結(jié)構(gòu)中, 傳統(tǒng)的服務(wù)器被分成兩部分, 即Web 服務(wù)器和數(shù)據(jù)庫服務(wù)器。Web 服務(wù)器負(fù)責(zé)Web 頁面的管理、組織、傳遞和數(shù)據(jù)庫查詢請求的提出, 而數(shù)據(jù)庫服務(wù)器則負(fù)責(zé)接受Web 服務(wù)器的查詢請求并提供運(yùn)算處理結(jié)果。因此,在這種模式中, 客戶機(jī)的任務(wù)比較輕松, 只要配備操作系統(tǒng)、網(wǎng)絡(luò)協(xié)議和瀏覽器等軟件即可。瀏覽器的作用只是從Web 服務(wù)器下載Web 頁面。Web 模式在資源配置、系統(tǒng)安全等方面比簡單的客戶機(jī)P服務(wù)器模式要好得多。Web 模式的系統(tǒng)結(jié)構(gòu)如圖1 所示。
國內(nèi)外已被圖書館采用了的IBM 數(shù)字圖書館系統(tǒng)就是在瀏覽器PWeb 服務(wù)器P數(shù)據(jù)庫模式的基礎(chǔ)上實(shí)現(xiàn)的。其系統(tǒng)基本框架如圖2 所示。
在這種系統(tǒng)中, 圖書館服務(wù)器管理圖書館的索引信息, 負(fù)責(zé)執(zhí)行查詢及將用戶的請求轉(zhuǎn)交給相應(yīng)的對象服務(wù)器, 對象服務(wù)器管理數(shù)字對象, 用戶通過網(wǎng)絡(luò)訪問服務(wù)器。用戶、圖書館服務(wù)器和對象服務(wù)器構(gòu)成系統(tǒng)信息傳遞的三角形框架。用戶登錄圖書館服務(wù)器, 并進(jìn)行查詢, 圖書館服務(wù)器將客戶的請求轉(zhuǎn)交給相應(yīng)的對象服務(wù)器, 對象服務(wù)器則將查詢到的信息直接傳送給用戶, 這樣就實(shí)現(xiàn)了數(shù)字對象的發(fā)布。在IBM數(shù)字圖書館的三角形構(gòu)架中, 用戶只能訪問圖書館服務(wù)器, 這保證了存儲在對象服務(wù)器中的數(shù)據(jù)的安全性。圖像、聲音和動畫等數(shù)字對象的數(shù)據(jù)量比較大, 數(shù)據(jù)量大的數(shù)據(jù)對象及頻繁使用的數(shù)字對象可以放在接近用戶的地方, 這樣可以減少數(shù)字對象復(fù)制和傳達(dá)的次數(shù), 減少網(wǎng)絡(luò)的數(shù)據(jù)傳遞量, 提高系統(tǒng)的性能。
加快我國數(shù)字圖書館的建設(shè)是互聯(lián)網(wǎng)上中文知識信息的基礎(chǔ)建設(shè), 它將迅速扭轉(zhuǎn)互聯(lián)網(wǎng)上中文知識信息匱乏的狀況, 形成我國知識信息的資源優(yōu)勢。這對于正在實(shí)施西部大開發(fā)的信息基礎(chǔ)建設(shè)和文化教育建設(shè)更具有前瞻性的戰(zhàn)略意義。因此, 數(shù)字圖書館的建設(shè), 既代表著現(xiàn)代化圖書館發(fā)展的方向, 更代表著先進(jìn)文化的前進(jìn)方向。
參考文獻(xiàn)
[1]鄂云龍. 數(shù)字圖書館——信息時(shí)代發(fā)展新階段的國家級挑戰(zhàn)[J]. 情報(bào)資料工作, 2001, (5) : 16 - 20.[2]王軍, 楊冬青, 唐世渭. 數(shù)字圖書館的研究內(nèi)容和方向[J]. 中國圖書館學(xué)報(bào), 2001, (6) : 33 - 38.
[3]盛小平. 國內(nèi)外數(shù)字圖書館發(fā)展的比較研究[J]. 中國圖書館學(xué)報(bào), 2001, (6) : 39 - 44.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。