周和玉
(武漢理工大學 圖書館,湖北 武漢430070)
關于數字圖書館建設策略的思考*
周和玉
(武漢理工大學 圖書館,湖北 武漢430070)
數字圖書館建設是現代圖書館發展的必然趨勢,從建設什么樣的數字圖書館,數字資源整合,數據質量和網站建設等幾個方面,討論了數字圖書館建設的策略。
數字圖書館;資源整合;數據質量;數字圖書館網站
目前數字圖書館建設正在各級各類圖書館中興起,但建設一個什么樣的數字圖書館,在建設數字圖書館之前和建設之中應充分考慮和注意那些問題,這些涉及到數字圖書館建設的科學性及使用效率,值得我們深入探討。本文擬結合數字圖書館建設的具體實踐,就以上問題作一思考。
數字圖書館概念的提出是在20世紀90年代前后,由于其尚處于發展時期,因此,到目前為止關于數字圖書館的定義還沒有形成統一的認識。但從近些年的理論研究和建設實踐來看,筆者以為美國科學基金會對數字圖書館的描述似乎更具代表性。“數字圖書館并不僅僅是一個有著信息管理工具的數字收藏的等價詞,數字圖書館更是一個環境,它將收藏、服務和人集合到一起以支持數據、信息,乃至知識的全部流程,包括從創造、傳播、使用,到保存的全過程”[1]。在這里,數字圖書館是一個環境,是一個平臺。它包含了三個最主要的要素,即人、資源和技術。人是指與數字圖書館密切相關的人,包括為數字圖書館提供資源的數據庫生產者,建設和管理數字圖書館的圖書館工作人員,以及使用數字圖書館的讀者;資源是指數字圖書館上運行的各種信息源,包括各種數據庫(全文型數據庫、文摘型數據庫、數據型數據庫、館藏書目數據庫等等),網絡資源,自建特色資源等等;技術是指維持數字圖書館運行的各項技術,包括數據庫技術,數據挖掘技術,數據推送技術等等。在這三個要素當中,起主導作用的是人,因為是人為數字圖書館提供資源,是人在建設和管理數字圖書館,也是人在利用數字圖書館。如果對數字圖書館沒有比較明晰的認識,數據庫生產者就不可能很好地為數字圖書館提供合格的數字資源,圖書館工作人員就不可能建設和管理好數字圖書館,讀者就不可能充分利用數字圖書館這個平臺獲取信息、數據和知識。數字圖書館就是把這三個要素集合在一個平臺上,進行信息、數據和知識的交換、傳遞及創造。
建設什么樣的數字圖書館,這是每一個數字圖書館建設者首先要考慮的問題。目前,由于數字圖書館尚處于發展階段,在理論上還沒有一個統一的標準,在實踐上也沒有統一的數字圖書館模型。再加上各館在辦館理念、經費、人力資源、文獻資源(包括印本和數字資源)、服務對象等方面也大不相同,因此在建設上也就顯得不一樣。但不管理論、實踐、環境等方面有多大差別,建設一個對讀者實用的數字圖書館是大家的共識。
那么,什么樣的數字圖書館才是對讀者實用的呢?從我們的調查和讀者反映來看,適合讀者需要的數字圖書館應該能全面反映圖書館的各種資源(包括印本的和數字的),各種資源應該充分整合在一起,應能提供全方位的信息服務以及各種個性化服務,使用方便,便于各種信息交流等等。因此,我們可以將數字圖書館理解為一個平臺,一個環境,在這個平臺上,資源提供者(生產者)、資源管理者(圖書館工作人員)和資源使用者(讀者)進行著信息、數據和知識的生產、傳遞及創造。這個平臺是開放式的,可以對外進行數據交換。因此,它是全球數字圖書館聯盟(全球各數字圖書館聯在一起形成一個大的數字圖書館)的一分子,是全球數字圖書館的一個入口或一個節點,讀者在這樣一個數字圖書館上,既可獲得本地資源,又可以查到其他數字圖書館的資源,進而通過文獻傳遞系統獲得異地資源。這就要求我們的數字圖書館不能是封閉的,而應該是開放式的。這就是整體定位應考慮的問題。我們不要求也不可能要求單個數字圖書館包羅萬象,但至少要能與其他數字圖書館相互鏈接。讀者在這樣一個相互鏈接的數字圖書館群體——“全球數字圖書館”上,能獲得所需的各種各樣的信息和服務。筆者以為,這些問題在建館之初都應該考慮清楚,整體設計時考慮全面一些,才便于之后分步實施。
所謂信息資源整合,是指依據一定的需要,對各個相對獨立的信息資源系統中的數據對象與功能結構及其互動關系進行融合、類聚和重組,形成一個效能更好,效率更高的新的信息資源體系[2]。圖書館的信息資源多種多樣,大致可分為印本資源(包括各種圖書、期刊、報紙等等),數字資源(主要包括電子圖書、電子期刊、各種文摘數據庫和事實數據庫等)和網絡資源等,這些資源分別由不同的系統管理著,如印本資源由傳統的圖書館集成系統管理,各數據庫也有自己的管理平臺,由于各系統之間沒有相互聯系,讀者要檢索印本資源需進入圖書館集成系統,需查找電子圖書、電子期刊和其他電子資源又必須進入相應的數據庫系統,這樣給讀者使用帶來了很大的不便。信息資源整合的目的是要把這些毫不相干的信息,通過一定的技術和手段整合到一起,使其成為一個相互連接的整體,為讀者提供一個知識相互鏈接和利用方便的平臺,這是目前數字圖書館建設的一個主要內容。
目前,國內外數字圖書館采取的整合方式主要有:基于OPAC系統的整合,基于數字資源管理的整合,基于知識服務的整合[3]。基于OPAC系統的整合就是通過圖書館集成管理系統軟件進行MARC編目,將電子圖書和電子期刊整合到OPAC系統中,并在OPAC系統中提供超級鏈接功能,這樣讀者在OPAC系統中檢索到印本圖書、印本期刊的同時,還可以檢索到相應的電子圖書、電子期刊,進而通過超級鏈接打開全文。基于數字資源管理的整合就是在數字資源當中嵌入印本圖書和印本期刊的OPAC信息,從而實現印本資源和數字資源的無縫鏈接。基于知識服務的整合則是從知識服務的需要出發,直接通過分布式資源間的相互操作,相互鏈接,將所有的信息資源組成立體、網狀的知識資源服務系統。以上各種整合方式有著各自的優缺點,前兩種實現起來比較容易,但不能實現所有資源間的知識鏈接。最后一種整合方式可以實現所有資源間知識的立體、網狀鏈接,但實現起來難度較大。基于以上分析,我們可以看出,就真正的資源整合而言,基于知識服務的整合才是真正意義上的資源整合。因為它可以實現針對分布環境下的電子資源的整合檢索和獲取目標信息的無縫連接,以及實現各種知識和信息服務的整合。要實現知識服務的整合,通行的做法是在建立本地元數據庫的基礎上,通過資源調度系統實現資源檢索和提供的無縫鏈接。本地元數據庫應包括OPAC數據、商用數據庫和網絡資源數據,其中OPAC數據為本館所有,網絡數據可以通過加工獲得,但商用數據庫的元數據則需要數據商提供。目前,這部分數據獲得比較困難,也不穩定。這就是我們前面所提到的數字圖書館建設不僅僅是圖書館的事,而是涉及到數字圖書館系統各方面人員的共同努力,才能把數字圖書館建設好。但不管困難有多大,在數字圖書館設計之初,也就是方案設計中,應該考慮未來數字圖書館的可持續發展,為未來的可持續發展預留下足夠的空間。
信息資源整合總的原則應該是科學設計,統籌規劃,分步實施。我們說資源整合中要將各種信息資源整合在一起,這是整體上的要求,是整體設計上應考慮到的,但在實施上會遇到很多困難。例如,數據商配合的問題,知識產權的問題,數據量大的問題等等。因此,在具體實施上,可考慮分步實施,先易后難。我們武漢理工大學圖書館采取的是先整合本地資源,包括本館OPAC,裝在本地的電子圖書以及自建的一些數字資源,然后待運行穩定和條件成熟后,再逐個解決相關數據庫的整合問題。
注重數據和整合方式的標準化、規范化,以使得數據和服務能在數字圖書館之間順利流動,從而避免形成新的信息孤島。
數據質量是數字圖書館建設中不可忽視的一個非常重要的方面,數據質量的好壞,直接關系到數字圖書館建設的成敗。在數字圖書館建設中涉及到的數據主要有OPAC數據、商用數據庫元數據和網絡資源元數據等等。
一是標準化要求。標準化規范化是實現不同系統間網絡信息資源交流的基礎,實現數字信息資源整合的關鍵在于要遵循標準化的規范體系。如果沒有統一的數字信息資源建設標準和相應的規范,就不可能實現各分布式資源之間的互操作和信息的共享。在數據庫建設中 ,由于缺乏標準規范,往往導致大量異構資源的出現。因此,面對分散異構、不斷變化和開放的數字信息資源與服務環境,應采用新的標準規范體系,使各類、各種信息在網絡平臺之間能自由流動。
二是完整性要求。完整性是實現資源檢索和調度的基礎,數據項目不完整,檢索時容易造成漏檢,資源調度時容易產生調度誤差,從而影響資源整合的效果。
1.OPAC數據問題。目前國內大多數高校圖書館的OPAC數據是從上世紀80年代末到90年代初圖書館集成系統(或稱圖書館自動化系統)應用時開始建立的,在開始階段,不少館采取的是“大兵團作戰”的方式建立數據,即全館動員大多數人員參與,在較短的時間內將圖書館借閱流通的圖書建立數據庫。由于參與人員并非全部是圖書編目人員,加上對機讀格式并不很熟悉,所以加工的數據質量參差不齊,存在的主要問題是著錄項目不全,項目錄入錯誤等等。這些問題往往會導致資源整合和調度中出現差錯。
2.商用數據庫元數據問題。商用數據庫元數據主要存在兩個方面的問題,一是難于獲取,目前國內一些主要數據庫的元數據經過協商,大多數都能獲得,而外文數據庫的元數據則較難獲得,且大多數數據商不開放接口;二是數據更新難,難在數據商不提供接口,增量數據無法自動獲取。
對于OPAC數據問題,需要花較大氣力清庫來解決。目前,比較好的解決方案是將以前的數據逐條對照CALIS或中國國家圖書館的數據套錄,因為這兩個系統的數據比較規范標準,從而形成自己比較規范標準的OPAC數據。
對于商用元數據問題,鑒于其整合的難度較大,筆者以為,可以采取先易后難的辦法解決,即裝在本地的資源,其元數據也放在本地元數據庫中,進行完全整合。而對于沒有裝在本地的網絡訪問的數字資源,可以有兩種方式來處理。一是與數據商協商解決元數據本地存放和開放接口,或者由有開發能力和經驗的數據商將本地資源整合進相關數據庫平臺;二是暫時不整合進本地平臺,待條件成熟后再整合。
數字圖書館建設的設計理念以及資源和服務都是通過數字圖書館網站來展現的,讀者面對的也是數字圖書館的網站。一個好的數字圖書館網站應該成為圖書館與圖書館,圖書館與讀者,讀者與讀者,讀者與館員,甚至讀者與資源創造者(包括作者、數據商、書商等)之間的紐帶和橋梁。因此,數字圖書館網站的設計就顯得非常重要。在數字圖書館網站設計上應該注意以下幾點:
首先,網站設計上應該體現出數字圖書館能為讀者提供信息、數據、知識的獲取、交換、傳遞和創造的平臺,這些功能應在主頁面上反映出來。
其次,在內容展示上,應實行功能分塊,要站在讀者利用數字圖書館的角度進行設計,使讀者一目了然。一個數字圖書館大致可分為以下幾個區域,資源揭示區、資源檢索區、讀者登錄區、圖書館概況、讀者指南、個性化服務區、消息發布區等等,其中資源檢索和資源揭示是讀者最感興趣的項目,因此,這兩個區應擺在網頁版面醒目的位置。例如,武漢理工大學數字圖書館網站設計就是采取功能分塊的,整體上分左、中、右三大塊,左上為檢索區(資源統一檢索、館藏印本資源檢索),左中為消息報道,左下為資源推介;中間為主要區域,分別安排了讀者指南(圖書館相關情況介紹、資源使用指南、新生須知等),資料查詢(各種印本和電子資源查詢、新書通報等),信息服務(參考咨詢、科技查新、文獻傳遞等等),資源導航(數據庫和電子期刊導航以及網絡資源導航等)和特色資源(自建的特色資源和門戶等)等;右邊安排了用戶登錄,特色服務,資源利用排行等等。運行兩年多來,讀者普遍反映良好。
再次,盡量避免使用太專業化的術語(例如:“OPAC檢索”等等),網頁設計上要盡量簡潔。
綜上所述,數字圖書館建設對于一個圖書館來說是一件大事,應該從設計理念(建設什么樣的數字圖書館),資源整合,數據規范化,網站設計等多方面給予足夠的重視,組織館內相關人員反復認真論證,再聯合相關專家和軟件開發公司技術人員討論并實施,為讀者建造一個功能齊全、實用的數字圖書館。
[1] 曾 蕾,張 甲,楊宗英.數字圖書館,路在何方?[DB/OL].(2009-11-20)[2010-02-10]http:∥oldweb.lib.sjtu.edu.cn/chinese/teaching&research/1.html.
[2] 崔瑞琴.數字信息資源整合問題研究[J].圖書情報工作,2007,51(7):35-37.
[3] 龔亦農.數字圖書館的資源整合[J].圖書情報工作,2005,49(7):121-124.
(責任編輯 文 格)
Thoughts on the Strategies of Digital Library Construction
ZHOU He-yu
(Library,WHUT,Wuhan430070,Hubei,China)
To construct digital library is the inevitable trend of modern library development.The strategies of digital library construction has been discussed from the following aspects of what type digital library to construct,integrating digital information resources,data quality and network construction.
digital library;integrating information resources;data quality;network of digital library
G250
:ADOI:10.3963/j.issn.1671-6477.2010.05.033
2010-03-10
周和玉(1957-),男,安徽省樅陽縣人,武漢理工大學圖書館研究館員,主要從事數字圖書館、情報存貯與檢索研究。
教育部科技發展中心項目資助(2009113)