◎付博宏
淺談圖書館數字化檢索
◎付博宏
在積極構建社會主義和諧社會的步伐中,全民閱讀提高國民素質也是和諧社會的重要內容之一。圖書館作為公共閱讀的場所勢必承擔著重要的責任和義務,而面對素質層次高低不一的社會讀者,如何使他們更方便、快捷地找到想要的書籍雜志以實現閱讀、提高國民素質的愿望是圖書館工作人員亟需研究和解決的問題之一。
圖書館 數字化 檢索方式
隨著計算機技術的快速發展和網絡的全面覆蓋,人們越來越意識到信息技術對于生活方方面面的便捷作用和影響。在信息技術越來越普及的時代里,圖書館數字化改革與發展成為必然的發展趨勢。
所謂數字化圖書館,就是指對圖書館資源的管理,包括文本、音像等數據通過多媒體信息技術進行收集和規范性的加工,從而實現對圖書館資源的保存和管理;同時,數字化圖書館也能夠為讀者提供方便、快捷、準確的檢索信息功能。因此,數字化圖書館相較于傳統意義上的圖書館在管理和運行過程中主要體現以下既方便的特點和特性:
1.書籍管理的信息資源數字化;
2.書籍資源的傳遞網絡化、實時化;
3.圖書館資源的共享化。
而對于圖書館的信息管理,主要體現兩方面的特點,即信息管理有序,方便瀏覽與查找;同時信息資源的準確性高,更新及時。
(1)數字化圖書館的發展
縱觀數字化圖書館的發展歷程,國外先于國內起步發展,而隨著計算機技術的快速發展,數字化圖書館發展的進程也逐漸加快步伐。美國于1994年9月正式公布了為期四年、投入近2440萬美元的項目——《數字圖書館啟動計劃》,標志著美國率先其他國家開始了圖書館數字化的進程。據有關部門統計,迄今為止,美國在圖書館數字化發展項目中共投入經費超過8億美元。
隨后,英國、法國、日本、德國、意大利等發達國家以及新加坡、韓國等亞洲國家也相繼開始本國的圖書館數字化革新與發展。
(2)個性化信息檢索的概述
數字化圖書館的實現順應的社會和科技的發展潮流,而隨著圖書館數字化的實現,如何更好地將圖書館的館藏資源服務于社會讀者,是各國需要研究和解決的首要問題。尤其面對社會公共開放的各級圖書館,由于讀者群體的知識水平好素質千差萬別,如何讓每一位讀者都能夠在浩瀚如煙的圖書館信息的海洋中快速、準確檢索到自己需要的信息是圖書館工作人員和相關研究人員需要思考并解決的問題。
個性化信息檢索應運而生,它是指讀者可以根據自己的需求,利用網絡快速掃描信息庫,從而準確檢索出有效信息。個性化信息檢索實質是將主動權完全交給每一位讀者手中,自己掌控,獲取有效信息。通過實踐證明:設置相應個性化的圖書館信息檢索系統是配個數字化圖書館的最佳信息獲取途徑和方式。個性化檢索系統可以在一定程度上大大緩解信息爆炸與有效信息獲取之間的矛盾。
在數字化圖書館實現的進程中,采用何種信息檢索方式才能滿足讀者的不同需求是主要需要研究和亟待解決的問題。本文總結、概括了幾種目前實際應用較多的檢索方式,結合各檢索方式的優缺點簡要介紹。
1.基于內容的信息檢索
所謂基于內容的信息檢索,是指根據存儲內容的關鍵詞以及上下文的聯系對信息進行檢索的一種方式。
基于內容的信息檢索其優點在于能夠直接對存儲內容進行篩選,避免在信息篩選時的遺漏;缺點在于對相似內容的區分度不夠,勢必造成檢索結果的冗雜,降低檢索結果的準確性。
2.基于本體的信息檢索
Neches等人(1991)對“本體的”定義為:“給出構成相關領域詞匯的基本術語和關系,以及利用這些術語和關系構成的規定這些詞匯外延的規則的定義?!?/p>
Studer(1998)對“本體”是這樣描述的:“本體是共享概念模型的明確的形式化規范說明?!?/p>
隨著計算機技術和網絡的發展和進步,本體在信息檢索中扮演了十分重要的角色,它具有清晰的概念層次結構以及嚴密的邏輯推理,因此在信息檢索中能夠準確將有效信息篩選出來。
基于本體信息的檢索能夠有效減少自然語言所產生的歧義,更為智能;但面對本體庫的建立,則是一項巨大而艱巨的任務,一般機構或個人是很難建立起一個涵蓋信息廣泛的本體庫的。
3.基于目錄的信息檢索
每一本圖書中的目錄是對本書的一個概括性的導覽,因此目錄中的內容往往是整本書中的重要內容。基于目錄的信息檢索正是以此為指導思想,建立信息檢索機制,使讀者能夠通過目錄內容有效地將信息有針對性的篩選出來,使讀者能夠在付出最小努力的前提下獲得最大的檢索需求。
基于目錄的信息檢索方式的局限在于對中文書目更為有效,而面對中英文混編圖書或全英文圖書,目錄內容往往不能代表整本書的概括性內容。
數字化圖書館的信息檢索主要為了讀者能夠方便、快捷、準確地找出有效信息,從而更好地利用圖書館資源,采取何種檢索方式并沒有什么統一的標準,要結合相關讀者的知識水平以及結合各種信息檢索方式的優勢與劣勢,取長補短,形成個性化的信息檢索方式,從而更好地為不同層次的讀者群體服務,使圖書館的館藏資源更有效地被利用。
(作者單位:吉林出版集團股份有限公司人力資源部)
(責任編輯 陳天賜)