(天津農學院圖書館 天津 300384)
網絡信息技術的快速發展和信息資源的持續激增,為高校用戶科研信息的發現和獲取提供了多種可能,如何在海量的信息浪潮中快捷發現并有效獲取目標資源,是目前圖書館和信息服務機構需深入研究的重要課題。雖然資源整合和聯邦檢索曾在一定程度上提高了資源查找的便捷性,但由于其無法對圖書館所有可用資源和服務系統的統一管理,不能滿足現代高校科研用戶的信息訴求。Google、Amazon等商業網站簡潔快捷的信息獲取方式和豐富相關性的獲取結果,為科研用戶提供了全新信息獲取體驗。在這種信息訴求和信息環境下,起源于OPAC和聯邦搜索的網絡級資源發現系統應運而生并在高校圖書館得到迅速發展。〔1〕網絡級科研信息發現系統通過建立大型元數據中心索引庫,在圖書館所有可用資源和用戶的需求之間架起了橋梁,為用戶科研信息的快捷發現和有效獲取提供了一站式解決方案。目前國外在資源發現系統研發和圖書館應用方面一直走在前列,較典型的成熟產品有:EDS、Primo、Summon、Encore等;國內近兩年也有相應的主要針對中文發現的產品出現,如CALIS的e讀搜索、讀秀學術搜索、超星經緯學術發現系統、指針搜索、百鏈、CNKI學術搜索、KDN知識發現網絡平臺等。〔2〕這些發現產品以簡單、快速、易用、有效的檢索體驗顛覆了傳統的圖書館整合檢索系統帶給用戶的感受。由于發現服務是新生事物,在其推廣應用中仍存在資源覆蓋不足、信息滯后、個性化服務缺失等諸多困惑,通過對國內高校科研信息發現服務的發展困惑與原因的深層分析,為發現系統破解困惑、持續發展提供決策參考。
通過對有關發現系統研究資料的梳理和分析,發現目前國內高校圖書館使用的資源發現系統都是由國外的數據庫生產商或者圖書館集成系統開發商推出的,相對于國外許多研究者已陸續開發的新系統,我國對發現系統的研究還較為薄弱,由于技術和資源限制等方面的原因,還沒有一個集成了中外文數據資源的成熟產品問世,〔3〕更是缺乏基于用戶需求的研究。現階段國內對圖書館資源發現系統的研究多以介紹國外發現系統的功能、實踐經驗、本地化推廣方案等;從發現的角度,以定量分析的方法來研究用戶需求的文章還很少見。〔4〕以用戶需求為導向,進行發現系統的設計和架構,提供面向需求、適應變化和靈活深入的發現機制,是發現服務持續發展的根本,也是以用戶為中心的服務理念的充分體現。因此對資源發現服務的研究有待進一步深化。
發展對策:發現系統是面向學術信息的知識發現平臺,是一個網絡搜索引擎,索引庫中元數據的質量和數量對系統的發現功能產生很大的影響。〔5〕因此對發現服務系統的研究首先要研究其元數據的深度整合和標準化處理流程,以此提升其元數據的質量和覆蓋率;二是研究其網絡環境下的系統架構和智能化發現功能的提升;三是進一步研究用戶的信息行為和信息需求,構建以用戶需求為導向的資源發現系統。
通過對發現系統有關研究資料的調查,發現當前國內無論引進還是自己研發的的發現系統,普遍存在資源覆蓋不足的問題。其主要體現在以下方面,一是對各類型資源數據提供發現揭示的機會不平衡,多數集中在對圖書、期刊文獻資源的發現揭示,對圖片、音樂、影片等類型的信息數據則較少涉及;〔6〕二是發現服務并不能夠完全替代圖書館其他重要的信息檢索和發現工具以及全部圖書館信息資源,對于某些給定的學科,發現服務不能覆蓋的內容還是非常可觀的;〔7〕三是中文電子資源內容的覆蓋是當前幾家主流發現系統Summon、Primo和EDS等在中國市場推廣應用的一個首當其沖的瓶頸;而國內研發的超星和中國知網等發現系統又明顯存在外文資源的缺失,由此可見資源的覆蓋率是發現系統的一大困惑。
針對發現系統資源覆蓋率不足的問題,筆者認為應采用以下對策:一是利用倉儲技術和大數據技術加大信息資源采集的深度和廣度,力求圖書館可用資源的全覆蓋;二是利用連接技術和關聯技術增加對遠程信息資源的獲取渠道;三是加大數據庫商、系統商以及各發現系統的通力合作。
圖書館用戶對資源發現系統的需求日趨強烈,但資源發現系統進入市場后,由于元數據過度集中到系統開發商,致使發現服務對于出版商和內容提供商的支持與合作的依賴;特別是自建庫中元數據與引進系統元數據融合建立聯合索引,通過SaaS服務模式向用戶提供服務,或通過OpenURL完成電子資源有效關聯等,致使圖書館部分特色資源被國外商業公司控制,存在安全隱患。出于對信息安全的保護,某些圖書館不愿意將自有數據提供給商業公司,這也是資源覆蓋不足,部分國外發現產品不支持中文數據庫原因之一。
解決信息的安全隱患,要做好以下幾點:一是仿照Primo的架構模式,將元數據倉部署在云端,將本館館藏和自建資源數據部署在本地,這種“云+本地”的復合部署,一方面解決了國外發現產品不支持中文數據庫的問題,同時規避了自有數據的安全隱患。如上海交通大學將超星數字圖書的元數據部署在本地,使發現系統增加了對中文電子圖書的支持;〔8〕二是對部署在云端的自有數據做詳細的訪問權限設置;三是建立部分自有數據元數據倉儲,利用SFX與發現服務系統鏈接,形成關聯訪問。
劉頡頏、陳定權等通過對廣州大學城高校圖書館用戶對系統價值的感知調研,指出:檢索結果的相關度排序、顯示館藏信息、網絡鏈接等是用戶認為最有用的功能,而資源發現系統開發商重點推介的檢索結果分面顯示和分主題檢索,并沒有受到用戶的好評;Tag標簽等Web 2.0元素,受到一般網絡用戶的追捧,但圖書館用戶對此并不感興趣。但Web 2.0元素可打造信息交流和共享平臺、為用戶提升網絡交流體驗提供準備;主題限定搜索和分面瀏覽為用戶個性化服務提供了基礎,但用戶并沒感知到這些功能的有用性,由此可見用戶對資源發現系統的功能感知有待提升。
針對用戶對資源發現系統功能感知的提升,筆者認為應采用以下對策:一是向用戶積極宣傳和推介發現系統的核心功能,如主題限定檢索和分面瀏覽,引導用戶發現這些功能的的妙處并使用這些功能;二是在系統中嵌入智能化鏈接軟件,對用戶的功能需求提供智能化自動切入;三是通過培訓講座,提高學生的信息素養。
文章所指的個性化服務是指圖書館學術用戶對其專業領域的深度檢索和用戶個性化推介服務等。科研信息發現系統通過大型元數據索引為用戶科研信息的快捷發現提供了一站式檢索方案,但一些高層次的教授、研究生等資深用戶對其感到有用性不強,認為所有信息集中到一個索引庫的信息管理造成大量不相關檢索結果的出現,阻礙了對其專業領域深度檢索和對目標資源的發現與獲取,他們更希望在自己專業數據庫獲得針對性更強、深層的信息資源,因此就目前國內引進和構建的資源發現系統存在對專業領域的深層檢索問題。〔9〕另一方面,據有關學者統計,目前國內幾家引進和自建的資源發現系統,普遍缺乏基于用戶需求的個性化發現服務,如個性化定制、個性化推薦、移動和web2.0服務等。
針對發現系統個性化服務缺失問題,筆者認為應采用如下技術措施:一是從信息資源的組織和揭示上入手,提供個性化信息資源的匹配揭示,如充分利用相關技術對中心索引庫中的元數據進行深度融合、分類重組,構建基于學科的元數據網絡關聯分布體系,以滿足資深科研用戶個性化的信息需求。二是采用Primo的服務模式,構建元數據索引庫和專業領域元數據倉儲,使索引庫和專業數據倉儲捆綁,以此實現對專業信息資源的深度檢索。三是通過數據挖掘、數據分析,對用戶學術搜索行為日志進行分析與挖掘,找出用戶的興趣愛好、特色需求及學術背景,為用戶提供基于推薦引擎的“情境發現”服務。〔10〕四是對索引庫檢索端口嵌入各種個性化服務軟件如個人信息管理門戶、web2.0元素、移動和社會網絡、參考咨詢、第三方資源、學科趨勢分析和可視化展示等,通過個性化界面設置、分面定制和第三方資源混搭等,為用戶提供一個交流互動,協同創作和無所不在的科研信息發現與獲取環境。
目前越來越多的資源發現系統投入市場,國外幾家較成熟的發現系統 Summon、Primo、Worldcat Local與 Encore等,在技術原理、元數據獲取和服務模式方面基本相同,但在數據來源、數據量和服務功能等方面有所不同;國內近年推出的超星、中國知網等發現服務平臺主要提供中文學術資源的發現與獲取。隨著資源發現系統的不斷推出和圖書館對發現服務的重視,如何根據自身的需求進行發現系統的選擇將是圖書館的一個難題。〔11〕
對我國高校圖書館來說,在引進和應用發現服務系統時,首先要重點關注對用戶需求最大的中文元數據的覆蓋、中文資源的排序和中外文資源的語義匹配等問題;其次對學術元數據收錄的數量和質量,系統接口、標準化、檢索界面功能擴展等問題也要重點關注;同時系統對非結構數據的處理能力、檢索界面的易用性、以及與圖書館現有資源類型和服務平臺的無縫對接等都是高校圖書館系統選擇需要關注的內容。〔12〕
網絡級發現服務是通過對海量的來自異構資源的元數據和部分對象數據通過抽取、映射、收割、導入等手段進行預收集,并通過歸并映射到一個標準的表達式進行預聚合,形成統一的元數據索引,通過單一但功能強大的搜索引擎向終端用戶提供一站式的資源發現與獲取服務的系統。由于通過信息資源預收集和預聚合而構建的元數據中心索引庫,不像Google學術搜索能直接從數據庫廠商抓取內容,而是根據一個時間表依次從元數據倉庫更新,這就存在信息滯后問題,從而影響著發現系統信息檢索的時效性。〔13〕針對發現系統信息滯后問題,應采用以下技術方案:一是利用一定的標準協議和工具,對數據資源進行標準處理,實現圖書館可用資源的統一管理和一體化架構,從而提升資源的匹配速度;二是加強圖書館與數據庫商或出版商合作,利用鏈接技術直接從出版商或數據庫商獲取元數據,從而提升資源發現的時效性;三是通過MARC記錄映射客制化和RTA實時館藏狀態的同步。
發現系統越來越得到國內高校圖書館的重視,但其在運行中仍存諸多困惑,而有效的運行機制是科研發現服務破解困惑和持續發展的有力保障。通過對圖書館發現服務系統的困惑和破解對策的分析,將發現系統運行機制分為以下幾個方面(發現系統發展困惑和運行機制如圖1所示):

圖1 科研發現系統的發展困惑與破解機制
通過對館藏資源和服務系統多類型、多渠道、多角度的收錄和深度整合,為發現系統可用資源的全覆蓋、提升發現系統的發現功能及構架國際一流的發現平臺提供基礎準備。
信息管理和運行機制的標準化,是信息資源深度整合和有效關聯的基礎。發現系統標準的元數據集中索引是發現服務的關鍵,是實現各異構資源元數據分類聚合與一體化調度的基礎準備。同時發現系統運行機制的標準化,是系統兼容性、通用性和可擴展性,提高系統響應速度和提供各種標準化接口的基礎。
系統通過關聯技術和OpenURL技術將圖書館所有可用資源優化匹配,為用戶檢索發現提供最佳的邏輯結構,并針對不同類型的信息資源給出最優的獲取和擴展獲取方式。如目標內容為紙質圖書,發現系統給出該圖書的館藏位置、流通信息、電子版鏈接及其他獲取方式,并自動推出最佳獲取方案,真正體現了發現系統的發現功能。有效的關聯機制可進一步完善系統的個性化服務功能。
發現系統利用數據挖掘技術,一方面通過用戶學術搜索行為日志分析,發現用戶的真實需求,為用戶提供針對性的信息推介服務,另一方面是對元數據索引庫數據的深度挖掘,并針對用戶的信息請求,提供最佳的選擇方案。智能化的數據挖掘機制是為用戶提供個性化推介服務、滿足資深科研用戶信息需求的有力保障。
嵌入技術的應用,使發現系統靈活多樣的發現服務提供了可能,如在用戶的檢索界面嵌入移動、web2.0、分面定制、社會網絡、第三方資源等應用軟件,為發現系統個性化、多樣化、互動化、共享化等各種發現功能的實現提供技術支持。
發現系統為用戶科研信息的快捷發現與獲取提供了一站式解決方案,由于研究較薄弱,國內高校在引用和實施過程中仍存在資源覆蓋不足、個性化服務不強、信息滯后等諸多困惑。通過分析發現系統諸多困惑和破解方案的基礎上,提出有效的運行機制是科研發現服務破解困惑和持續發展的有力保障,以此為國內高校科研發現系統的建設提供理論借鑒。
1.劉頡頏,陳定權,郭嬋.用戶對圖書館資源發現系統功能的期望.圖書情報工作,2012(7):27-31
2.胡瑋.“985工程”高校圖書館資源發現系統現狀分析和思考.圖書館學研究,2013(16):43-45
3.鞏林立.高校圖書館資源發現服務系統體系構建.圖書館學研究,2012(12):69-70
4.廖志江.知識發現及數字圖書館知識服務平臺建設研究.情報科學,2012(9):1849-1853
5.竇天芳,姜愛蓉.資源發現系統功能分析及應用前景.圖書情報工作,2012(7):38-41
6.陳麗冰.讀者服務視角下的圖書館資源發現服務.情報資料工作2012(4):68-69
7.聶華,朱玲.網絡級發現服務-通向深度整合與便捷獲取的路徑.大學圖書館學報,2011(6):8-10
8.秦鴻,錢國富,鐘遠薪.三種發現服務系統的比較研究.大學圖書館學報,2012(5):9-10
9.歐陽劍.數字圖書館信息資源的可發現性研究.圖書館論壇,2013(1):33-35
10.歐陽劍.數字圖書館信息資源發現模式研究.圖書情報工作,2013(4):140-142
11.鄭麗君.資源發現服務:圖書館服務與研究的新視角.圖書與情報,2013(3):133-134
12.孫楊.OCLC WorldCat Local發展綜述.山東圖書館學刊,2011(5):48-54
13.宋敏,吳倩倩.圖書館網絡級發現服務的比較和選擇.情報探索,2013(7):111-113