于珊珊



摘 要:數字圖書館的建立使服務模式從“館藏為中心”轉向“以讀者需求為中心”,其衡量標準不再是館藏是多少、館舍的大小等,而是以服務技術、服務方式等方面。檢索系統的便捷程度將影響到用戶對數字圖書館的使用。國家圖書館“文津”搜索系統整合數字資源,更好地展示數字資源的管理和如何利用,充分滿足用戶需求,提升用戶體驗感。
關鍵詞:國家圖書館;“文津”搜索系統
隨著信息技術的發展進步,國家圖書館的數字資源建設從20世紀90年代開始,其館藏資源規模持續擴大,文獻類型豐富,擴大數據庫網絡訪問權限,豐富在線閱讀資源,不僅擁有傳統的紙質文獻,而且還擁有多樣化的數字資源,共同構成了龐大的資源庫,成為寶貴而豐富的知識資產。2017年底數字資源總量為1603.87TB,包括館藏特色資源數字化量1102.24TB,外購數據庫157TB,網絡導航和網絡采集量175.95TB,數字資源征集162.44TB,電子報紙呈繳6.24TB。通過對2014年至2017年的數據對比可知,資源量是逐年遞增的(見表一)。國家圖書館數字資源內容單元主要包括電子圖書、電子期刊、電子報紙、學術論文、會議論文、音頻資料、視頻資料等。圖書館朝著大規模數字化方向發展,但也面對著諸多挑戰,國家圖書館不斷優化資源檢索系統,使其頁面友好,方便讀者可以快捷地使用國家圖書館檢索服務。并且,國家圖書館非常重視資源的組織加工。
一、“文津”搜索系統概況
1.“文津”搜索建設背景和總體設計
國家圖書館不斷推進文獻信息資源整合,建設“文津”搜索系統,提升資源發現能力,滿足讀者對各類資源的“一站式”檢索需求,快速獲取所需內容,享受便捷服務。“文津”搜索系統提供國家圖書館自建和外購資源統一的元數據搜索服務,是國家數字圖書館工程重要的項目之一,“文津”搜索系統建設目標是結合基于互聯網的信息收集和數據分析挖掘技術,向用戶提供的一個統一、實時高效、精準、權威的數字圖書館數字資源元數據搜索服務平臺。并且整合國家數字圖書館自建或其他方式獲取的數字資源,建立和維護高性能分布式索引。數字資源的生命周期包括數字資源采集、數字資源加工處理、數字資源保存和數字資源服務利用。而數字資源服務利用正是體現國家數字圖書館工程建設價值的關鍵環節。“文津”搜索系統是數字資源服務利用的集中體現,面向圖書館讀者用戶,提供基于圖書館元數據的權威搜索服務。
“文津”搜索系統將結合數字圖書館推廣工程,建立一個覆蓋全國數字圖書館的搜索服務平臺,滿足讀者對數字圖書館各類資源“一站式”檢索、獲取的需求,涵蓋了國家圖書館各類中外文自建和外購數據庫資源。方便讀者直接獲取數字資源的目標對象文件和各種應用服務,提高全國圖書館數字資源利用率,實行“海量資源,一搜既得”。“文津”搜索系統檢索結果多維聚類和導航,實現在不同需求的檢索結果基礎上聚類顯示,以及檢索服務的個性化定制與推送。“文津”搜索系統是一個集軟件、硬件于一體的集成系統。致力于提供一站式發現和獲取服務。基于“文津”系統在服務內容和服務對象的定位,要求系統能夠承載巨大的訪問請求,同時提供快速檢索。要求性能滿足平均每分鐘10萬次檢索請求,峰值每秒一萬次檢索請求的處理能力,系統架構具有擴展能力。
截至2015年年底,“文津”搜索系統已整合百余個數據庫,其中已上線數據庫58個(含中文外購數據庫17個,外文外購庫15個,自建資源庫23個,聯合編目2個庫,Aleph 1個庫),所有上線數據庫全部面向讀者提供服務。國家圖書館外購數據庫相關數據見表2。2017年,國家圖書館在文獻資源整合工作中對“文津”搜索系統進行系統優化升級和內存擴容升級。基于先進的技術方案,擴充高性能、大內存服務器,實現對異構服務器集群的管理,以解決制約“文津”搜索系統數據更新和應用拓展的關鍵問題,并對多年積累的新數據進行整合、測試及整改,對資源訪問接口進行調試,以實現對大量新資源的揭示,從而使“文津”搜索系統揭示的資源庫數量成倍增長。
2.“文津”搜索系統首界面
讀者可通過域名http://find.nlc.cn直接訪問“文津”搜索系統,或登錄國家圖書館主頁(www.nlc.cn),在“文津”搜索系統的檢索入口處一鍵式檢索。在“文津”搜索系統首界面(如圖1所示)內容包括搜索類型(全部、圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔、詞條等)、高級檢索、聯邦檢索、搜索熱詞榜、國圖首頁、登錄、注冊、幫助,界面一目了然。“文津”搜索的熱詞榜(如圖2)內容非常豐富多彩,熱詞排行榜分為日、周、總統計的,有不同的10大熱門關鍵詞排行,熱點閱讀、人氣資源庫和“文津”云圖,供讀者查看檢索,使讀者了解閱讀熱點,幫助讀者查找有關資料。點擊榜單和標簽云中的任意檢索詞,可直接進行檢索,出現該詞匯的搜索結果。如圖3所示,點擊“浙江日報”,出現其檢索詞的全部檢索結果。
3.“文津”搜索檢索功能
“文津”搜索系統主界面采用的是單框檢索入口,界面簡潔,讀者輸入檢索詞后,從而對系統內所有資源進行一站式檢索,并具有搜索建議功能,可以為讀者提示熱門搜索詞(如圖4所示),其可檢測內容除了國家圖書館OPAC系統內各類型書刊文獻資源、省市公共圖書館文獻資源,也包括國家圖書館各類中外文自建資源和部分外購資源庫。其包括單條件檢索、二次檢索、高級檢索、聯邦檢索、相關檢索、聚合檢索等。聯邦檢索又包括整合檢索、數據庫查找、期刊查找、原文查找、個人空間。整合檢索是對所有館藏目錄,包括電子數據庫進行的梳理、揭示和整合。
(1)“文津”搜索系統檢索項
第一,初級檢索。檢索項的數量同文獻信息的揭示程度有關,也影響到讀者檢索結果。“文津”搜索首頁,可進行初次檢索,在搜索欄內輸入查詢詞進行搜索,即可出現與查詢詞相關的檢索結果。初級檢索能讓不具有檢索知識、檢索技能,檢索目的不明確的讀者滿足其檢索需求。
在“文津”搜索首頁,也可進行專業檢索,點擊選取導航欄資源和檢索字段進行專業檢索,表3所示資源名稱對應的檢索字段,根據不同類別專業檢索字段快速查找資源。例如,用戶點擊“論文”時,統一檢索欄的前端會出現“全部字段”“題名”“責任者”“關鍵詞”和“刊名”選項。為了支持專業檢索,把數字資源進行了分類,“文津”搜索系統分為一級分類、二級分類,其中一級分類主要是根據文獻類型,劃分為圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔和詞條;二級分類根據一級類目的文獻內容和文獻類型,即數字資源的實際情況而形成的。這對用戶能快速準確的查找資源提供便利。
第二,高級檢索。高級檢索能提高檢索效率、檢索速度,即提高齊全率和準確率。圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔、詞條等這些一級分類均有高級檢索。高級檢索中邏輯檢索方式的流程為選擇文獻類型、選擇高級檢索條件、選擇出版年份、可勾選“來源庫”(包括館藏中文資源、民國資源、博士論文、數字方志、碑帖菁華、古代典籍以及國家圖書館自建數據和部分外購數字資源庫)(如圖5所示),可選擇是否提供全文、點擊檢索。在選擇高級檢索方式時,需選擇是邏輯檢索還是全文檢索這兩種檢索類型,選擇邏輯檢索的檢索項同初級檢索的檢索項,可以最多添加三個檢索條件項目,并且還可以翻譯成中文或英文。
圖5 高級檢索界面
第三,聯邦檢索。國內或稱為“跨庫檢索”或“整合檢索”等,維基百科對其定義為,將一個檢索請求以合適的語法進行轉換后發送到一組獨立的數據庫中,合并檢索到的檢索結果,以簡潔統一的格式和最小的重復顯示結果,提供一個自動或者用戶選擇的排序方式對結果進行排序。聯邦檢索提供分類瀏覽,提高了檢索效率和速度,“文津”搜索系的聯邦檢索是整合了國家圖書館數字資源門戶系統中的各個資源,在同一界面即可發現所有內容信息,根據所需文獻類型準確定位。在聯邦檢索中包括整合檢索、數據庫查找、期刊查找、原文查找、個人空間等項目。內容豐富強大,為用戶提供更全面、更細化以及不同類型文獻的檢索需求。
4.“文津”搜索系統檢索結果頁面
“文津”搜索系統的檢索結果與國家圖書館的部分資源系統實現了無縫整合鏈接,在系統的檢索結果頁面支持查看到文獻的封面、題名、文獻類型、著者、出版年、出版社、來源數據庫。部分文獻資源還提供了摘要、目次、館藏信息以及在線閱讀等欄目,在檢索結果的詳細界面,除上述項目外,還會出現該文獻資源的詳細信息、摘要、目次、館藏信息、在線閱讀、分享到新浪微博、文獻傳遞延伸檢索、更多相似資源、更多相關資源等欄目,可幫助讀者進一步確認是否是所需文獻,直觀初步了解資源信息,提高檢索效率及準確率。延伸檢索是為了更好地滿足讀者同步獲取相關網絡資源的需求,面向谷歌、百度等外部搜索引擎的延伸檢索鏈接。根據文獻類型不同,具體信息包括所有責任者、標識號(ISBN、ISSN)、出版發行地、關鍵詞、語種、分類(中圖分類)、叢編題名、載體形態、版本說明。與此同時,系統提供了收藏該書的全國省市圖書館的館藏位置信息的導航功能,以列表形式說明資源所在位置和提供的服務,如點擊“國家圖書館”即可看到單冊狀態、館藏子庫的架位導航信息,從而可預約此本單冊。點擊其他省市公共圖書館,也可看到該單冊的館藏信息以及文獻信息,界面還展示了聯合編目成員館館藏信息的可視化地圖,查看到所在的具體城市和圖書館。搜索到所需文獻后,可直接獲取各類自建或部分外購數據庫系統的全文信息,或直接向文獻提供中心發送館際互借與文獻傳遞申請。結果界面還包括全部檢索字段、排序、相關結果數量、頁數、相關搜索、二次檢索等。
在檢索結果界面中,展示出含有檢索詞的文獻資料,在頁面左側顯示了多維度的導航選項,包括文獻類型、著者、年份(可對年份進行篩選)、是否可提供全文、語種(漢語、英語、日語、其他)以及來源數據庫等,用戶可以通過這幾項導航選項進一步縮小檢索范圍,實現基于不同需求的檢索結果聚類顯示。比如,年份導航,讀者選擇年份后或者對年份進行篩選,右側搜索結果列表只顯示在此期間的檢索結果。在檢索頁面最下端的“相關搜索”選項是系統通過對用戶歷史檢索詞及系統規范詞庫的分析得出的,用以幫助讀者更加明確自己的檢索詞。
5.“文津”搜索系統檢索服務的個性化服務
在“文津”搜索系統中登錄后,在界面中會出現個人中心選項,為讀者提供了個性化搜索服務,包括我的檢索歷史,可以查看到自己歷次檢索詞、檢索文獻類型、檢索字段和執行時間等,并且可以清空檢索歷史。在我的搜索設定中,可選擇網頁顯示語言(中文、英文)、檢索歷史是否保存、檢索結果是否展現封面信息、選擇自己的職業類目、興趣等選項進行設定,設定搜索習慣等。
參考文獻:
[1]蔡忠兵.傳統圖書館與數字圖書館的距離[J].圖書館建設,2001
[2]楊東坡,邢 軍.論國家圖書館“文津”搜索的涉及與實現[J].國家圖書館學刊,2014
[3]馬 驊.國外主要聯邦檢索系統的興起、現狀及發展趨勢[J].圖書館建設 2009
(作者單位:國家圖書館)