

[摘 要]將我國42所世界一流大學建設高校圖書館作為研究樣本,系統調研樣本館特藏數據庫建設現狀與問題。研究發現,特藏數據庫建設質量不高,特藏數據庫內容較為零散且缺乏規范性,特藏數據庫功能不健全,是當前我國高校圖書館特藏數據庫建設存在的共性問題。高校圖書館可通過戰略合作途徑優化特藏數據庫質量,對特藏數據庫內容進行層次化、結構化組織,從資源揭示與增值服務雙重維度完善特藏數據庫功能,據此提升特藏數據庫建設投入產出效率。
[關鍵詞]高校圖書館;數據庫;特藏文獻
[中圖分類號]G250.74[文獻標志碼]B[文章編號]1005-6041(2025)01-0083-06
1 引 言
特藏數據庫是數智化轉型背景下保存、組織、推廣特藏資源的有效依托,具有集成性、共享性與交互性等突出特點。隨著大數據、云計算、人工智能等信息技術的飛速發展與廣泛應用,特藏數據庫的現實生產力得到了巨大提升。一直以來,高校圖書館十分重視特藏數據庫的現實價值,通過采購、租用、自建等方式,建設具有檢索、閱讀、編輯、共享等功能的特藏數據庫體系,實現了信息技術在特藏資源保護領域的有效應用。司新霞[1]指出,特藏資源的規范化采集與著錄,是建設特藏數據庫的必要前提,因此建議高校圖書館加快完善特藏文獻數字化工作標準與頂層設計,對特藏資源進行標準化識別。楊超等[2]認為,高校圖書館應充分利用業內外機構的資源優勢、技術優勢與管理優勢,提高特藏數據庫服務供給能力。就業內實踐而言,浙江海洋大學圖書館開發的特藏數據庫,不僅提供基本檢索功能,而且允許用戶在圖像中精準定位檢索結果[3]。但仍需要看到的是,較少有學者從大樣本和全鏈條的角度論述高校圖書館特藏數據庫建設方案。本文較為全面地調研了我國高校圖書館特藏數據庫建設實踐,提出了具備可行性的優化策略。
2 高校圖書館特藏數據庫調研情況概述
本文綜合運用網絡調研、文獻調查、對比分析方法,系統分析我國42所世界一流大學建設高校圖書館特藏數據庫的基本情況。由于部分高校圖書館對特藏數據庫的訪問權限進行限制,及部分特藏數據庫處于修復狀態,因此本文最終選取特藏數據庫信息全面的32所高校圖書館作為研究樣本。調研的起止時間是2024年5月至10月。首先,登錄樣本館官方網站,對樣本館特藏數據庫建設主體、文獻類別、資源規模、主要功能、插件工具進行網絡調研。其次,以“高校圖書館”“特藏數據庫”為關鍵詞,在e線圖情、中國知網、愛墨瑞得等學術文獻數據庫中檢索相關文獻,分析樣本館特藏數據庫建設的優勢與劣勢。再次,對比分析網絡調研與文獻調查采集的數據,總結歸納樣本館特藏數據庫建設的共性與個性特征。最后,得到樣本館特藏數據庫建設概況,如表1所示。
3 高校圖書館特藏數據庫建設現狀
3.1 特藏數據庫的建設主體
樣本館主要通過自主建設、校內合作、采購租賃三種途徑建設特藏數據庫。就自主建設的特藏數據庫而言,樣本館主要采用委托代理、戰略協作方式,創建具有知識發現與知識擴散功能的特藏數據庫。例如,南開大學圖書館委托具有核心競爭優勢的數據庫運營商開發了周恩來研究專題數據庫。就校內合作建設的特藏數據庫而言,樣本館通過與校內院系建立良好的合作關系,開發了彰顯學科特色與科研成果優勢的特藏數據庫。就采購租賃的特藏數據庫而言,樣本館主要向數據庫開發商與出版機構購買數據庫使用權。例如,中南大學圖書館利用短期租賃與長期租賃相結合的手段,一次性租用了書同文公司開發的書同文古籍數據庫。
3.2 特藏數據庫的收錄內容
從特藏數據庫類型來看,主要包括綜合型數據庫與專題型數據庫。綜合型數據庫的典型代表是文泉學堂天津大學知識庫,該數據庫收錄的文獻類型全面覆蓋圖書、期刊、報紙,橫跨文學、政治、歷史等多個學科[4]。專題型數據庫的典型代表是冶金科學與技術文獻數據庫,該數據庫主要收錄世界鋼鐵統計數據、國內鋼鐵統計數據、冶金歷史數據,存儲了大量半結構化和非結構化的特藏數據[5]。從特藏數據庫資源規模來看,平均每個樣本館特藏數據庫收錄的圖書、期刊、報紙種類超過100種,會議文獻、科技報告、專利文獻、學位論文、標準文獻、科技檔案、政府出版物等特藏文獻種類接近40種。其中,四川大學圖書館等10家樣本館建設了具有較大資源存儲規模的碩博論文數據庫,促進了本校學位論文的保存與利用。
3.3 特藏數據庫的服務功能
目前,高校圖書館特藏數據庫功能主要包括檢索、閱讀與文本處理。就資源檢索功能而言,占比過半的特藏數據庫支持全文檢索、篇目下載、分類導航、文獻聚類等多維度檢索功能。例如,浙江大學圖書館構建的特藏數據庫不僅提供基于關鍵詞與主題詞的全文檢索功能,還支持用戶使用邏輯檢索語言進行高級檢索,通過輸入版次、版名、卷期等限定信息自主擴大或縮小檢索范圍。就數字閱讀功能而言,樣本館特藏數據庫均配備了XML閱讀、IE閱讀、HTML閱讀插件工具,支持原文文本、原文圖像與并排顯示三種閱讀模式。就文本處理功能而言,約有60%的特藏數據庫內置了繁簡轉換、自動標點、文本識別、文本標記等智能插件,支持用戶對特藏資源進行在線或離線深度分析。
4 高校圖書館特藏數據庫建設問題
4.1 特藏數據庫建設質量亟待提升
第一,自主建設的特藏數據庫規模不大。目前,樣本館采用自主建設或合作建設手段開發的特藏數據庫數量,遠遠小于購買或租賃的特藏數據庫。并且不同高校圖書館特藏數據庫的質量存在較大的差異。產生該問題的原因有兩點:一是個別樣本館對于上級部門的財政專項資金依賴程度過高,且不注重發展自籌經費的融資渠道;二是高校圖書館特藏數據庫的支撐平臺相對陳舊,普遍缺乏可擴展能力,致使特藏數據庫質量水平停滯不前。第二,特藏數據庫存在數據重復問題。調研發現,較多高校圖書館未能準確把握用戶需求,且不重視市場調研,進而產生特藏數據庫重復建設的問題。
4.2 特藏數據庫內容的系統性與覆蓋面不高
第一,特藏數據庫內容系統性不強。首先,部分高校圖書館在建設特藏數據庫的初期,忽略了用戶需求分析的必要性,導致特藏數據庫內容缺乏指向性與貼近性。其次,特藏數據庫內容關聯度不高。目前,較多高校圖書館并未從語義化組織與關聯化聚合角度對特藏數據庫內容進行規范化整理,致使海量來源各異、構成復雜的特藏資源得不到及時有效的組織整合。第二,特藏數據庫內容覆蓋面較窄。目前,高校圖書館特藏數據庫雖有系統的館藏特色資源,但仍面臨內容完整性不足的制約。例如,僅有三個特藏數據庫將紀錄片、音視頻資料納入收錄范圍,且特藏數據庫收錄的內容以中文文獻資源為主。
4.3 特藏數據庫服務功能較為單一
第一,特藏數據庫知識挖掘功能較弱。從表1可知,具備數據序化處理、數據分類、數據關聯展現功能的特藏數據庫占比不足三成,難以輔助用戶全方位審視特藏資源發展過程中的融合、演變和分化路徑。第二,特藏數據庫功能的感知有用性與感知易用性不高。目前,高校圖書館特藏數據庫服務功能的用戶認知度和認可度普遍不及預期。造成該問題的原因集中在兩個方面:一是特藏數據庫部分服務功能需要付費或在局域網內方可使用,且各項服務功能尚未實現有機協同;二是部分特藏數據庫不支持熱詞分析、知識圖譜分析、可視化地圖分析等增值功能,可能降低特藏數據庫的用戶感知價值。
5 高校圖書館特藏數據庫建設優化策略
5.1 提升特藏數據庫建設質量
5.1.1 加強特藏數據庫建設的供給能力。第一,高校圖書館應拓寬特藏數據庫資金保障渠道。例如,可在持續爭取財政支持的基礎上,通過課題申報、眾籌眾創、融資租賃等途徑,為特藏數據庫建設注入源源不斷的資金“活水”。具備條件的高校圖書館還可嘗試借助知識付費商業模式出租軟件使用權,以填補特藏數據庫更新維護的資金缺口。第二,高校圖書館可利用多主體合作的方式強化特藏數據庫建設的技術保障。廣州大學圖書館的實踐經驗值得借鑒[6]:一方面,該館與文化傳播機構、教育機構、研究機構建立產學研合作機制,針對特藏數據庫開發、運行與管理等關鍵技術開展合作;另一方面,館方善于借助Oracle、Microsoft和IBM等頭部數據庫公司的技術優勢,完善特藏數據庫底層架構,為特藏數據庫穩定可靠運行打下堅實的技術基礎。
5.1.2 打通特藏數據庫內在聯系。第一,高校圖書館可利用云技術對特藏數據庫進行優化整合。例如,貴州大學圖書館發揮云技術的分布式計算、多源數據融合特色優勢,打造集成化管理商業數據庫與自建數據庫的云平臺,設計基于云技術的元數據異構共享機制,在一站式共享特藏文獻的結構性元數據、描述性元數據和管理性元數據的基礎上,顯著增強各類特藏數據庫的關聯度[7]。第二,高校圖書館可借助聯盟區塊鏈技術促進特藏數據庫資源自由流通與安全共享。聯盟區塊鏈是區塊鏈公有鏈與私有鏈的結合體,具有P2P組網、去中心化存儲、節點權限管理等技術特性,能有效提高特藏數據庫間的信任度、強化特藏資源安全性及規避版權風險[8]。高校圖書館可依托聯盟區塊鏈,構建包含數據層、聯盟鏈系統與應用層的特藏數據庫共建共享框架。在信息傳輸驗證協議、共識機制、智能合約等聯盟區塊鏈核心技術的支持下,館方可較好地解決特藏數據庫共享信任問題。
5.2 完善特藏數據庫內容結構
5.2.1 以用戶需求為導向優化特藏數據庫內容。第一,高校圖書館需提高用戶需求分析的精確度與靈敏度。如借助用戶畫像、興趣建模、行為追蹤、標簽分析技術,動態獲取師生使用特藏數據庫的主觀偏好數據與客觀行為數據,據此分眾化、個性化提煉用戶需求標簽。高校圖書館還應結合師生使用場景、能力素養與體驗反饋的變化情況,持續優化用戶需求數據。第二,高校圖書館應依據用戶真實需求,重設特藏數據庫主題定位與內容框架。例如,河南大學圖書館不僅圍繞課堂教學、學術研究、文化科普三個方面,對師生需求進行分層分類劃分,而且以直擊用戶需求痛點為主旨,開發了林學特藏、生物學特藏兩類主題板塊,讓特藏數據庫更具主題區分度與內容層次性[9]。
5.2.2 拓展特藏數據庫內容的深度與廣度。高校圖書館應加大對各類型特藏資源的梳理與整合力度,從常見文獻與特種文獻收錄平衡的角度擴大特藏數據庫收錄范圍。在文獻類型方面,高校圖書館可將檔案、文書、票證、信件與音視頻資料納入特藏數據庫目錄收錄范疇,并以專題版塊的方式對政策、新聞、圖書等類型的優秀特藏文獻資源進行整合。在時間范圍方面,高校圖書館應延長特藏數據庫內容收錄的時間軸,重點存儲文史資料、口述史料、回憶錄、研究著述等特藏資源。在收藏機構方面,高校圖書館應充分整合檔案館、紀念館、私人收藏者保存的特藏文獻,并對其進行OCR文字識別與元數據抽取,據此充實特藏數據庫內容。高校圖書館還須注重本地特藏資源的采集、挖掘與整理,重點收錄地方志等類型的特藏文獻,為本地特藏資源的二次開發與傳播打好根基。
5.2.3 結構化設計特藏數據庫分類導航體系。高校圖書館可利用基于分面組配的分類導航手段,提高特藏數據庫資源配置效率。分面組配的本質是通過若干類目的組合與配對,對知識結構進行梳理。該方法可用較少的分面組合詮釋復雜的主題概念,具有分面清晰、知識豐富、易于理解等突出優勢。在其支持下,高校圖書館可有效降低特藏資源組織成本。長安大學圖書館便借助分面組配手段創建了包含內容性質與發行時期兩類分面的特藏數據庫分類導航框架[10]:內容性質分面以文獻全文、摘要、后人研究論著為主,發行時期分面涵蓋內部發行時期、多元化渠道時期和數字化網絡化時期三種類目。這種從多個主題分面分類描述特藏資源的做法,既可解決特藏數據庫收錄內容紊亂的問題,亦可對特藏資源進行深度組織。
5.3 增強特藏數據庫服務功能
5.3.1 提高特藏數據庫知識服務能力。第一,提高特藏數據庫資源調用能力。例如,南京理工大學圖書館利用一站式集成檢索方法,將專業檢索、對比檢索等檢索功能整合至同一個功能單元中,并嘗試通過跨媒體知識檢索途徑對多源異構的特藏資源進行無縫集成,輔助用戶一鍵獲取特藏文獻中的關鍵信息[11]。第二,強化特藏數據庫資源分析能力。高校圖書館可借助機器學習、測繪遙感等數字人文技術,為用戶提供內容挖掘、時序分析等資源分析服務,全面支持用戶利用特藏數據進行決策。具備條件的高校圖書館還可引入地理信息技術,對特藏資源進行以地圖為基礎的時空展示,讓用戶從人物與事件、歷史與現實等維度理清特藏文獻間的內在邏輯。第三,增強特藏數據庫資源投放能力。例如,江南大學圖書館利用情境識別技術高精度分析用戶所處的有形情境與無形情境,結合特藏數據庫資源服務的情境要素,分眾化設計特藏資源投放路徑[12]。
5.3.2 延伸特藏數據庫增值服務邊界。高校圖書館應創建兼具功能性與友好性的特藏數據庫增值服務體系,提高用戶的特藏數據內化吸收效率。在特藏數據庫增值服務前端,高校圖書館可開發融合語義特征和分布特征的跨媒體關聯檢索引擎,在精準計算文本、圖像、音頻、視頻等類型特藏資源的相似性、從屬性、相關性與模糊性基礎上,揭示不同模態特藏數據之間的關聯機理,讓用戶一鍵檢索特藏資源中的本體數據和衍生數據。在特藏數據庫增值服務中端,高校圖書館可在數據庫中嵌入多個數字人文統計和分析工具。例如,重慶理工大學圖書館利用可視化地圖工具梳理古籍文獻在各地的傳播路徑,借助時間軸分析工具還原古籍文獻傳播的具體歷程,憑借知識圖譜工具考辨古籍的版本源流[13]。在特藏數據庫增值服務末端,高校圖書館可對數據庫閱讀瀏覽與資源下載功能進行升級改造,支持圖文對讀、頁面復制、分頁顯示等人性化操作模式,并添加“我的批注”“搜索記錄”“我的收藏”等功能模塊,便于用戶實時保存資源檢索結果、資源詳情頁與在線閱讀頁。
6 結 語
本文重點考察了高校圖書館特藏數據庫建設情況,針對性提出了旨在提高特藏數據庫質量、重構特藏數據庫內容、強化特藏數據庫功能的優化策略。在接下來的實踐中,高校圖書館應進一步深化特藏資源數字化加工程度,培養具有較高理論素養與實踐素養的數據庫運維人才隊伍,持續升級特藏數據庫插件工具,筑牢特藏數據庫建設的資源保障、人員保障與技術保障。
[參考文獻]
[1]司新霞.高校圖書館特色資源數據庫建設的現狀分析及對策:以三峽大學圖書館“工程移民”特色資源數據庫為例[J].內蒙古科技與經濟,2024(9):151-153,157.
[2]楊超,李鑫鑫,張惠君.學科需求導向下高校圖書館專業數據庫資源建設探析:以財經高校引進數據庫為例[J].圖書館學刊,2023,45(12):45-50,56.
[3]劉紅艷.高校圖書館發揮地域優勢構建特色數據庫:以浙江海洋大學圖書館“嵊泗漁俗文化特色數據庫”為例[J].內蒙古科技與經濟,2022(11):154-156.
[4]李璟致.基于“冷門絕學”視域的高校圖書館特藏建設探究[J].圖書情報導刊,2024,9(9):1-6.
[5]張影.高校圖書館特藏資源建設現狀與發展策略:以國內42所“雙一流”高校圖書館為例[J].圖書館學刊,2023,45(12):51-56.
[6]張天藝.基于用戶需求的高校圖書館特色資源服務體系研究[D].鎮江:江蘇大學,2024.
[7]韓冰.“雙一流”高校圖書館自建特色數據庫調研與思考[J].圖書館工作與研究,2020(10):84-88.
[8]賈玉文,凌艷博.區塊鏈技術在地方特色數據庫建設中的應用研究[J].河南圖書館學刊,2021,41(7):86-88.
[9]盧祖丹.“雙一流”建設高校圖書館特色資源建設現狀及對策[J].河南圖書館學刊,2020,40(8):41-43.
[10]穆旋,張宏斌.陜西高校圖書館特色館藏建設類型分析及建議對策[J].山東圖書館學刊,2022(3):33-39.
[11]黃運紅.大數據時代高校圖書館事實數據庫建設的思考[J].大學圖書館學報,2020,38(5):34-40.
[12]王慧.江蘇省“雙一流”高校圖書館自建特色數據庫調查研究[D].合肥:安徽大學,2022.
[13]陳以敏,張青青.數字人文下高校圖書館手稿特色數據資源庫建設研究[J].圖書館,2021(6):87-93.
[作者簡介]王 颯(1987—),女,博士,館員,黑龍江工程學院圖書館;周 楠(1982—),女,本科,館員,山東第一醫科大學(山東省醫學科學院)圖書館。