中圖分類號:G258.6 文獻標識碼:A 文章編號:1003-1588(2025)04-0085-04
特藏資源是圖書館在長期發展過程中積累的在某一方面具有規模性、結構性、特色性的文獻資源或數據資源1,其差異化內容是區別于其他圖書館的重要標志。受經費有限、開發成本高、專業人員缺乏等因素制約,高校圖書館的特藏資源建設多為紙質特色文獻資源保存和收藏。“只藏不用”“多藏少用”是現階段多數高校圖書館特藏資源建設的情況[2]。2021年,教育部高校圖工委和北京大學圖書館合作研制的《大學圖書館現代化指南針報告》指出,加快特藏資源建設是5年內大學圖書館資源建設亟待加強的問題之一[3]。隨著信息技術的迅猛發展,數字人文作為一種新的研究方向和研究方法,為人文資源的挖掘和利用提供了機遇,高校圖書館需應勢而謀,順勢而為,積極開展特藏資源建設,實現數字化轉型。
1高校圖書館特藏資源建設現狀
特藏資源是圖書館文獻資源體系的重要組成部分。筆者梳理我國42所“雙一流\"大學圖書館資源建設情況后發現,多數高校圖書館是基于自身館藏資源優勢,圍繞古籍特藏、地域特藏、名人大家特藏或某一專題領域等開展特藏資源建設,如北京大學數字圖書館的古文獻資源庫“秘籍琳瑯”西北工業大學圖書館的姜長英航空史料館等。特藏資源建設有助于系統性保存珍貴文獻,為學術研究提供資源支持。
當前,高校圖書館的特藏資源建設逐漸從紙質文獻保存轉為數字化存儲。但是,在資源組織和揭示方面,特藏資源數據庫還停留在簡單元數據著錄、全文掃描、圖像存儲的初級建設階段,尚未完全實現組合檢索、全文檢索及關聯發現等功能,加之訪問受限,使特藏資源價值難以得到充分發揮。針對高校圖書館特藏資源庫建設存在的問題,本研究從數字人文視角出發,探討如何將數字人文技術和方法應用于特藏資源建設,為特藏資源建設提供新思路、新路徑。
2數字人文視域下國內外高校圖書館特藏資源建設
數字人文是數字技術和人文研究的跨學科結合:從人文角度看,是用數字技術解決人文問題,推動人文研究的數字化[4],即通過量化統計、文本挖掘、關聯數據、可視化分析等數字技術和工具將研究對象數字化,以支撐、保障、創新人文科學研究的內容、方法和模式5;從技術角度看,是以人文方式發展數字技術,讓數字技術更具有人文性[,即以包容和開放的姿態關注技術發展中的人文需求,讓數字人文工具更好地服務于人文研究。
不少歐美高校圖書館將數字人文作為實踐轉型的新方向和重構自身價值的新契機,探索通過各種方式為學者提供數字人文的相關支持。例如,英國劍橋大學圖書館主導設立數字人文實驗室,為珍貴手稿光影成像、經度檔案編輯等多個數字人文項目提供資源、工具和技術支持[;美國亞利桑那州立大學圖書館依托特藏資源發展特色服務,成立地圖與地理空間中心,整合地圖、影像資料、空間數據等資源,搭建數據資源門戶與物理協作空間,提供不同層次的地理信息服務[8]。
我國高校圖書館數字人文實踐起步較晚,部分高校圖書館與公共圖書館通過數字人文項目開展實踐探索。例如,上海外國語大學圖書館收集、整理、挖掘俄羅斯文學資源,建立具有知識倉儲功能的特色文獻庫,便于學者開展文本挖掘統計和語義分析研究[9;上海圖書館圍繞館藏及地域特色資源開發了家譜知識服務平臺、盛宣懷檔案知識庫等資源庫,同時建立數字人文項目開放數據競賽平臺[10],吸引眾多學者參與“溯古述今智創未來”數字人文項目,使很多碎片化的人文資源煥發出新的價值。
3數字人文視域下高校圖書館特藏資源建設實踐案例分析
3.1浙江大學智慧古籍平臺介紹
浙江大學智慧古籍平臺是浙大文學院數字人文中心主任徐永明教授團隊開發的一款古籍智慧大數據平臺,旨在使古籍文獻“活起來”。團隊成員來自浙江大學多個學院和部門,包括計算機科學與技術學院、地球科學學院以及校圖書館等[11]。由不同專業背景成員組成的跨學科團隊致力于探索大數據和文史深度融合的數字人文之路,先后開發了學術地圖發布平臺和智慧古籍平臺。其中,智慧古籍平臺是借鑒知識圖譜理念,綜合運用OCR識別、自動標引、數據關聯、空間分析、網絡分析等數字技術,將中國古典文獻和研究成果圖譜化、智能化,打造集古籍查詢、閱讀、研究、欣賞于一體的古籍大數據平臺[12]。
3.2平臺建設特點
3.2.1結構化的數據組織。古籍數字化建設離不開結構化的數據組織,結構化數據使古籍內容便于檢索、訪問、存儲和管理。浙江大學智慧古籍平臺建設依賴光學字符識別(OCR)技術和智能標點技術,通過OCR技術生成初篩文本,輔助人工校對實現古籍文本化,依托數億字已標點古籍進行機器學習,實現文本自動標點。后臺數據庫從著述、篇目、專題、工具書庫等方面描述與組織數據,以篇目為單位著錄元數據,揭示題名、責任者、版本、卷冊、朝代、收藏地等,并根據文體、地域、朝代等進行分類,形成層級分類體系,支持精確檢索與知識發現。
3.2.2細粒度的知識發現。浙江大學智慧古籍平臺依托知識圖譜技術進行深層次、細粒度的知識發現,如:通過文獻自動標引和實體識別抽取文本中的時間、人名、地名、職官等信息,并與工具書庫關聯,實現數據單元細粒度、知識化和語義化揭示;基于圖譜數據庫構建實體關系網絡,實現知識要素多維度關聯;利用地理信息系統(GIS)對古籍文本中的地理信息進行可視化呈現,同時,對地點的釋義以及著者行跡的關聯分析也為古籍內容解讀和潛在關聯挖掘提供了新視角。
3.2.3交互式的平臺應用。依托后端的結構化數據組織與知識圖譜技術,浙江大學智慧古籍平臺展現出強大的人機交互功能,為用戶提供了便捷化查詢瀏覽、可視化內容呈現、深層次研究等服務,實現了古籍資源的重構、活化和再利用。直觀交互式的頁面設計讓平臺功能布局一自了然,著述導覽、著者導覽、關系圖譜等導航欄為用戶提供了不同維度的查詢人口。除文本閱讀外,平臺還提供圖文對照、劃詞標引、關鍵詞釋義、文本關聯、地圖關聯等功能,大大降低了用戶的閱讀門檻。
4數字人文視域下高校圖書館特藏資源建設框架
數字人文視域下的高校圖書館特藏資源建設本質上是將數據思維應用于特藏資源建設,在實踐上則是通過數字技術將紙質特藏資源進行數字化重構,對知識內容進行深度開發,在實現古籍資源活化利用的同時,創新人文研究的模式和方法。通過浙江大學智慧古籍平臺建設不難發現,特藏資源的建設經歷了從數據到知識再到應用的價值轉化過程。本研究借鑒浙江大學智慧古籍平臺建設思路,提出了面向數字人文的ODS(Organiza-tion-Discovery-Service)特藏資源建設框架,即數據組織(O)、知識發現(D)、智慧服務(S),數據組織是特藏資源數字化建設的基石,知識發現是特藏資源價值開發的手段,智慧服務是特藏資源活化利用的有效途徑,詳見圖1。

4.1 面向集成的數據組織
特藏資源種類多樣,除古籍特藏外,方志、手稿、家譜等文獻也蘊藏著豐富的人文研究價值,要想將這些異構資源從物理堆積轉變為數字化呈現,有賴于數據層的資源整合、標準化著錄標引以及相關圖文識別。本體和關聯數據在特藏資源整合中發揮了很大作用,其中本體為異構資源的語義標注提供了詞匯標準,解決了語義異構性問題,為資源語義化組織和統一語義檢索提供支持,基于資源描述框架(RDF)和統一資源標識符(URI)技術的關聯數據則增強了資源的可訪問性,二者相輔相成,實現了數據的互聯與集成利用[13]。特藏資源的描述與著錄要參考相關標準,如《國際標準檔案著錄規則(總則)》ISAD(G)《圖書館館藏資源數字化加工規范第3部分:圖像資源》(GB/T31219.3-2014)等[14]。統一且具有擴展性的元數據著錄規則有助于資源整合和存儲。
4.2 面向內容的知識發現
對資源內容進行挖掘和關聯揭示是特藏資源價值得以展現的關鍵。高校圖書館要想實現特藏資源由數據到知識的轉換,就需要利用數字人文技術對不同粒度知識單元進行加工處理和深度發現,如:在文本層面對人、時、地、事、物等進行細粒度抽取標注,在語義層面對概念、詞匯進行關聯和深層含義揭示。文本分析、語義關聯、主題挖掘等技術為面向內容的知識發現提供了關鍵技術支持。此外,高校圖書館還要根據特藏資源的類型和內容特點進行多角度挖掘,并選擇適合的方式呈現其潛在的關系,如:對于有來往特征的書信可采用知識圖譜、時空視圖揭示其來往關系和時空跨度,對于有地理特征的地方志可使用GIS幫助研究人員更好理解資源的地理分布和空間關系。
4.3 面向用戶的智慧服務
特藏資源數字化建設的最終落腳點在用戶,在應用層面,高校圖書館要建立以用戶為導向的特藏資源智慧服務體系,推動服務向智慧化、交互化方向發展,如:提供多樣化的檢索方式,便于用戶快速定位相關資源;設置量化統計功能,為用戶提供文學作品遠讀視角的解讀,實現遠讀和細讀的互補;采用圖譜化呈現方式幫助用戶直觀理解資源內容,實現人與資源之間的交互式對話;提供專題文獻檢索服務,滿足用戶多樣化、個性化需求。此外,共建共享也是高校圖書館特藏資源建設的主要任務之一,建立完善的特藏資源共建共享保障體系有助于提升資源建設效率和資源利用率,是特藏資源活化利用的重要方式。
5結語
資源是圖書館賴以生存的根本,服務是圖書館實現其價值和使命的關鍵途徑。數字時代對高校圖書館的資源和服務都提出了新要求,館藏資源數字化、服務智慧化是未來的大勢所趨。數字人文視域下高校圖書館特藏資源的重構和再利用要整體布局、合理規劃,其數字化建設不僅要依賴先進的數字技術,還需依托跨學科、跨機構的協同合作,根據資源特色、學科特點等進行多維度資源組織和深層次內容開發,使特色資源建設跟上時代發展步伐,最大限度實現特色資源的活力釋放。
參考文獻:
[1]劉洋.圖書館紅色特藏資源建設與價值發掘研究[J].圖書館,2024(4):81-87.
[2]朱若星,楊夢潔,趙婉忻,等.“大先生\"視角下學者文庫文化育人功能與實踐探究:以西北工業大學“姜長英航空史料館”為例[J].新世紀圖書館,2023(8):40-46.
[3]陳建龍,邵燕,張慧麗,等.大學圖書館現代化指南針報告[J].大學圖書館學報,2022(1):22-33.
[4][6]曾軍.數字人文的人文之維[EB/OL].[2025-02-12]. https://www. cssn. cn/skgz/bwyc/202208/t20220803_5458948. shtml.
[5]郭金龍,許鑫.數字人文中的文本挖掘研究[J].大學圖書館學報,2012(3):11-18.
[7]郭丹丹.國外高校圖書館數字人文實驗室研究:以劍橋大學圖書館為例[J].山東圖書館學刊,2021(3):93-97.
[8]宋家梅,閆娜.大學圖書館數字人文實踐創新案例分析與啟示:以美國亞利桑那州立大學地理信息服務為例[J].圖書館,2023(12):51-57.
[9]蔡迎春.特色資源建設中的數字人文應用進展研究:基于國內數字人文相關項目及實踐案例[J].圖書館建設,2018(7):18-24.
[10]數字人文服務[EB/OL].[2025-02-12].https://www. library. sh. cn/service/service/11.
[11]江南,竇瀚洋.浙江大學徐永明團隊打造古籍智慧數據共享平臺:用科技手段激活古籍瑰寶[N].人民日報,2023-06-27(06).
[12]智慧古籍平臺:科技賦能,讓古籍“活起來”[EB/OL].[2025-02-12]. https://news.cri. cn/n/20220616/925299b9-a08a-5eab-2ce9-724f14305e98. html.
[13]魯丹,李欣.整合異構特藏資源構建數字人文系統[J].圖書館論壇,2018(10):38-46.
[14]苗青,李彥霖,蔡聞桐,等.ISAD(G)應用于國內圖書館特藏資源著錄標準研究及實踐初探[J].大學圖書館學報,2023(2):78-86.
(編校:徐黎娟)