中圖分類號:G255.1 文獻標識碼:A 文章編號:1003-1588(2025)08-0027-05
古籍是傳承中華優秀傳統文化的豐厚載體,是歷久彌新的精神財富。古籍數字化不但實現了對古籍原件的保護,還突破了時空限制,讓古籍更廣泛地傳播和共享成為現實。公藏機構尤其公共圖書館是古籍最重要的皮藏地之一,2024年“全國古籍普查登記基本數據庫”顯示:新增發布了55家單位古籍的普查數據116,346條、1,009,870冊,目前已累計發布319家單位古籍普查數據941,708條、8,982,920冊]
筆者認為,古籍數字化除了商用數據庫,大致還可以劃分為公藏單位建設和個人建設兩種形式。二者都以公益性為原則,但在資源選用標準、技術手段、用戶體驗等方面有顯著差距。目前,關于古籍數字化的研究成果相對較多,但以公共圖書館和個人的古籍數字化比較為視角的研究幾近于空白。筆者就此進行粗淺探討,以期為古籍數字化尤其是公共圖書館的古籍數字化工作提供些許有益借鑒,
1古籍數字化的兩種形態
1.1公共圖書館的古籍數字化
《國家圖書館“十四五”發展規劃》提出,要推進古籍保護數字化建設,建設中華古籍影像數據庫、全文數據庫,重點推進古籍專題數字化項目,促進古籍數字資源便捷使用和開放共享。至2025年1月10日,國家圖書館(國家古籍保護中心)共組織召開了10次古籍數字資源聯合發布會,全國累計發布古籍及特藏文獻影像資源超過15.8萬部(件)。其中,國家圖書館建設的“中華古籍資源庫”的專題資源庫達到29個,發布古籍影像資源超過10.6萬部(件),45家單位發布古籍資源超過5.2萬部(件)[2]。筆者對部分公共圖書館古籍數字化情況加以統計,具體見下頁表1。
從表1可見,公共圖書館古籍“重藏輕用”的舊有觀念已經有了很大轉變,越來越多的圖書館通過建設古籍數據庫、舉辦展覽、影印出版、文創產品開發等多種形式,生動、多元地讓古籍走進大眾視野。就古籍數字化工作而言,古籍專項經費、豐富的館藏、相關人才儲備等都是保證公共圖書館古籍數字化工作深入開展的有力保障。
1.2個人古籍數字化
個人古籍數字化主要以個人創建、維護、運營的網站為主,以展示、研究、傳播古籍數字資源和傳承優秀傳統文化為核心。這類網站通常聚焦古籍文獻的內容分享、學術研究、知識普及等,旨在
收稿日期:2025-07-10
作者簡介:婁明輝(1979—),,遼寧省圖書館(遼寧省古籍保護中心)研究館員;薛立靜(1969—),遼寧省圖書館(遼寧省古籍保護中心)副研究館員。
本文系2024年度遼寧省公共文化服務中心重點課題“地域歷史典籍賦能遼寧省文旅高品質融合發展研究”的階段性研究成果之一,課題編號:2024zxyjkt-001。
為特定用戶群體(如古籍研究者、傳統文化愛好者、學生等)提供專業、便捷的古籍資源服務。筆者認為目前做得非常好的有國學大師和書格。限于篇幅,筆者主要以書格為研究對象。
表1部分公共圖書館古籍數字化概況

書格成立于2013年,是一家自由開放的數字圖書館,致力于開放式分享、介紹、推薦有價值的古籍善本,并鼓勵將文化藝術作品進行數字化歸檔。其宗旨是“每個人都能自由地看到我們的文明”。分享內容限定為公共版權領域的書籍(參照《伯爾尼公約》);最大限度地還原書籍品貌、內容;使每個人都能自由、免費地欣賞到那些難以現世的書籍,并從中感受到人類文明進程[3]
目前,書格發布了超過3,260種已進入公共版權領域的古籍和繪畫、書法及影像資源,其中古籍涵蓋宋元珍本、明清善本。書格發布的書籍多為高清彩版,大部分書籍單頁寬度在1,400像素以上,跨頁寬度在2,400像素以上,確保用戶能夠清晰地看到古籍的每一個細節,幾近于真實還原書籍品貌。書格在古籍的篩選上更傾向于選擇藝術類、影像類、珍稀類以及部分刊印水平較高的典籍,保證其具有非常重要的文化價值、歷史價值和藝術價值。
2 兩種古籍數字化的分野
公共圖書館是我國古籍皮藏的重地。推進古籍數字化建設,建設集成式的中華古籍數字資源庫,實現古籍的全文檢索、知識發現,促進古籍的便捷使用和開放共享,是近年來公共圖書館古籍數字化建設的自標和努力方向。書格是通過網絡讓每一個人都能自由、免費地欣賞到全球范圍內已經全文數字化的古籍精品。二者的目標在具有高度契合性的同時,也各具特色。
2.1 古籍來源與內容
書格的文獻來自世界各地圖書館或機構的公開內容,包括世界數字圖書館、互聯網檔案館、香港中文大學圖書館、京都大學圖書館、公文書館(日本內閣文庫)、日本國會圖書館、早稻田大學圖書館、東洋文庫(數字絲綢之路項目)、哈佛大學圖書館、美國國會圖書館、普林斯頓大學圖書館、宮內廳書陵部、法國國家圖書館、德國柏林國立圖書館、巴伐利亞州立東亞圖書館、大英圖書館、京都府立京都大學、博德利圖書館(牛津大學)、牛津大學博德利圖書館、不列顛哥倫比亞大學圖書館等。
公藏單位古籍數字化的來源主要是各古籍收藏單位皮藏的珍貴古籍資源和特色資源,如:國家圖書館建設的數字古籍、數字方志、趙城金藏、宋人文集、碑帖菁華、甲骨世界、少數民族文獻特藏等古籍數據庫。浙江圖書館藏珍貴古籍數據庫發布的古籍多為明清時期著名學者重要著作的稿抄本和明代中期的刻本。湖北省圖書館主要發布了地方志和家譜,其中方志共發布107種、757冊、63,000余拍,家譜92部、1,096冊。南京圖書館建設了稀見方志全文影像數據庫和清人文集全文影像數據庫兩個專題庫。
從內容上看,書格除了側重古籍的珍稀性,也兼顧其藝術性和實用性。因此,書格對版畫精美的圖譜,中醫古籍,史地類、藝術類古籍都有收集。書格善于發掘古籍內容的獨特性,即便并非宋元善本,但研究價值高、藝術性強、國內獲取困難的古籍都在優先考慮之列,因此其古籍資源內容多引人入勝。公共圖書館古籍保護工作主要參照新時代文物工作的22字工作方針,即“保護第一、加強管理、挖掘價值、有效利用、讓文物活起來”,因此在保護好古籍原件的基礎上,緊密結合館藏特色,建設相應的古籍特色專題庫,用于滿足專業用戶的研究需求是其優先考慮的方向。在古籍版本的珍稀程度、文獻的學術價值和古籍數據著錄的標準化等方面,公共圖書館的古籍數字化有其自身優勢,在數字化的規模上也是書格所不能比擬的。
2.2技術手段
書格主要基于開源的WordPress以及付費主題Enfold修改建設網站內容發布系統,使用了vultr服務器(后端) + 阿里云DCDN網站服務器,并在美國、巴黎、日本、中國香港等地還設有5臺服務器,用于輔助運算和資源獲取。同時,網站還使用短鏈服務和文件存儲與同步功能。網站的維護和內容發布由網站創建者一人承擔,支持Chrome、IE等多種瀏覽器訪問。
公共圖書館的古籍數字化有嚴格的制作、元數據著錄、發布等流程,而非簡單掃描書影并上傳至服務器[4]。國家古籍保護中心編制的《古籍數字化工作手冊(試用本)》以及《GBT31219.3—2014圖書館館藏資源數字化加工規范第3部分:圖像資源》國家標準等成為公共圖書館進行古籍數字化的遵循。同時,公共圖書館采用先進的數字化設備和技術,如高分辨率掃描儀、OCR(光學字符識別)技術等,以提高古籍數字化的準確性和效率。因此,以國家圖書館(國家古籍保護中心)為代表的古籍收藏單位所發布的古籍數字化資源,種類豐富,數量較大,且這些古籍資源皆為館藏原本影像資源,來源可靠,著錄標引信息完整,圖像質量較高,可充分滿足社會公眾和研究人員的需求[5]
近年來,公藏單位的古籍數字化呈現兩個重要的新特征:一是古籍智慧化程度顯著提高。《2021一2035年國家古籍工作規劃》指出,要進行古籍數字化支撐體系建設,包括“加強文字識別、自動標點校勘注釋、實體命名、機器翻譯、文本自動分類、區塊鏈等技術研發應用。”[6例如,“中華古籍智慧化服務平臺”除具備影像文本對照閱讀、一框式檢索、分類導航等基礎功能外,還基于大語言模型提供自動句讀、實體標引、文白翻譯、圖譜可視化、AI助手等知識展示和閱讀輔助功能,同時集成多種智能工具和專業字詞典,為讀者閱讀、研究和學習古籍提供便利,滿足不同用戶群體的個性化需求[7]。AI文字識別、自動OCR、自動句讀和自動翻譯等智能工具的應用,有效提升了公共圖書館古籍數字化工作的智慧化水平。二是聯動性明顯增強。一直以來,由于種種原因,古籍數字資源各自建設是困擾公藏單位古籍數字化發展的一大難題。近年來,包括“中華古籍智慧化服務平臺”“江蘇省古籍數字資源集成平臺”“湖北歷史文獻資源平臺”“山東省古籍數字資源平臺”“浙江省歷史文獻數字資源總庫”等,基本實現了統一標準建設、數據互聯互通、服務功能互補,為研究者和古籍愛好者提供了極大的便利。通過公藏單位內部的緊密協作,形成合力,真正實現一體化的古籍智慧平臺,是公藏單位古籍數字化建設的必然之舉。
在數字資源的保存方面,公藏單位有完整的數據備份和長期保存策略,可保證古籍數據的絕對安全,且更為規范化和專業化。書格雖然有數臺服務器用于數據備份,但囿于經費有限,難以長期支持一個獨立的大容量硬盤、帶寬足夠的服務器。因此,書格采用了變化性較強的網盤下載方式,存在數據存儲和下載風險,凸顯了專項經費在古籍數字化工作中的重要支撐作用。
當然,由于許多古籍公藏單位采用外包的形式進行古籍書影的掃描和后期制作,各單位采用的數據庫架構也多有不同,古籍書影的分辨率、元數據著錄質量等也參差不齊,降低了數據庫的質量標準,為今后古籍智慧平臺建設的OCR識別、全文檢索、知識圖譜等增加了人力、物力成本。
2.3用戶體驗
作為非營利性的古籍開放獲取平臺,“可獲得性”與“易用性”是書格的鮮明特征。書格的網站設計強調簡潔性與開放性,古樸典雅,于細節處體現了傳統文化之美,雖然沒有復雜的檢索功能,但通過分類、介紹、推薦、專題等方式能滿足用戶的大多數需求。書格的網頁設計體現了“以用戶為中心”理念,用戶無須注冊和付費即可自由瀏覽、下載。每部古籍都提供書影預覽、內容簡介、目錄以及行款版式、序跋、鈐印、館藏等有價值信息,并提供高清彩色和黑白兩種格式的下載鏈接,極大地方便了用戶查閱和研究,也降低了古籍的使用門檻和利用成本。
出于文獻保護和數據安全的考量,公共圖書館的古籍數字化成果在用戶體驗、數據開放等方面仍存在不足,如:部分數據庫僅限館內訪問或需要館外認證,有的數據庫在內容設置、網頁風格、用戶操作等方面不盡如人意,影響了用戶的使用意愿。近年來,隨著“中華古籍資源庫”等數據庫的發布,用戶無須注冊即可登錄閱覽古籍全文影像,并基本實現了各子庫資源的統一檢索。但對于文獻的下載,絕大多數公藏單位的古籍數據庫都有嚴格限制。
書格還提供一個開放的交流區,分為文獻研讀、資源分享、文獻情報、技術交流等板塊,古籍愛好者可以就古籍和傳統文化暢所欲言。用戶也可以將開放的資源用于藝術創作、設計、文創等,激活了古籍的現代生命力。《關于推進新時代古籍工作的意見》指出,鼓勵社會各界積極參與古籍事業。目前,公藏單位的古籍數字化在書目選擇等方面多由古籍存藏單位決定,讀者大多只能作為單向信息接收者,二者間的互動性還有一定的提升空間[8]。因此,公共圖書館今后的古籍數字化工作一方面應充分運用知識挖掘、圖譜分析等數字人文技術,從多視角深度挖掘古籍資源的關聯,為用戶的使用提供便利,同時可適當通過虛擬現實、人工智能等技術搭建古籍沉浸式應用場景,并鼓勵用戶通過文學、繪畫、音樂、短視頻等形式對古籍數字資源進行“二次創作”[9]。另一方面可鼓勵用戶參與古籍數字化建設的相關環節,如:用戶可以加入古籍數字化全文校對,根據自身的喜好,在古籍數字化平臺形成自己的古籍知識專題,還可以對古籍數字化的選目、平臺設計等提出寶貴意見,并對數據庫中的錯誤提供及時的反饋等。
3 兩種古籍數字化的合作
近年來,古籍收藏單位通過社會化合作,在古籍數字化、古籍活化等方面卓有成效,如:《永樂大典》高清影像數據庫(第一輯)就是由國家圖書館委托國家圖書館出版社聯合北京大學數字人文研究中心合作建設的。書格近年來在古籍愛好者中有較高的口碑,對中華優秀傳統文化的傳承做出了重要貢獻。二者各有其優勢和特色,可以通過挖掘雙方的合作潛力,形成優勢互補,更好地助力古籍保護工作的深入和可持續發展。具體做法包括:一是對古籍資源的揭示與共享。公共圖書館擁有豐富的古籍資源,但部分資源可能因種種原因未能充分展示和利用。通過與書格的推介和揭示,公共圖書館以鏈接的方式能夠將這些古籍以數字化的形式呈現給更廣泛的受眾,使原本分散在各個公藏單位的古籍資源得以匯聚,讓更多人在了解公藏單位古籍館藏的同時,為學術研究、文化傳承等提供更豐富的素材。在古籍數字化成果共建共享方面,雙方可以建立分級授權制,即公藏機構保留古籍的原始版權和高級別數字版權,書格獲得特定使用權限,在平臺上提供公開瀏覽和低清晰度下載服務。這種模式既保護了公藏機構的權益,又實現了資源的社會化利用。由于書格網站能清晰地展示古籍資源的動態更新,用戶可以及時了解公藏單位古籍數據庫的建設完善情況。二是數字化技術的融合。書格的網頁設計和文件存儲很有自身特色。靜態文件云服務器保證了整個網站的加載速度,而輔助服務器既是文件橫向展示平臺,也是書格所有古籍數字化資源匯集的一個總服務器,承擔所有資源的鏈接服務[10]。公共圖書館的古籍數字化和書格相比雖然有很大不同,但二者在古籍數字化的技術方面仍有相互借鑒之處,如:二者合作完善古籍元數據著錄標準,開發兼容書格簡易標準與圖書館復雜標準的轉換工具;開發古籍智慧化服務平臺網站;建設二者間的統一檢索引擎;定期舉辦技術分享,讓古籍用戶參與古籍數字化建設。由于資金的持續性供給不足,書格在古籍的智慧化服務等方面心有余而力不足,今后可以與公藏古籍收藏單位合作,不斷挖掘合作潛力。三是傳統文化的傳播。書格對于公藏單位古籍數字化工作的重要啟示之一就是要轉變思維觀念,摒棄以往“重藏輕用”的理念,通過數字化和智慧化服務讓古籍中蘊含的深厚文化底蘊通過多種途徑為大眾所了解。雙方可以通過組織學術研討會、策劃古籍專題展、推動古籍數字人文發展等途徑,實現優秀傳統文化的
傳承發展。
4結語
筆者對書格和公共圖書館的古籍數字化情況進行了粗淺的分析和探討,發現二者在古籍資源來源、技術手段、用戶體驗等方面有顯著差異。書格主要通過個人力量整合全球的古籍資源,但面臨資金、人才等方面的挑戰。公共圖書館在資源、資金、技術和人才等方面有自身優勢,但在資源開放理念、平臺體驗、知識服務等方面也有亟待完善之處。雙方在古籍資源的揭示與共享、新技術手段的應用和古籍活化等方面可以展開合作,甚至是良性的競爭,以營造多元協同的古籍數字化生態體系,共同服務于中華古籍的保護與傳承,讓古籍在數字時代真正“活”起來。
參考文獻:
[1]第十次古籍數字資源發布新增發布古籍資源18705部(件)[EB/OL].[2025-01-15].http://www. xin-huanet. com/ci/20250111/ad234b2e376c418c8146af6021b42f0f/c.html.
[2]國家圖書館(國家古籍保護中心)舉辦第十次古籍數字資源聯合發布活動“中華古籍資源庫”首次發布澳門存藏古籍[EB/OL].[2025-01-15].https://news.qq.com/rain/a/20250110A08BE100.
[3]關于書格[EB/OL].[2025-01-15].https://www.shuge.org/shier_sui/.
[4]趙長波.古籍數字化元數據著錄與古籍糾繆:以遼寧省圖書館為例[J].圖書館學刊,2023(7):93-97.
[5]趙文友.基于開放共享理念的古籍數字資源服務:以“中華古籍保護計劃”為中心[J].古籍保護研究,2020(2):21-28.
[6]2021—2035年國家古籍工作規劃[EB/OL].[2025-01-15].https://www.doc88. com/p -99459236384458. ht-ml? s=relid=1 :
[7]關于中華古籍智慧化服務平臺[EB/OL].[2025-01-15]. https://guji.nlc. cn/popularization/about?linkName Σ=Σ
[8] 劉洋,董與思.用戶視角下古籍數字化工作創新發展路徑探析[J].中國出版,2023(12):35-39.
[9]5000多部古籍等你“二創”“江蘇省古籍數字資源集成平臺”今啟用[EB/OL].[2025-01-15].https://www.xhby.net/content/s67693079e4b033844ab1ffd5.html.
[10]李曉源.古籍開放存取的世外桃源:書格[J].山東圖書館學刊,2015(1):50-52.
(編校:周雪芹)