李 蓓
(中國國家圖書館,北京 100081)
民國時期,中國社會發生了急劇變化,形成了獨特的歷史景觀。 這一時期內積累的大量書報刊、檔案、圖片、聲像資料等類型的歷史文獻具有鮮明的時代特征,作為反映當時政治、軍事等社會基本領域狀況的原始記錄及轉型期思想文化的特殊載體,具有重要的研究價值及鑒往知來的歷史意義。 對于民國文獻的搶救與保護日益受到社會關注,特別是國家圖書館聯合公共圖書館以及國內各級各類文獻收藏機構共同施行“革命文獻與民國時期文獻保護計劃”后,文化和旅游部、財政部以及業界、相關專家學者在民國文獻的原生性和再生性保護上給予了大力支持。伴隨文獻普查、海內外文獻的征集出版、文獻保護技術研究等工作的有序推進,民國文獻的保護和利用取得了階段性成果。
筆者根據32家公共圖書館的官方網站、年鑒、年報等相關資料,將各館民國時期文獻數據庫建設情況進行梳理,如表1 所示。 河南、青海、寧夏、新疆、西藏、內蒙古圖書館未檢到相關民國文獻數據庫,未計入以下調研數據。

表1 民國文獻數據庫建設情況統計
以調研情況來看,26家公共圖書館已開發數據庫的總量近200個,自行開發數量的占比超一半。 筆者按照各館所屬省份,劃分為華北、華東、東北、華中、華南、西北和西南地區7 大地理區域,就各地區內自建資源較為典型的圖書館數據庫情況作簡要說明。
1.1.1 華北地區公共圖書館
從民國文獻數據庫的自建和外購數量分布來看,國家圖書館在數量比重上最為均衡。 資料顯示,國家圖書館2019年館藏數字化建設資源46 005 種,其中民國時期文獻12 785 種,種數位居第二位,占比27.8%[1]。 較早開發且已成規模的“民國圖書數字化資源庫”“民國中文期刊數字資源庫”,目前分別提供63 000 余種民國圖書、4 597 種民國期刊,并本著“邊建設、邊服務”的原則持續增加更新。
1.1.2 華東地區公共圖書館
上海圖書館研發的“民國時期期刊全文數據庫(1911—1949)”和“中國近代報紙數字文獻全庫”在建庫成效上較為突出。 前者目前可對22 882 種近代期刊進行全文檢索[2],后者收錄1850—1951年間的4 000份中英文報紙,不僅包括眾多知名大報,還特別收錄了近千份獨具特色的小報[3],較為完整地呈現了中國近代報紙業風貌。 南京圖書館利用其70 余萬冊民國藏書,圍繞圖像資源開發的專題數據庫比例達到67%。
1.1.3 東北地區公共圖書館
遼寧省圖書館藏有豐富的東北地方文獻。 該館自2000年利用縮微膠片、數字化等方式對館藏民國文獻實施再生性保護,至2001年底便完成民國圖書書目數據庫的回溯建庫任務[4],為后續持續進行館藏資源建設奠定了基礎。 據筆者統計,2014—2020年間,該館自建數據庫數量由39個增至65個[5]。 從橫向對比角度,截至2020年,已建成民國相關數據庫19個,在該地區乃至全國范圍內占據絕對的數量領先優勢。
1.1.4 其他地區
除上述地區圖書館外,筆者查詢到的自建有民國文獻數據庫的主要還有華南地區的廣東省立中山圖書館以特色文獻館藏資源建成“解放前廣東報刊”“解放前廣東輿圖”等書目數據庫,西北地區的陜西省圖書館“陜西省圖書館館藏民國報紙目錄”“陜西近代報紙(含影印本)目錄”等,西南地區的重慶圖書館“重慶圖書館民國期刊書目信息”“老照片資源庫”,華中地區的湖北省圖書館“辛亥革命專題資源庫”等。 以上列舉圖書館的數據庫資源總量在相應地理區域中的占比分別為79%,67%,50%,73%,在地區范圍內各具示范和代表性。
數字出版商業機構順應民國文獻保護及資源建設之勢,加之商業用途考量,集中技術資源以推出近代文獻數據庫特別是民國文獻為主的數據庫產品。調查范圍內有5家商業機構的數據庫產品因收錄內容豐富、特點鮮明,文獻開發程度較高,得到多家公共圖書館的認可并被購入使用,具備較大的市場影響力,如表2 所示。

表2 商業數據庫概況
公共圖書館通過對各收藏單位的民國文獻資源進行整合,建立聯合共建共享數據庫,主要有國家圖書館“革命文獻與民國時期文獻聯合目錄”“地方館老照片”等。 截至2020年年底,前者已匯集由37家普查成員單位共同合作完成的70 余萬條普查數據,包含民國圖書30萬種,民國期刊1.4萬種,民國時期報紙4 000 余種。 后者目前收錄重慶圖書館的《“巴蜀古鎮”圖文資源庫》、新疆生產建設兵團文化中心的《新疆生產建設兵團發展歷史圖片》、上海圖書館的《近代上海歷史老照片》等,旨在推動資源共建共享。 此外,廣東省立中山圖書館聯合香港中央圖書館和澳門中央圖書館共建的“粵港澳古籍民國文獻網上資源共享平臺”,囊括粵港澳3家圖書館現有民國文獻、地方文獻等特藏全文數據,以分布共享方式為三地讀者提供數字資源服務。
調查樣本中,全文數據庫所占比重0%~30%的公共圖書館有6家,31%~60%的有9家,60%以上的10家。 專題數據庫的占比在3個區間段所對應的公共圖書館數量分別為10家、9家、7家。 從建設角度,專題數據庫較全文數據庫的開發空間更大。 2021年的《革命文獻與民國時期文獻保護計劃“十四五”時期規劃綱要》將加強文獻數字化與專題資源庫建設列為主要規劃內容[6],不少館藏總量豐富的公共圖書館將建設的重點轉向專題數據庫。 商業數據庫方面,有尚品大成開發的以新中國成立前出版的中國各地古方志為收錄對象的數據庫,亦有僅對英文類資料做全文揭示的ProQues 公司“近現代中國英文報紙庫”。
盡管專題數據庫在建設內容、主題、形式上呈現多元化,但在專科文獻上的建設情況并不理想,極少數針對專業學科方向進行探索和開發。 已知的有國家圖書館“民國圖書館學文獻數據庫”,匯輯內容可細分為圖書館學、文獻學、目錄學等15個單元部分,對圖書館發展史、圖書館學學術史領域以及其他社會科學具有重要研究價值。 現階段,公共圖書館及商業機構對專科文獻的關注程度較低,存在服務性不強、與受眾需求脫節的問題,對專業文獻的利用及圖書館社會服務效能造成一定不利影響。
基于能為了解和研究近代中國提供不同角度、立場的史料參考,民國時期報刊的利用需求漸增。 自建及商業數據庫在收錄資源的文獻類型上以期刊和報紙為收錄對象者居多,主要包括國家圖書館“民國報紙資源庫”、上海圖書館“中國近代報紙數字文獻全庫”、南京圖書館“江蘇地區老報紙數據庫”等。 而商業數據庫在資源建設方向的選擇上與公共圖書館具有同質性,建有兼收報紙和期刊的“瀚堂典藏——近代報刊數據庫”,只輯錄期刊的“大成中共黨史期刊數據庫(-1949)”,單純收錄報紙的“ProQuest 歷史報紙”。
報刊類數據庫在建庫數量上多且體量大,可以說報刊資源得到了較有效的開發整理[7],但資源內容重復建設現象隨之日益突顯。 以近代史上較具影響力的《申報》《大公報》為例,已知上海圖書館的“全國報刊索引——中國近代報紙全文庫”對這些報紙進行了全文開發,時代瀚堂公司“瀚堂典藏—近代報刊數據庫”同時收錄了《申報》《大公報》,尚品大成公司亦將《申報》收入其“大成申報數據庫”。 由重復開發造成的人力、物力、財力等資源上的浪費和損失成為不可忽視的問題。
依照上文7 大地理區域劃分,以文獻資源入藏豐富的國家圖書館、遼寧省圖書館、上海圖書館和南京圖書館為代表的華北、東北、華東地區內共15家公共圖書館,建設民國文獻數據庫總計128個,占全部數據庫總數的67%,在建庫總量上明顯優于其余四大區域的總和。 由此,民國文獻資源儲備與數據庫開發程度成正相關。 資源總量豐富者建庫形勢普遍趨好,反之,文獻資源平均占有量小,是不少公共圖書館在落實民國文獻資源建設中客觀存在的一大困境。
上述已開發的民國文獻數據庫普遍對數據庫檢索途徑與功能設計加以重視。 國家圖書館“民國圖書數字化資源庫”設置書名、責任者、出版者、關鍵詞等檢索途徑,提供在線閱讀、檢索結果數據分享功能。“中國歷史文獻總庫·近代報紙數據庫”除提供全文閱覽、篇目定位,還具備熱區顯示、特色導航等功能。“書同文古籍數據庫”已實現內部資源整合,并設計了校勘、添加標注、手寫輸入等輔助功能,實現編輯、下載、復制打印的全電子化作業。 在簡繁體字關聯檢索及圖文對照功能上與“瀚堂典藏——近代報刊數據庫”相似。
優化數據庫服務功能的初衷在于便利讀者檢索且提高數據庫使用率。 但由表1 可知,調查樣本中提供公開訪問的數據庫數量占比僅有29%,對數據庫訪問權限有限制的占絕大多數。 另外,筆者檢索到的全文數據庫,除國家圖書館“民國圖書數字化資源庫”“民國報紙資源庫”“民國中文期刊數字資源庫”設為全網公開訪問資源外,其余皆設有館外訪問限制,這在一定程度上制約了數據庫的推廣使用。 而數據庫的訪問限定是保護數據安全及版權的重要手段,如何達到二者間的平衡是未來數據庫建設需要解決的問題。
以減少重復開發造成資源浪費、均衡各區域公共圖書館的文獻資源配置為出發點,首先,建議開展全國范圍內的民國文獻資源統籌。 由民國時期文獻保護工作辦公室實施推進,建立文獻資源數字化建設政策及制定統一標準[8]。 資源建設標準規范的建立不僅具有戰略意義,也可為下一步實現資源統一揭示和開放共享提供條件,為資源管理奠定基礎。 地區層面,國家圖書館、上海圖書館等各區域中心館,應利用地位優勢發揮引領作用,在充分摸清區域內各館館藏情況的基礎上,對資源進行必要的整合并合理配置。其次,繼續推進聯合共建共享數據庫建設。 可考慮集中商業機構、其他公益機構的力量進行聯合運作,通過公共圖書館之間、公共圖書館與商業機構之間,以及公共圖書館與檔案館、博物館等其他機構間,建立溝通和合作共識,進一步推進資源的共知與共享,相互間充實所需資源的同時達到更廣維度的資源宣傳效果。
未來公共圖書館應考慮在專科文獻的整理及其自建庫上多做工作,為專業學科或領域研究提供系統的專業資料,同時在采選商業數據庫的方向把握上更有專業側重。 以開展中共黨史專業學科數據庫建設為例,黨的十八大以來,習近平總書記高度重視黨史學習的教育與研究,曾多次強調“把紅色資源利用好、紅色傳統發揚好、紅色基因傳承好”的重要性。 民國文獻中記載了中國共產黨曲折發展的歷史進程,包括中國共產黨在建立時期、北伐戰爭時期、土地革命戰爭時期、抗日戰爭時期、解放戰爭時期等關鍵歷史時期的重要資料。 公共圖書館可對這些紅色資源進行深度挖掘式整理與細顆粒度的信息揭示,建立以數字化為基礎,以紅色文化內涵為核心、以數據庫服務為依托的數字資源紅色陣地。 一方面,利用數字資源開發的手段加大對紅色文獻的保護力度;另一方面,則為研究中共歷史上的重要理論、執政實踐經驗,以及對當代中國政治的研究提供重要史實參考和理論依據。 所謂欲知大道,必先為史,通過黨史專科文獻數據庫的開發利用使珍貴史料發揮出巨大的現實意義,提升文獻的可視度和社會服務效能。
設置訪問權限作為數據庫權益管理模式,在版權及數據保護上起到重要作用,但與此同時也使讀者獲取資源的渠道和途徑受到限制,還很可能影響到讀者對圖書館的使用頻率以致讀者逐漸流失。 建議加強數據庫技術革新,數據庫方采取添加水印等保護措施[9],在版權保護范圍內放寬文獻資源的訪問限制,既符合數據庫方利益又利于讀者的合理使用。
民國文獻數據庫建設是一項長期系統工程,可豐富數字資源服務內容、補充紙質館藏資源的不足,同時對紙本民國文獻的保護起到重要作用。 對館藏民國文獻的深度挖掘及專業性知識投入,不僅有利于滿足普通讀者閱覽的需求,也利于滿足考證研究的社會需要。 為此,筆者基于現階段民國文獻數據庫建設的發展情狀,就探求數據庫構建的新路徑展開分析思考,以期促進民國文獻的整理研究以及數據庫建設在公共服務效能上獲得理想成果。