□姚伯岳 沈蕓蕓
“學苑汲古——高校古文獻資源庫”是一個匯集高校古文獻資源的數字圖書館。最初是作為CALIS二期專題特色庫的一個重點項目而于2004年6月正式批準立項,由北京大學圖書館牽頭,聯合南京大學、北京師范大學和四川大學3所大學圖書館的古籍部共同建設,到2006年6月項目驗收時,取得了如下成果:
(1)建立了我國第一個高校校際古文獻資源庫。“高校古文獻資源庫”驗收時,4個參建館提交的古籍元數據量達202449條,書影和全文圖像數量達5467幅,電子書1萬余冊。
(2)設計開發了基于新型元數據標準的網絡型古籍聯機編目系統,系統設計合理,實用高效。借助該著錄系統,在項目實施后不到2年的時間,4個參建館就都迅速完成了各館所藏古籍的計算機回溯編目工作。
(3)推出了具有古文獻特色的檢索服務平臺——“學苑汲古”,檢索途徑多種多樣,系統運行良好。
(4)制訂了一套適用的古文獻數字化標準,包括:古籍元數據規范、古籍著錄規則、古文獻數字加工標準。
“高校古文獻資源庫”在驗收通過并正式對外開放服務后,受到社會的普遍好評,并受到國內外高校圖書館的關注。它的建設方法和模式,適時地迎合并滿足了各高校圖書館當前的急迫需求。可以說,這個項目對于每個參建館來說,都是其想做而且不得不做的工作。加入該資源庫,不僅可以共享其他成員館的大量編目數據和書影圖像及電子圖書,而且還可以無償得到一個經過實踐檢驗的較為完善的古籍數字化編目、整理、加工平臺。于是,加入到“高校古文獻資源庫”的建設中,成了許多高校圖書館的迫切愿望。故在項目驗收結束后又陸續增加了香港中文大學圖書館、華東師范大學圖書館、吉林大學圖書館3個成員館。截止到2010年9月底,該庫已成為包含7個成員館共31萬條古籍元數據、2.6萬幅書影和全文圖像、8.3萬冊電子圖書的網絡型古文獻數據庫。
“高校古文獻資源庫”的初期建設成果,雖然超過了預期的目標,但這只是一個開始,它的使命還遠沒有完成。首先,它的成員館還太少,相較全國上百所高校圖書館有相當數量的古籍收藏的現狀,它的覆蓋面太小,代表性不夠強;其次,它的書目記錄數量、書影、全文電子圖書的總量還不夠多,還沒有具備一個大型古籍數字圖書館的規模;第三,它的數據庫系統的設計,包括編目平臺、發布平臺、管理平臺都還不夠完善,需要繼續加以改進。這就是說,“高校古文獻資源庫”在完成它的初期建設之后,就自身而言,還有很大的發展空間,應該繼續和擴大建設。
作為CALIS二期專題特色庫中唯一的一個校際合作項目,“高校古文獻資源庫”項目從一開始就受到CALIS管理中心的高度關注。2010年9月20日,CALIS三期建設正式啟動,鑒于“高校古文獻資源庫”前期建設的成功進行和突出地位、以及許多高校圖書館不斷主動申請加入該資源庫的現實需求,CALIS管理中心決定在CALIS三期建設中,將“高校古文獻資源庫”升級為與專題特色庫項目平行的重點建設項目,繼續提供資金和技術上的大力支持,并為之設立了新的建設目標,即:
聯合更多的收藏古籍有一定規模的高校圖書館,擴大建設高校古文獻書目與全文圖像資源庫,盡可能多地反映我國高校古籍收藏情況,在為參建館提供館藏古籍回溯編目服務的基礎上,建立全文圖像加工與共享服務機制,促進高校圖書館藏古籍的編目整理與資源共享,在讀者與圖書館之間建立方便快捷的溝通管道。
具體的建設目標是:
(1)繼續由北京大學圖書館作為牽頭單位,在現有基礎上吸納古文獻收藏豐富或有特色、技術力量好的高校圖書館加入,擴大聯合建庫的范圍,使成員館擴大到24個。
(2)建立集中而規范的古文獻資源庫,采用元數據、書影、全文圖像、電子圖書多種形式并重的建庫方式及相應的共享服務機制。預計在2012年4月項目驗收時,達到元數據總量55萬條,書影21萬幅,全文圖像和電子書近10萬冊。元數據和中精度書影圖像向全社會開放、電子圖書在參建館范圍內向讀者免費開放。
(3)試驗進行古文獻傳遞服務。挑選幾個條件較好的圖書館為服務館,在CALIS成員館范圍內開展古籍的文獻傳遞服務,在試驗期內對相關用戶予以經費補貼。試驗成功后,將進一步推動使資源庫成員館均成為古文獻傳遞的服務館。
(4)努力構建一個技術先進、功能強大、服務機制完善的古文獻數據發布和交流平臺,加強與用戶的交流互動。
“高校古文獻資源庫”繼續和擴大建設的消息一經征詢,各館無不欣然同意,踴躍加入,并且都以高昂的熱情和積極的工作態度投入到日后的項目建設中。復旦大學、中國人民大學、清華大學、中山大學、山東大學、武漢大學、南開大學、蘇州大學、鄭州大學、河南大學、廈門大學、遼寧大學、南京師范大學、內蒙古大學、浙江師范大學、寧夏大學、澳門大學,共17所國內知名高校圖書館積極申請加入,加上前期的7個參建館,CALIS三期“高校古文獻資源庫”項目的參建館很快就達到了24個。元數據的建設也進展神速,到本文脫稿的2011年10月中旬,“高校古文獻資源庫”中的古籍元數據總量已經達到62萬條,遠遠超出了55萬條的預期建設目標。“高校古文獻資源庫”的擴大建設勝利在望!
也許有人會問,在目前國內外中國古籍數據庫風起云涌的情形下,“高校古文獻資源庫”的價值何在?地位如何?其建設究竟有無必要?
為此,我們對國內外已有的綜合性古籍數據庫作了一個初步調查,基本情況見表1。
這些數據庫,按開發單位性質,可分為商業性數據庫和學術性數據庫兩大類。按付費方式,可分為收費和免費數據庫。商業性數據庫多為封閉式的靜態數據庫,內容相對完整、獨立、有限;由于收費,一般都限于局域網的服務范圍。學術性數據庫由于基本是免費的,大多都采用廣域網的形式,開放性和公益性是其特點。
“高校古文獻資源庫”是免費的學術性數據庫,所以我們暫時略去那些商業性數據庫不講,僅在這里重點對比一下有關中國古籍的國內外公益性學術性數據庫。
在中國高校系統,大學數字圖書館國際合作計劃(簡稱CADAL)利用中美百萬冊圖書項目的支持,已經建立了一個包括155910冊中文古籍的全文數據庫。但是,CADAL古籍全文數據庫有以下不足:一是其數據庫建設缺乏明確的整體規劃,書種的選擇存在很大的隨意性,數據組織混亂,缺乏學術邏輯性;二是其元數據缺乏對古籍版本和藏址等事項的著錄,影響了其學術利用價值;三是用戶終端只有檢索功能,沒有分類瀏覽功能,讀者使用很不方便。
中國國家圖書館近年來開發了許多對全社會開放的古文獻全文數據庫,如《甲骨世界》、《碑帖精華》、《西夏碎金》、《敦煌遺珍》、《數字方志》、《年畫擷英》、《中華尋根網》等。國外也有一些有關中國古籍的專題數據庫,如加拿大麥吉爾大學開發的《明清婦女著作》網站等,但這些數據庫都屬于專題數據庫,規模有限,與高校古文獻資源庫宗旨不同。

表1 國內外綜合性古籍數據庫調查表
日本京都大學的“日本所藏中文古籍數據庫”收錄了日本67所公私收藏機構所藏中文古籍書目記錄約80萬條,雖然數量可觀,但沒有書影和全文圖像,僅僅是一個二次文獻數據庫,資源類型顯得單一。此外,這個數據庫只是一個發布平臺,沒有供各館進行古籍編目的編目系統,只有共享,沒有共建。
日本東京大學東洋文化研究所漢籍全文影像數據庫是一個可供借鑒的良好模式,即在提供規范的目錄數據的基礎上,提供原文圖像。但全文圖像只有4000多種,數量過少,繼續投入乏力。
臺灣“中央”圖書館主持建設的“中文古籍書目數據庫”,發端于1999年,目前已有30余所合作單位,范圍涉及臺灣地區、大陸、日本、北美等海內外重要的中國古籍收藏機構,數據庫收錄書目已逾62萬條,目前美國芝加哥大學圖書館、哈佛燕京圖書館等都已向其提交了館藏古籍書目數據。但是中國大陸各圖書館提交的書目數據除國家圖書館外,大多是象征性的少量試驗數據,所以雖然數據總量看起來不少,但對于中國大陸的古籍收藏機構來說,并不具備實用價值。
美國由艾思仁博士(Dr.Soren Edgren)主持的中華善本古籍國際聯合書目(Chinese Rare Book Project),是一個國際性的中國古籍聯合目錄系統。該數據庫現已在中國國家圖書館網頁上以“中華古籍善本國際聯合書目系統”的名義對外服務,但實際上目前只開放了美國哥倫比亞大學圖書館和普林斯頓大學葛思德圖書館等少數幾個館所藏中國古籍善本的書目數據和部分書影,數量只有幾千條,規模有限。
對比上述國內外各種中國古籍數據庫,“高校古文獻資源庫”的優勢在于:
(1)在反映高校圖書館系統古籍收藏情況方面具有代表性。高校圖書館是我國公共圖書館系統之外,收藏中國古籍數量最大的圖書館系統。例如北京大學圖書館藏古籍150萬冊,居全國高校之首,在全國圖書館中排名第三。中國人民大學圖書館、中山大學圖書館收藏古籍均達40萬冊,南京大學圖書館藏古籍大約39萬冊,北京師范大學圖書館藏古籍37萬余冊,四川大學圖書館、華東師范大學圖書館藏古籍也在30萬冊以上。其他如清華大學圖書館、吉林大學圖書館、鄭州大學圖書館、武漢大學圖書館等,都有20萬冊上下的古籍收藏。國內這些收藏古籍規模較大的高校圖書館目前都已加盟到作為CALIS三期重點建設項目的“高校古文獻資源庫”中,今后還會有更多的高校圖書館加入進來,“高校古文獻資源庫”將不斷增加其規模,越來越全面地反映高校圖書館系統的古文獻資源收藏。
(2)反映參建館古籍收藏的整體性和完備性。“高校古文獻資源庫”的建設宗旨之一,就是全面反映每一個參建館完整的古籍收藏,所以要求每個參建館都盡可能地提交全部館藏的古籍書目記錄。這就使該資源庫可以完整地反映各個參建館的古籍收藏情況,使讀者的檢索結果更加精準和肯定。
(3)數字資源的針對性和規范性。“高校古文獻資源庫”中對書目記錄的著錄是以每個藏本為單位,資源庫中所有的書影圖像,也是分別掛接在每一藏本的書目記錄之上,反映該藏本的面貌。這樣的設計,有助于各館編目人員以及讀者比較和鑒別版本,統一認識,提高各館古籍書目記錄的準確性和規范性。在進行規范的版本著錄并盡可能多地掛接書影圖像之外,“高校古文獻資源庫”的書目記錄還揭示古籍藏本的館藏地址和典藏號,為學術研究提供可以查考的物理依據,這是商業性數據庫難以做到的。
(4)高效便捷的檢索與目錄組織體系。“高校古文獻資源庫”沒有限制性檢索,其高級檢索所設的10多個檢索途徑都可以單獨進行檢索,同時還允許各種復雜的組配檢索,甚至還提供對整條書目記錄的全文檢索。其發布平臺“學苑汲古”更是在檢索結果之下,又設計有二次檢索的功能,還提供了古籍版本類別、出版年代、出版地的瀏覽功能,題名和責任者的索引功能。這些獨特而完備的檢索手段的設置,大大方便了用戶的使用,提高了數據庫的價值,賦予了檢索結果以很高的學術含量,成為學者治學的得力助手。
(5)資源庫的動態性。“高校古文獻資源庫”是一個動態的網絡數字圖書館,其上的各種書目數據都會經歷不斷的修改和完善,質量將逐步提高,各種數字資源的數量也在不斷的增加豐富中。此期建設還將在修改后的發布平臺上增加與用戶的交流互動功能,隨時吸納讀者和用戶的批評建議,對各類數字資源進行修改和調整。
(6)資源庫的開放性。“高校古文獻資源庫”是一個開放性的數據庫,表現在:一是成員館數量的開放。“高校古文獻資源庫”的建設方針是:“自愿參加,合作共享,開放服務。”海內外收藏中國古籍稍具規模的高校圖書館只要有參加的意向,并簽署參建協議,承諾履行一定的義務(如愿意提交館藏古籍的元數據等),隨時都可以加入該資源庫,成為參建館,享受參建館的種種優惠待遇。二是資源類型的開放。“高校古文獻資源庫”現在的古文獻類型基本是以古籍為主,兼有少量輿圖。隨著古文獻數字化建設的深入,“高校古文獻資源庫”還準備將拓片、契約文書等古文獻類型逐步列入,成為一個囊括各類型古文獻資源的大型綜合性數據庫。
(7)資源庫的公益性。該庫為公益性數據庫,建成以后全部完整的書目記錄及中精度書影圖像向全社會開放,電子圖書將在參建館范圍內免費共享,這將使古籍數字化的受益人群大為擴展,必將有力推動對中國古代典籍的深入研究和充分利用。
“高校古文獻資源庫”的建設機制分為運維機制、資源建設、服務機制、技術支持等4個方面。
作為CALIS三期重點建設項目的“高校古文獻資源庫”,已經在CALIS管理中心的指導下,以北京大學為首,聯合若干主要高校圖書館組成項目管理組,實施項目管理,以及聘請專家對項目進行專業咨詢、立項評審、中期檢查及驗收等。在項目管理組下又設立業務工作組,其職責包括制訂建設方案、擬訂相關規范和標準并進行質量監控,協調資源建設,承擔對參建館的相關技術指導和業務培訓,以保證該項目的順利實施和圓滿完成。
資源建設包括元數據加工和書影、電子圖書的數字加工。
元數據由參建館依據統一的元數據標準著錄,并提交至項目中心數據庫存貯。考慮到古籍版本的多樣性,各館古籍元數據的提交不以查重為前提,不進行數據合并,系統的設計也不支持不同成員館之間的數據合并。
元數據的建設在采取聯機編目方式的同時,將充分整理利用各參建館已有的古籍數字化成果,盡可能地將各館已有的各種格式電子化的古籍書目數據批量導入到“高校古文獻資源庫”系統中,然后由各館逐條進行校對修改。
作為“高校古文獻資源庫”本期建設的重點內容之一,項目管理組鼓勵各參建館提供古籍書影圖像的掃描、上傳和鏈接,并予以相應的經費補貼。書影一般只選擇古籍的卷端、內封、牌記等少數幾個頁面進行掃描,每書原則上不超過3幅,本館復本一般不再提交書影。書影掃描工作由各參建館進行,書影圖像可由各館利用“高校古文獻資源庫”古籍著錄系統上的“圖像編輯”工具提交并與相應的元數據掛接,也可以批量提交到項目管理組集中加工和上傳、鏈接。
電子圖書完整反映古籍全書面貌,但文件格式和精度與書影、全文圖像不同,可以采用CEB格式,也可采用PDF格式。電子圖書的提供基于兩種情況:一是由圖書館主動進行古籍全文數字化而提供的電子圖書。一種是應讀者具體要求進行全文數字化而產生的電子圖書。CALIS歡迎電子圖書的提供,而且是越多越好,但由于電子圖書不是本期建設的重點內容,所以暫時不予以經費補貼,這項建設內容完全基于各參建館的自覺自愿。
“高校古文獻資源庫”提供給各參建館一個富有古文獻特色的服務門戶,并采取以下共享服務機制:
(1)元數據共享
參建館在以下層面共享元數據:參建館可以上載、修改、復制、刪除、下載本館的元數據;參建館可以檢索、瀏覽、套錄其他館的元數據,藉以生成本館元數據,但無權修改和刪除其他館的元數據。
(2)書影、全文圖像、電子圖書共享
書影的中精度圖像隨元數據對全社會開放;參建館編目用戶則可以瀏覽其他館的各種精度的瀏覽級書影。
對于全文圖像和電子圖書,有條件的館可以按本項目提出的數字化標準規范掃描本館古文獻資源,經轉換為發布格式后提交項目中心服務器,按各館政策或在CALIS成員館范圍內共享,或在本資源庫參建館范圍內共享,或只供本館用戶使用。
(3)暫時有限的文獻傳遞服務
服務館暫時僅限復旦大學、南京大學、四川大學3個圖書館,在資源庫發布平臺設計相關功能,利用CALIS文獻傳遞機制,在CALIS成員館范圍內開展古籍的文獻傳遞服務。試驗期內CALIS對相關用戶予以50%的經費補貼。
在項目管理組的領導下,由業務工作組負責組織,本期“高校古文獻資源庫”將建立和完善相應的標準規范,包括古文獻元數據規范和著錄規則、古文獻數字加工規范等,同時建立質量監控機制,保證數據質量。
在項目建設期間,CALIS將為參建館提供古文獻資源加工、管理和服務諸系統,并根據本項目業務工作組提出的各項需求,及時完成對這些系統的修改、完善和維護工作。
“高校古文獻資源庫”是一個可持續的建設項目,它初步搭建了一個網絡型古籍聯機編目平臺,為開展高校間大規模的古籍聯合編目創造了必要的條件,并且可以向數字圖書館的方向發展,進行縱深建設。這樣一個網絡型古文獻數據庫的建成和使用,其意義和作用是:
(1)對于那些尚不具備單獨開發古文獻數據庫條件的高校圖書館來說,“高校古文獻資源庫”可以給他們提供一個現成的平臺,幫助其盡快實現館藏古文獻各類型數據的數字化。
(2)實現各成員館之間的古文獻聯機編目,有助于古文獻書目數據的完善和規范。
(3)可以幫助讀者方便地了解國內高校范圍內古文獻的收藏情況,滿足其檢索閱覽需求。
(4)有助于滿足讀者對古籍的文獻傳遞需求,促進古籍的流通利用。
(5)引導讀者更多地閱讀電子版古籍,間接地保護古籍原書,減少其在使用中造成的損壞。
應該說,“高校古文獻資源庫”的建設,既有對國內高校圖書館所藏古文獻資源的系統整合效應,也有對成員館古籍整理工作的促進和規范作用,而且也為國家各類古籍整理項目在各高校圖書館的順利實施創造了有利條件。我們將不斷努力,爭取將“高校古文獻資源庫”建設成為一個富于古文獻特色、內容豐富、功能完備、理念先進、占有重要地位的全國性甚至世界性的高校古文獻數字圖書館!