毛建軍
(河南新鄉學院,河南新鄉453003)
在中國古典文獻學史上,“金石”常常并稱,成為一個名詞。金指青銅器,石指石刻,因此,以金、石為載體的文獻便統稱為金石文獻。金石文獻包括金文文獻和石刻文獻兩大部分。[1]金石兼具文獻性、文物性、收藏性于一身,是研究中國古代歷史文化不可多得的珍貴史料。對金石文獻數據庫資源做調查分析,既有利于促進金石文獻數字資源的整合,又有利于社會各界充分利用和挖掘金石文獻信息。
日本收藏有大量的中文古籍。隨著古籍數字化進程的開展,日本各大圖書館和科研機構也開始將金石文獻數字化,其中在金石文獻數據庫的開發與建設方面,日本京都大學人文科學研究所和京都大學人文科學研究所最具成就。
京都大學人文科學研究所所藏石刻拓本資料[2]由京都大學人文科學研究所研制并管理。日本京都大學人文科學研究所藏有珍貴中國典籍,其中尤以甲骨文、金石、漢籍拓本的典藏最為突出。自2001年,京都大學人文科學研究所開始“日本所藏中文古籍數據庫”(包含石刻拓本資料)建設,計劃分兩個五年階段實施。目前數據庫已基本建成,數據庫可提供35個典藏機構約62萬條記錄的網絡檢索和閱讀。[3]其中金石文獻數據庫收錄中國石刻拓片1萬余條,涵蓋時間為西漢到隋朝。數據皆提供選單點選,每筆數據呈現黑白影像并附基本說明。京都大學人文科學研究所另建有“畫像石與石刻拓本”網站,畫像石資源涵蓋中國山東、河南、山西、陜西、四川、江蘇等地,石刻拓本檢索范圍為西漢至隋朝。可提供瀏覽檢索、文字檢索和全文影像閱讀。
明治大學“唐·五代十國時期墓志、墓碑檢索”[4]也很有價值。“唐·五代十國時期墓志、墓碑檢索”由明治大學中國石刻文物研究會建置,系統包括《唐代墓志所在總合目錄》、《中國五代十國時期墓志、墓碑綜合目錄稿》以及《西安碑林全集》所載唐代墓志目錄。目前,雖不能閱讀影像,但中國石刻文物研究會已經計劃將不斷擴充全文數據庫。
目前,港臺地區金石文獻全文數據庫已開發出許多資源,其開發建設單位主要為港臺地區的研究機構和部分數字公司。其中以香港中文大學中國文化研究所古文獻數據庫中心開發制作的漢達古籍數據庫檢索系統——金文數據庫和臺灣中研院歷史語言研究所開發制作的殷周金文暨青銅器數據庫最具特色。
漢達古籍數據庫檢索系統——金文數據庫[5]由香港中文大學中國文化研究所古文獻數據庫中心開發制作。系統包括甲骨文數據庫、竹簡帛書數據庫、金文數據庫、先秦兩漢文獻數據庫、魏晉南北朝文獻數據庫以及類書數據庫等。漢達金文數據庫數據主要來源于中國社會科學院考古所編《殷周金文集成釋文》,總計收錄12,021件銅器,約1萬8千張拓本(包括摹本),約近100萬字器物數據說明,另有14萬字隸定釋文。數據庫具有金文銘文和釋文對照檢索,以及詞串統計等功能。該數據庫界面清晰,操作簡單,很受學界歡迎。不過,由于數據庫不斷擴充和升級,該網站時常不能登陸,甚為遺憾。
殷周金文暨青銅器數據庫[6]由臺灣“中央研究院”歷史語言研究所開發制作。數據庫為“中央研究院”史語所金文工作室建置,并與該院地理信息科學研究專題中心、計算中心共同合作完成,是目前大型金石文獻數據庫之一。2009年5月數據庫已免費開放學界,使用者只需注冊,便可申請使用。該數據庫可以通過器號、器名、銅器時代等多重字段進行復合檢索,查詢結果包含銅器數據與銘文數據,并有數字影像可供瀏覽。殷周金文暨青銅器數據庫界面以歷史地貌圖為背景,直觀地展示出青銅器出土的具體地點及其地貌情況,為學者進行金石文獻研究提供了極大便利。
金石拓片數據庫[7]由臺灣“國家圖書館”建置。金石拓片數據庫為臺灣“國家圖書館”館藏金石拓片數字化成果網站。臺灣“國家圖書館”現藏金石拓片6,462件,12,462幅。金文部分,以鐘鼎彝器為大宗,旁及度量衡器、兵器、鏡鑒等,時代起自殷商以迄漢世。石刻部分以碑志為多,兩漢刻石文字,有篆有隸,碑碣、摩崖、題記、殘石。另有唐人碑志超過千種。數據庫可選擇題名、類型、版本、序跋等多項字段查詢,每筆詳目結果有書號、主要題名、版本等近20項。[8]不過,由于該館限制局域網使用瀏覽數字化影像功能,給讀者造成很大不便。
其它港臺地區金石文獻全文數據庫見下表:

名稱 建設單位 簡要說明簡帛金石數據庫 臺灣“中央研究院”歷史語言研究所收錄簡帛金石研究資料共3,401,684字。系統支持布爾運算、多項目查詢、詞組查詢、排除字符及自然語言查詢。先秦金文簡牘詞匯數據庫臺灣中央研究院歷史語言研究所分為金文和簡牘兩個子數據庫。金文詞匯數據庫包括:詞匯庫查詢、詞匯庫索引以及詞匯庫管理。詞匯庫查詢可以自行輸入關鍵詞或以《殷周金文集成》青銅器器號進行檢索。青銅器拓片數據庫臺灣中央研究院歷史語言研究所傅斯年圖書館收錄傅圖館藏共計1萬余件青銅器拓片圖像及資料。關鍵詞查詢。查詢結果依序呈現縮圖、登錄號、器號、器名、原器時代、原拓書名、銘文釋文等信息資料。漢代石刻畫像數據庫臺灣中央研究院歷史語言研究所傅斯年圖書館收錄傅圖館藏漢代石刻畫象拓本圖像約1,500余件。提供功能、地名及主題簡易查詢。提供影像比對查詢功能,并可作放大、縮小、平移、旋轉等操作。遼金元拓片數據庫臺灣中央研究院歷史語言研究所傅斯年圖書館收錄傅圖館藏遼金元拓片約2000幅圖像資料。提供登錄號、品名、作者、語種、年代、主題、釋文、題跋、印記、著錄、刻立地點檢索途徑。故宮所藏西周金文 臺灣故宮博物院 普及型展覽類數據庫,欄目包括文字的故事、存續與應用、銘文話西周、金文逍遙游。關鍵詞檢索。
中國大陸地區參與金石文獻數據庫開發建設的單位主要為公共圖書館、科研機構以及數字化出版企業。公共圖書館金石文獻數據庫的建設以中國國家圖書館開發制作的“碑帖菁華”石刻拓片資源庫為代表。科研機構金石文獻數據庫的建設以華東師范大學中國文字研究與應用中心開發研制的“商周金文檢索系統”最有特色。企業研制的以《中國歷代石刻史料匯編》全文檢索數據庫影響力最大。
“碑帖菁華”石刻拓片資源庫[9]由中國國家圖書館開發制作,為該館所藏石刻拓片數字化后建成的公益型數據庫。中國國家圖書館收藏的石刻拓片計30,000多種、23萬余件。“碑帖菁華”石刻拓片資源庫即掃描拓片原件而制成,目前已完成29,000余幅拓片,影像30,000余幅。資源庫的著錄包括拓片題名、其他題名、責任者、年代、地點、拓片原物狀況、附刻、拓片版本、拓片特征、數目與尺寸、題跋印記、文種、拓片內含書目索引、關聯關系、館藏信息、圖片信息等項。資源庫內容以刻立石年月排序,可以提供單一字段的簡單檢索、多條件限定組合的高級檢索和元數據內容關聯檢索等查詢方式。“碑帖菁華”收錄的中國古代石刻拓片雖然占到了總品種的三分之二,其它石刻拓片則分藏在全國各地圖書館,而且很多圖書館所藏的石刻拓片都沒有整理編目。中文拓片項目設立之初就因為“編目整理基礎較差,合作建庫難度很大”。[10]因此,雖然基礎較好的國家圖書館與北京大學圖書館密切配合,雙方自建的資源庫在客觀上形成了互補,但能夠檢索全國各主要圖書館石刻拓片的“中文石刻拓片資源庫”還只是處在理想階段。
華東師范大學中國文字研究與應用中心研制的“商周金文檢索系統”[11]最具學術價值和探索意義。為順應中國文字數字化發展趨勢,華東師范大學中國文字研究與應用中心構筑了規模龐大的中國古文字數字資源,主要包括商周金文檢索、戰國楚文字檢索、花園莊東地甲骨檢索、《金文文獻集成》電子檢索等數據庫系統。“商周金文檢索系統”包含金文字庫和金文數據庫兩部分。金文字庫收字完整,對應迄今已發表的青銅器銘文,包括楷體字6,194個、金文原形字14,249個和金文偏旁539個。“金文數據庫”收錄了迄今已發表的青銅器銘文13,320篇,總字數124,800字,可以按器名、時代、國別、字數、出土,流傳、現藏等多種路徑進行檢索,也可以實現銘文字、詞、語段的全文檢索。需要指出的是,使用該系統時,需安裝該中心研發的金文字庫軟件,用戶頗覺繁瑣。另外,此字庫搜索類別按“字頭”,較為單一,若可以按詞搜索似乎更好。
《中國歷代石刻史料匯編》全文檢索數據庫是目前使用面最寬,影響力最大的金石數據庫。數據庫由北京書同文數字化技術有限公司開發研制,分單機版和網絡版兩種。數據庫可進行全文和分類檢索,并提供有字典、年代換算工具軟件。《中國歷代石刻史料匯編》全文檢索版雖然給研究者提供了極大的學術研究價值和檢索便利,但仍然存在很多可以改善的空間,如數據庫不能直接提供朝代、書名及著者檢索,給初學者帶來很大不便;書目秩序無標準規律,刊刻于不同時代的石刻零散放在不同位置,夾雜相間、紊亂不整;系統檢索結果的碑文名后有年代顯示,但是如讀者按年代檢索,系統得出的結果并不準確,而且命中不高;系統無法全屏顯示及放大,給視力不是很好的讀者帶來阻礙。
陜西省考古研究所和西安大東國際數據有限公司共同合作開發的《金文字庫及金文資料全文檢索系統》也很有特色。《金文字庫及金文資料全文檢索系統》是全國文物、博物館、系統人文社會科學重點研究課題。該系統金文資料收錄自宋代以來傳世和出土的高周時期青銅器上的金文資料約12,000件,包括:青銅器影像11,000幅,相關的簡介文字約120萬字;銘文拓文12000幅,釋文180萬字。令人遺憾的是,《金文字庫及金文資料全文檢索系統》軟件迄今未見正式出版或網絡授權使用。
北京愛如生數字化技術研究中心研發的《中國金石庫》收錄上古至民國初年歷代金石文獻,其中金石拓片10萬件,金石志書1千種。每種(件)各據善本(原件)詳加訂釋,制成數字全文,附以高度清晰的原版影像和可以360度旋轉觀察的原件影像。總計全文超過3億字,影像超過100萬頁,數據總量約100G,同時配備強大的檢索系統和完備的功能平臺。可從分類檢索、條目檢索、全文檢索、高級檢索4條路徑進行檢索,可運用圖文對照、標點批注、分類收集、下載保存、原文打印等10個輔助功能。
其它大陸地區金石文獻全文數據庫見下表:

名稱 建設單位 簡要說明金石拓片特藏 北京大學圖書館該館藏有中國歷代金石拓片計2萬余種,目前已精選出其中100件,年代從商代到民國,掃描制成影像文件。使用者可檢索拓片的題名、年代、出土地點以及全文內容,也可以直接點選各項拓本,觀賞拓片之影像。北京記憶——《燕都金石》 首都圖書館“北京記憶”是以近百年館藏為依托的北京歷史文化資源性網站。欄目包括《北京文匯》、《舊京圖典》、《燕都金石》、《京城輿圖》等。以金石拓片為主的《燕都金石》收錄大量北京地區摩崖題字和刻石圖像數據。中國漢代畫像石磚數據庫徐州師范大學圖書館中國漢代畫像石磚數據庫分別建立了圖像資料數據庫、期刊論文資料庫、圖書著作數據庫、漢文化資料索引庫等子庫。圖像資料數據庫收錄中國漢代畫像石磚的圖像資料,并附簡要說明。國學精品圖庫書法篇北京國學時代文化傳播有限公司收錄青銅器銘文174幅、碑刻石雕43幅及壁畫、書影等18種藝術代表作品千余幅,圖片清晰。可全文檢索,復制、打印,并附有聯機字典、歷代帝王紀年表等多種工具。出土文獻庫 北京時代瀚堂科技公司數據庫含甲骨文、金文、簡帛、印章、錢幣和石刻等分庫。金文分庫以《殷周金文集成引得釋文》為基礎建置,涵蓋所有青銅器銘文數據,圖文對照。
金石文獻數字化是對已存文獻的再現和加工,是21世紀金石文獻整理和研究的發展方向。盡管金石文獻全文數據庫的建設已經取得了相當大的成績,但還存在一些值得思考的問題。一是資源重復建設問題。由于目前還沒有一個統一的組織和機構去管理和協調金石文獻數據庫的建設,國內外重復開發和建設了大量金石文獻數字化資源。這種重復開發不僅造成資金的浪費,而且也增加了讀者利用上的困難。二是數據庫兼容問題。金石文獻全文數據庫的建設至今還沒有一個統一的數據庫著錄和運行系統標準。三是資源共享問題。金石文獻全文數據庫的利用在資源共享上還存在資源封閉和利益保護的弊端,給讀者帶來了諸多不便。需要指出的是,目前金石文獻全文數據庫的建設最迫切的任務是做好資源整合工作。
〔1〕 趙子夫,高月起.金石文獻小考[J].河南圖書館學刊,2007(2):129-131
〔2〕 京都大學人文科學研究所所藏石刻拓本資料.[EB/OL].http://kanji.zinbun.kyoto-u.ac.jp/db-machine/imgsrv/takuhon/.[2013-01-29]
〔3〕 毛建軍.日本中文古籍數字資源的建設[J].圖書館建設,2009(3):33-35
〔4〕 明治大學“唐·五代十國時期墓志、墓碑檢索”.[EB/OL].http://www.meiji.ac.jp/sha_ken/.[2013-01-29]
〔5〕 漢達古籍數據庫檢索系統—金文數據庫.[EB/OL].http://www.chant.org/info/default_jinwen.asp.[2013-01-29]
〔6〕 歷史語言研究所殷周金文暨青銅器數據庫.[EB/OL].http://db1.sinica.edu.tw/~ textdb/rubbing/query.php4.[2013-01-29]
〔7〕 臺灣“國家圖書館”金石拓片數據庫.[EB/OL].http://rarebook.ncl.edu.tw/gold/.[2013-01-29]
〔8〕 漢學研究中心編.國際漢學研究數字資源選介[M].臺北:漢學研究中心出版社,2010:87
〔9〕 中國國家圖書館“碑帖菁華”.[EB/OL].http://mylib.nlc.gov.cn/web/guest/beitiejinghua.[2013-01-29]
〔10〕 張志清,冀亞平.中文石刻拓片資源庫建設[J].新世紀圖書館,2005(1):14-17
〔11〕 華東師范大學中國文字研究與應用中心“商周金文檢索系統”.[EB/OL].http://www.wenzi.cn/pages/jwyd.asp.[2013-01-29]