毛星懿
(暨南大學 文學院,廣東 廣州 510632)
實錄體史書是源于南朝蕭梁時期、以皇帝及其朝政為記載中心的特殊的史學體裁。它的編纂體例是“以皇帝的編年為綱,以大臣的小傳為緯;以編年體為主體,以紀傳體中的列傳為輔助”[1]68。此后,唐代至清代皆根據每一朝皇帝修撰一部實錄,基本都維持這樣的體例,僅元、清的少數民族政權的實錄略有些不同[1]68。因而,用數字人文方法處理實錄體的另一優勢是其文本撰寫遵循一定的格式,計算機語言易于讀取。
《清實錄》卷帙浩繁,由13種記錄組成。目前,關于《清實錄》的數字人文研究主要有兩種:一是將《清實錄》整體作為研究對象;二是具體選擇一個或幾個朝代的實錄文本作為研究對象。
目前,網絡平臺提供的工具較為豐富,能解決基本的人、事、時、地、物標注與提取的問題,為《清實錄》人名、地名、時間等基本信息的研究提供了條件。
2011年,陳品諺《〈清實錄〉之文本分析與時間標記初探》[2]將《清實錄》進行切分、標記,然后以中國臺灣歷史數位圖書館(THDL)為模型建置了《清實錄》查詢系統(QSDL),進而利用該系統進行分析。該論文對《清實錄》的時間條目進行公歷轉換,指出紙本《清實錄》存在12處日期錯誤。若不是用計算機來處理全部的時間信息,人工將很難檢核到這些細微的錯誤。研究創建的《清實錄》查詢系統(QSDL),考慮到文本上下文可能具有關聯性,因而增加了相鄰文件和同日文件瀏覽的功能。……