李永卉 周宇婷 周樹斌
(1.江蘇大學科技信息研究所;2.江蘇大學法學院,江蘇 鎮(zhèn)江 212000)
中國的運河始建于春秋時期,見證了我國2000 余年的歷史,其蘊含的文化與文明特質,成為中華民族重要的物質和精神財富。中國的大運河主要是指元朝在北京建都后,為了解決運糧問題,修浚了部分隋唐以來原有的運河和一些天然水道,又開鑿了部分河道,最終形成的京杭大運河。京杭大運河曾經被國際工業(yè)遺產保護委員會在《國際運河古跡名錄》中列為最具影響力的水道之一,2014 年6 月被正式列入《世界文化遺產名錄》。習近平總書記指出:“大運河是祖先留給我們的寶貴遺產,是流動的文化,要統(tǒng)籌保護好、傳承好、利用好[1]?!甭?lián)合國教科文組織通過的《保護世界文化和自然遺產公約(1972)》,對“物質文化遺產”進行了界定。2003 年公布的《保護非物質文化遺產公約》,對“非物質文化遺產”相關概念也進行了界定。概括而言,“文化遺產”就是由先人創(chuàng)造并保留至今的一切文化遺存,包括物質文化遺產和非物質文化遺產[2]。因此,筆者研究涉及的大運河文化遺產概念,即是指與中國大運河相關的一切物質與非物質文化遺產。
由于大運河在中國歷史上的重要地位,運河研究一直是熱門議題之一,特別是2014 年大運河申遺成功以后,學者們圍繞文化資源開發(fā)與遺產整合等問題,開展了大量研究。安作璋[3]主編的《中國運河文化史》是運河史研究中的代表性成果之一,該書從農業(yè)、商業(yè)、城市發(fā)展、社會思想等多個角度對運河文化和歷史進行探討。俞孔堅等[4]的《京杭大運河國家遺產與生態(tài)廊道》一文,從自然條件、經濟環(huán)境、遺產現(xiàn)狀等方面探討了運河遺產保護措施,為運河遺產的保護提供了指導性意見。郭文娟[5]以京杭大運河濟寧段為分析對象,根據文化遺產的構成特點,提出了針對性的保護策略。徐奇志與王艷[6]則對大運河(山東段)物質文化遺產與非物質文化遺產進行細分,并引入活態(tài)保護理論進行了系統(tǒng)分析。郗志群等[7]人通過代表性、多元性和整體性3 個不同視角,對北京大運河文化遺產的突出價值、文脈特征以及遺產體系評估進行了闡述。2021 年《東南文化》第3 期[8]刊登了系列文章,主要從運河博物館構建和文化遺產開發(fā)角度,對中國大運河資源的開發(fā)與展示作了系統(tǒng)闡述。隨著數字技術的發(fā)展,國內對大運河的研究不止停留在理論上,還出現(xiàn)了很多運河相關網站或數據庫平臺。如大運河遺產網,就是由大運河遺產保護管理辦公室創(chuàng)建,主要傳遞與運河遺產相關的要聞以及存儲相關影音資料。2019 年6 月21 日,中國首個大運河文化數據平臺正式啟動,隨后不少地方開發(fā)了相關數字化平臺進行展示。但是這些平臺存在內容分散、關聯(lián)性不強、缺乏后期維護、內容粗糙、缺少對資源系統(tǒng)梳理等問題。近年來,隨著大數據、云計算、5G 等數字技術的飛速發(fā)展,使得知識傳播更為高效、快捷,并形成了可開放獲取的共享狀態(tài)。因此,筆者將在以往研究的基礎上,利用知識庫技術對大運河文化遺產資源進行知識組織、知識挖掘和關聯(lián),構建大運河文化遺產專題知識庫,以期為學術研究、地方經濟和旅游以及運河遺產保護等提供參考。
本體是一種新型的知識組織體系,不僅能準確規(guī)范描述概念及其之間的關系,構造豐富的語義關系網絡,而且還具有知識推理功能,可以深度挖掘概念之間隱含的知識關系[9]。文化遺產資源本體是對文化遺產的組成要素和內涵抽象概括后形成的一種形式化概念模型。筆者通過參考國際通用文化遺產數字資源本體模型CIDOC CRM[10]、CDWA、AAT 等,按照本體設計與構建的思路及步驟,分析大運河文化遺產構成要素,構建本體模型,旨在為大運河文化遺產領域相關概念描述與知識關聯(lián)提供統(tǒng)一規(guī)范的數據模型。
基于大運河文化遺產資源復雜、繁多的結構特點和領域構成的核心要素,本研究將本體確定為人物、事件、文獻、事物、地點5 大核心類。其中人物類主要包括與運河相關的代表性非遺傳承人,歷代與大運河相關的詩人、作家以及大運河相關大事件中涉及的主要人物等;事件類指有關運河文化遺產的一切相關活動,諸如軍事戰(zhàn)爭、節(jié)日慶典、特定的禮儀活動等;文獻類包括記載大運河文化遺產的歷史文獻和相關研究成果;事物類主要指出土文物、相關河道名稱、運河制度、聚落遺產等大運河核心物質文化遺產,以及諸如方言、飲食、習俗等非物質文化遺產,此類又與當地的地理特點緊密相連;地點類主要是運河物質文化遺產所在地及非物質文化遺產分布地。該分類盡量將代表農業(yè)文明時期我國杰出的水運治理制度和治水工程技術,具有鮮明地域特色的人居環(huán)境模式,以及活態(tài)化線性文化遺產進行充分展示,5 大類既互相區(qū)別又有內在的聯(lián)系機理。
本體被認為是共享概念模型的明確的形式化規(guī)范說明[11]。構建本體模型的一個重要參考原則是盡可能復用現(xiàn)有本體詞表。在確定核心類后,筆者參考文化遺產領域通用的CIDOC CRM 本體模型,并結合數字文獻通用的DC 元數據標準框架,針對人物相關數據內容屬性描述的FOAF、上海圖書館人名規(guī)范庫本體(SHLNames)詞表,以及廣泛被使用的地理關聯(lián)數據集之一的GeoNames,在此基礎上進行適當擴展,用CCH(Canal Cultural Heritage)詞表來表示運河文化遺產領域特有的概念,以此進行資源實體屬性描述。完成本體屬性的確定后,通過本體間相互映射,可實現(xiàn)不同本體間的相互關聯(lián)。
運河文化遺產的5 類核心實體均根據自身特點復用并補充了相應的屬性。人物(cch:Person)類,繼承和復用了FOAF 詞表,使其可以對藝人、詩人、作家等屬性進行充分描述,將人物相關信息進行標識,與事件實體、事物實體及文獻實體相關聯(lián);事件(cch:Event)類,主要對CIDOC CRM 進行復用,其他屬性均使用自建詞表進行規(guī)范,通過上述屬性可以對運河遺產相關活動進行較為完整的規(guī)范性描述;文獻(cch:Document)類,對DC 進行復用,將記載運河文化遺產及其相關資源的文獻進行描述,這也是本研究的創(chuàng)新點和特色;事物(cch:Thing)類,對CIDOC CRM 進行復用,將運河文化遺產相關實物進行描述,是文化遺產保護重要組成部分;地點(cch:Place)類,對GeoNames 進行了復用,同時根據大運河文化遺產的特點進行補充性描述,通過對遺產資源地理信息的描述凸顯了地域屬性。根據本體詞表的設定,對概念、屬性、關系進行定義說明,最終構建運河文化遺產本體模型(如圖1所示),基本可以描述大運河文化遺產資源的共同屬性特征。

圖1 運河文化遺產本體模型
本體是領域知識庫構建的基礎,能在語義層次上進行知識組織。知識庫用于存儲大量復雜的結構數據或非結構數據。本研究以本體模型為理論基礎,在此基礎上構建運河文化遺產知識庫,有利于相關資源關系的梳理和有序存儲。筆者以大運河鎮(zhèn)江段為例,構建大運河鎮(zhèn)江段文化遺產知識庫。
根據開放獲取知識庫名錄(OpenDOAR)統(tǒng)計,DSpace 是全球范圍內使用最廣泛的開源知識庫之一[12],支持不同格式資源存儲,包括文本、圖片、音頻、視頻等媒體資源,能夠滿足大多數研究和資源開發(fā)者對數字資源儲存、開放獲取和檢索的需求。鑒于大運河文化遺產資源的豐富性和特殊性,DSpace 不僅能夠滿足多層次資源描述,還能夠對軟件進行二次開發(fā),也可以與其他數字平臺建設倉儲聯(lián)盟,因此,完全可以實現(xiàn)大運河文化資源真正的整合與互通。
構建大運河鎮(zhèn)江段文化遺產知識庫首先需確定知識庫的內容范圍。結合鎮(zhèn)江地域的實際情況進行對照、篩選,將鎮(zhèn)江物質文化遺產按照形態(tài)特點主要分為:航道及水利工程遺存,其中包含航道遺存(破岡瀆遺址、上容瀆遺址、九曲河、鎮(zhèn)江市區(qū)內老河道等),重要港口(大京口、小京口、甘露口等),堤壩遺址(丁卯埭、京口埭等),橋梁遺存(丁卯橋、虎踞橋、開泰橋等),涵閘遺存(京口閘、九曲河閘等),津渡(西津渡等),漕運糧倉(宋元糧倉等);運河沿岸文化歷史遺存,主要包含古城遺址(鐵甕城遺址、丹陽古城遺址等),廟宇遺址(金山寺、焦山寺等),歷史文化街區(qū)(西津渡歷史街區(qū)、新河一條街等)[13]。鎮(zhèn)江段非物質文化遺產資源亦極為豐富,如,民間文學、曲藝、傳統(tǒng)戲劇、傳統(tǒng)舞蹈、美術以及往來客商留下的著名詩詞等,極具文化和地域特色。其詩詞資源尤為豐富,且包含大量鎮(zhèn)江地理信息和人文情懷,故特此構建鎮(zhèn)江段運河特色詩詞庫,為豐富運河文化提供新的方向。
結合鎮(zhèn)江段文化遺產知識庫的內容范圍,確定以下建庫原則:一是數據收集標準。收集的范圍包括大運河鎮(zhèn)江段物質文化遺產、非物質文化遺產以及相關的文化資源,格式包括文檔、圖片、視頻、音頻等;二是平臺操作標準。針對不同的用戶權限,向所有用戶都開放瀏覽功能,部分資料可支持下載,對于機構人員內部人員提供上傳和下載權限等;三是平臺服務標準。在建庫過程中,充分考慮用戶需求,積極采納合理的意見或建議,分析用戶偏好,設置定制服務等。同時,為確保流程中各個環(huán)節(jié)都具備故障分析和容錯能力,對各個層次的訪問進行了權限設置,并充分利用日志記錄操作流程,保證研究的科學化、合理化、規(guī)范化。
根據運河文化遺產本體模型發(fā)現(xiàn),地點類與人物類、事件類、文獻類、事物類都有一定的內在聯(lián)系,因此,筆者以大運河鎮(zhèn)江段的沿線物質文化遺產為切入點,再與該地點相關的人物信息、活動信息、文獻信息、事物信息分別進行關聯(lián)。通過遵循制定的建庫原則,最終形成了大運河鎮(zhèn)江段文化遺產知識庫的首界面(見圖2)。

圖2 大運河鎮(zhèn)江段文化遺產知識庫首界面
歷史上的運河最主要的功能就是漕糧運輸。鎮(zhèn)江地處長江與大運河交匯之地,是江南運河的起點,地理位置十分重要,到了南宋時期,這里更是前線糧草運輸的命脈。尤為重要的是從南宋到元代,鎮(zhèn)江就設有轉般倉專門用于存儲運輸糧食,同時還設有京口閘等重要的水運設施工程。因其特殊的地理位置和歷史文化積淀,鎮(zhèn)江留下了一批非常有特色的與大運河有關的詩文,體現(xiàn)了在當時的歷史背景下人們對大運河的認知。
首先,對如古詩文網、中國基本古籍庫等網絡上的有關詩詞進行檢索,再核對權威紙本文獻以及留存的個人詩文集等文獻,如《全唐詩》[14]《全宋詩》[15]《全宋詞》[16]《全元詩》[17]《全明詩》[18]《清詩總集叢刊》[19]等著作,對詩文進行第一批次篩選。如檢索“西津渡”,即有“西津渡,去府治九里,北與瓜洲渡對,唐張祜詩:金陵津渡小山樓,一宿行人自可愁。潮落夜江斜月里,兩三星火是瓜洲”,這樣的地名解釋。然后,通過查閱《嘉定鎮(zhèn)江志》[20]《至順鎮(zhèn)江志》[21]《鎮(zhèn)江港史》[22]等鎮(zhèn)江地方資料,同時輔以譚其驤《中國歷史地圖集》[23]《輿地紀勝》[24]《方輿勝覽》[25]以及《讀史方輿紀要》[26]等歷史地理書籍,確定有關鎮(zhèn)江運河名稱的關鍵詞,如甘露港、京口港、九曲河、蒜山渡、西津渡、伊婁河、河、練湖、歸水澳、長橋、清風橋(范公橋)、嘉定橋、千秋橋、綠水橋(高橋)、通濟橋、程公橋、拖板橋、京口閘等。再通過鎮(zhèn)江地方志等地方文獻確定與鎮(zhèn)江運河有關的歷史遺跡、亭臺樓閣等關鍵詞,如京口轉般倉、金山、北固山、焦山、蒜山、妙高臺、海門、象山、京口閘、甘露寺、鐵甕城、狠石、浮玉、南徐、多景樓、瘞鶴等,對上述數據進行二次清洗。
以步驟1、2搜索出來的詩詞為基礎,通過手動排查,共得到與鎮(zhèn)江運河有關詩詞共718 首,其中唐代148 首,宋代226 首,元代97 首,明代100 首,清代147首。
2.2.2 數據分析
(1)詩詞主題分析
利用R 語言將718首詩詞進行主題分析,分析結果如圖3所示,歷代與鎮(zhèn)江運河相關詩詞涉及的地名主要包括京口、海門、西津、金山、揚州、江南等。除去地名后發(fā)現(xiàn),詩人常用到萬里、何處、江山、故人、青山等詞匯,來抒發(fā)詩人在鎮(zhèn)江段運河沿線的所見所感,圍繞家國、人世、親情、友情、愛情等主題,表達了作者們的思想感情,也反映了當時的社會狀況。

圖3 詩詞主題分析圖
(2)詩文情感分析
通過使用ROST 情感傾向分析工具將718 首詩詞進行情感分析,分析結果顯示,近40%的詩人在鎮(zhèn)江運河上表達了積極的情緒,有對漕運開通帶來繁榮的稱贊,有對鎮(zhèn)江運河繁榮景象的驚嘆;有37%的作者表達了些許的消極情緒,或是對漕運開通耗費了大量人力、物力的悲嘆,或是對自己際遇的不滿??梢钥闯?,大運河的開鑿在一定程度上影響著詩詞創(chuàng)作的主題,出現(xiàn)了很多對大運河開通運行的功過評判、反思的詩文,同時也出現(xiàn)了以大運河寄托情感和心緒的作品,在文人筆下將運河記憶展現(xiàn)得淋漓盡致。
2.2.3 可視化展示
西津古渡是國家級文物保護單位,自三國時期,西津渡就是當時鎮(zhèn)江通往江北的唯一渡口,具有極其重要的戰(zhàn)略地位,孫權的東吳水師曾駐守于此,唐代以后更是有兵丁守衛(wèi)巡邏。宋熙寧元年(1068)春,王安石應召赴京,從西津渡啟航北上,舟行至瓜洲,見景抒情,寫下了千古絕句“京口瓜洲一水間,鐘山只隔數重山。春風又綠江南岸,明月何時照我還?!惫P者以該詩為例,根據運河文化遺產本體模型,文獻—地點—人物關聯(lián)實體如圖4 所示。可以看出,文獻實體“《泊船瓜洲》”、地點實體“西津渡”、人物實體“王安石”在一定程度上實現(xiàn)了互通互聯(lián)。以此,根據圖4的實例關系模型,利用DSpace系統(tǒng)進行構建,實現(xiàn)了相關實體的可視化展示,如圖5 所示。通過對文獻內容、地點和人物的資源整合,可使用戶通過文獻內容了解更多相關地點、人物信息;同理,也可通過地點或其他類關聯(lián)到相關信息。

圖4 《泊船瓜洲》關聯(lián)實例

圖5 《泊船瓜洲》可視化展示
本研究通過構建大運河文化遺產知識庫,可以實現(xiàn)運河文化遺產的數字化保存,對運河文化遺產資源的地域情況、活動特征、文獻內容、人物信息等進行多方面的深入挖掘與組織。通過對鎮(zhèn)江段文化遺產資源進行組織、關聯(lián)與展示,形成一個可以長期存儲的數字化平臺,并使得資源間可以進行深度關聯(lián)和展示,從而滿足運河文化遺產資源的存儲、管理、共享等需求。本知識庫仍存在如界面功能不夠完善等許多不足,未來將加強對軟件系統(tǒng)功能的深入開發(fā),完善大運河文化遺產知識庫,并將繼續(xù)挖掘有關大運河的信息資源,以豐富平臺的資源與內容,力求能夠將所有運河沿線城市的資源進行相互關聯(lián)整合,實現(xiàn)運河文化的全方位、多層次展示。
隨著大數據技術的發(fā)展,跨學科的研究顯得越發(fā)重要。將文化與科技相融合是目前歷史文化領域研究的大勢所趨。應改變傳統(tǒng)的文化傳播、交流方式以及知識存儲、組織、共享的模式,結合全新的數字技術促使大運河文化遺產資源從現(xiàn)實世界向數字空間遷移,實現(xiàn)文化遺產的活化。習近平總書記曾提到:“要古為今用,深入挖掘以大運河為核心的歷史文化資源。保護大運河是運河沿線所有地區(qū)的共同責任[27]。”筆者以大運河鎮(zhèn)江段文化遺產資源為例,通過采用本體和知識庫技術,對鎮(zhèn)江段大運河文化遺產資源進行知識組織,初步構建了鎮(zhèn)江段運河文化遺產知識庫。一方面有益于推進大運河文化遺產資源知識組織體系建設,為科研人員研究運河提供數據關聯(lián),另一方面也有助于向大眾推廣和普及運河文化,有利于大運河旅游資源的深度開發(fā),提高地方文化軟實力。