999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文化大數據背景下線性文化遺產資源知識表示及語義增強框架構建

2023-11-15 05:56:21孫紹丹張莉曼朱祥
現代情報 2023年11期

孫紹丹 張莉曼 朱祥

摘 要: [目的/ 意義] 構建線性文化遺產資源知識表示及語義增強框架, 為文化機構開展文化遺產智慧化數據建設及推動優秀傳統文化創新性發展提供路徑參考。[方法/ 過程] 在提煉線性文化遺產“資源族群性、時間流動性和空間鏈狀性” 特征基礎上, 剖析線性文化遺產知識體系的層級結構, 建構線性文化遺產資源知識表示模型, 并依據表征理論和情境認知理論, 從結構化語義增強和情境化語義增強視角對線性文化遺產數據進行語義增強, 創新性地提出“時空” 雙重維度語義增強路徑, 最后以京杭大運河線性文化遺產為例, 進行大運河知識表示及語義增強案例研究。[結果/ 結論] 本文構建的知識表示模型及語義增強框架有利于推進線性文化遺產數據的多維語義組織和深度挖掘研究, 提升線性文化遺產內容的語義互聯性和外延性。

關鍵詞: 文化大數據; 線性文化遺產; 知識表示; 語義增強; 京杭大運河

DOI:10.3969 / j.issn.1008-0821.2023.11.008

〔中圖分類號〕G254 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 11-0096-16

2022 年, “國家文化數字化戰略” 意見明確提出到“十四五” 時期末, 基本建成物理分布、邏輯關聯、快速鏈接、高效搜索、全面共享、重點集成的國家文化大數據體系, 使中華文化全景呈現。由此可見, 文化大數據浪潮已然迭起。線性文化遺產是指擁有特殊文化資源集合的線性或帶狀區域內的物質和非物質文化遺產族群, 如運河、廊道、峽谷、古道等, 其理念是通過對沿線文化遺產進行有效串聯, 構成鏈狀的文化遺存狀態, 形成長期賡續的遺產生態系統, 實現遺產的整體化保護與活化[1] 。作為重要的文化資源, 線性文化遺產蘊含著豐富的人文意義和文化內涵, 亟待依托大數據和人工智能技術深度組織和挖掘遺產內容要素, 鉤沉線性文化遺產中的精神之源和思想精髓, 讓遺產中的厚重文化基因與當代形成價值和鳴, 從而推動中華優秀傳統文化的創造性轉化和創新性發展。

本文通過提煉線性文化遺產資源的時空屬性特征, 構建線性文化遺產知識表示模型。基于認知心理學中的表征理論和情境認知理論, 提出從結構化語義增強和情境化語義增強兩個維度對線性文化遺產進行語義增強, 并以京杭大運河為例, 對線性文化遺產知識表示模型進行實例研究, 在此基礎上進行結構化和情境化語義增強, 從而提升線性文化遺產內容的語義互聯性和外延性, 推動線性文化遺產資源共享傳播和活化利用。

1 研究現狀

1.1 線性文化遺產研究現狀

通過文獻調研, 國內外有關線性文化遺產的研究呈現多學科分布特點, 如地理學、環境科學、歷史學、藝術學、傳播學、圖情檔等學科都對線性文化遺產進行不同視角的探索。研究內容聚焦于線性文化遺產價值評估、旅游開發、活化利用模式構建、遺產廊道構建、保護模式探索等方面, 如探討虛擬現實及數字敘事技術在線性文化遺產旅游開發中的應用[2] 、提出線性文化遺產的文化價值觀塑造[3] 、探索線性文化遺產沿線重要節點旅游發展模式[4] ,構建分層次、有重點的線性文化遺產保護普適性空間格局[5] 。在項目實踐方面, 北京大學俞孔堅教授牽頭構建了“國家線性文化遺產網”, 提出涵蓋交通線路、軍事工程、自然河流與水利工程及歷史主題事件四大類型的19 個線性文化遺產[6] , 如大運河、絲綢之路、長城、茶馬古道等。在線性文化遺產資源組織研究方面, 國內外成果相對較少, 如徐芳教授以瀟賀古道和大運河線性文化遺產為例, 在元數據描述和關聯數據模型構建方面發表了系列成果[7] , 但局限于資源的淺層組織層面, 缺乏對線性文化遺產特征的深層剖析, 尚未對資源內容進行細粒度解構。

1.2 知識表示研究現狀

知識表示是指在計算機系統中對領域知識進行抽象、表達和存儲的一種方式, 一般采用邏輯表示、框架表示、語義網絡及本體等形式化工具來表示知識, 以便計算機能夠理解、推理和處理。在文化遺產領域, 知識表示相關研究主要以理論探索和模型構建為聚焦點, 研究對象聚焦于文物、文化遺產圖像、印章、歷史報紙文獻[8] 、方志物產及非遺資源等。在理論探索方面, 主要以知識組織為研究核心, 探討文化遺產領域語義組織研究現狀[9] , 剖析文化遺產領域核心共享概念及領域知識關聯關系,構建文化遺產領域知識綱要[10] 。在知識表示模型構建研究方面, 主要以本體和知識圖譜構建為技術線路[11] , 構建文化遺產知識表示模型。如Wang X等[12] 采用知識圖譜方法對文化遺產進行知識表示,借助機器學習技術和語義Web 技術, 將元數據中的實體、屬性和關系與外部知識資源進行鏈接, 從而建立文化遺產知識圖譜。宋雪雁等[13] 采用知識圖譜技術對清代祭祀禮器進行知識表示、關聯及發現研究。張衛等[14] 構建了非遺“古琴藝術” 細粒度知識語義表示及關聯模型。同時, 針對敘事型文化遺產, 有學者提出基于角色關聯的知識表示方式,以解決現有知識表示方法存在的角色缺乏情境依賴與表示角度單一問題。

1.3 語義增強研究現狀

語義增強是伴隨語義網技術和文本處理技術而逐漸發展起來的概念, 指采用各種技術和方法向內容添加語義元數據, 旨在增強數據的語義理解力[15] , 與語義描述、語義標注、語義分析、語義關聯、語義融合和語義發現等知識組織活動息息相關。

歐盟數字圖檔博聯盟也構建了語義增強框架, 將其劃分為分析、鏈接和擴充3 個階段。其中分析階段著重于元數據框架的制定, 定義原始字段與語境資源之間的匹配與鏈接規則; 鏈接階段是采用實體鏈接等方式自動將元數據字段的值與語境資源的值進行匹配, 從而將語境鏈接添加到數據集當中; 擴充階段是指通過外部數據源或知識庫等方式實現原始對象資源語義的增強。Damjanovic-Behrendt V 等[16]將語義增強過程劃分為語義搜索、語義中介、語義標注、語義分析和知識發現階段。語義搜索階段旨在用語義技術增強傳統關鍵字搜索, 提高查全率和查準率, 如進行多面檢索、語義自動補全等; 語義中介階段包括數據合并和映射, 合并主要指重疊部分的本體之間的合并行為。映射是構建映射語句,定義本體間轉換規則; 語義標注階段旨在明晰文檔中概念及概念之間的關系, 使機器可理解和可互操作; 語義分析和知識發現階段是通過分析實體語義關系來進行數據搜索和知識發現的過程。近年來,在文化遺產領域, 語義增強技術逐漸受到關注。如Abgaz Y 等[17] 基于人工智能技術對文化遺產圖像資源進行語義增強, 采用深度學習模型進行圖像識別和標注, 并用本體論方法對圖像元數據進行描述和分類, 提高了圖像的可訪問性和可發現性。Tan X等[18] 基于圖像學理論, 提出文化遺產數字圖像語義豐富的系統方法和技術途徑, 如語義注釋、基于實體的語義增強、建構數據關聯關系、以事件為中心的語義增強、定義屬性之間的層級關系、命名實體識別等, 以此增強文化遺產圖像的語義化特征。

綜上, 文化遺產領域的知識表示及語義增強研究成果相對豐富, 但針對線性文化遺產資源進行知識組織、知識表示及語義增強的文獻相對不足, 且缺乏對線性文化遺產資源特征進行分析提煉, 區別于點狀或面狀的遺產資源, 線性文化遺產往往呈現“遺產族群性、空間鏈狀性、時間流動性” 等特征,如何結合上述特征, 進行線性文化遺產資源的知識表示及語義增強研究, 成為學界關注焦點。鑒于此,本文通過構建線性文化遺產資源知識表示及語義增強框架, 以大運河為例, 旨在為線性文化遺產資源的語義組織提供可操作性的方法指導, 推進線性文化遺產資源的開發和利用。

2 線性文化遺產資源特征分析

線性文化遺產一詞是由原故宮博物院院長單霽翔先生提出, 強調遺產資源的鏈狀特征和集群效應。截至2023 年3 月, 聯合國教科文組織世界遺產中心發布的《世界遺產名錄》中, 共有1 157處世界遺產[19] , 主要以自然遺產、文化遺產和雙重遺產進行分類。其中, 中國世界遺產總數為56 處。雖然國內外學者對世界遺產類型進行研究, 但尚未剝離出線性文化遺產資源類型。張書穎等[20] 結合世界遺產委員會的遺產項目評語, 根據《世界遺產名錄》總結出33 處線性文化遺產, 中國有代表的當數長城、大運河以及絲綢之路—長安—天山走廊路線。這些資源文化和歷史價值豐富, 亟待現代技術賦能推動資源的活化利用。本文參考文獻[20]對線性文化遺產資源組合模式的分析, 如圖1 所示,結合線性文化遺產的概念及內涵, 以京杭大運河為例, 闡釋線性文化遺產資源的主要特征。

2.1 資源族群性

在線性文化遺產資源形成和發展過程中, 人類活動的群體性質一定程度上塑造了線性文化遺產的族群性特征, 沿線地域的人文地理特征和歷史文化積淀成獨特的文化遺產資源, 分布在一定的地域范圍內, 因此族群性是線性文化遺產最顯著的特征之一。由圖1 可以看出, 資源點聚集性分布, 沿中心軸線呈單側或雙側分布。例如京杭大運河是薈萃沿線眾多物質和非物質文化遺產的線性廊道, 包括物質文化遺產(如揚州瘦西湖、蘇州盤門等)和非物質文化遺產(如錫劇、昆曲等)。相對于單點的遺產資源, 線性文化遺產集聚性特征更加突出, 從單一范圍的“點” 轉向“線” “面”, 經過自然、歷史、社會和文化等多方面因素的影響, 形成獨具特色的資源集群。

2.2 空間鏈狀性

由圖1 可以看出, 線性文化遺產在空間分布上呈現“鏈狀” 性特征, 具有明顯的空間延伸性和連續性, 既反映了地域文化的獨特性和復雜性, 也反映了社會、政治、經濟和文化等因素的交織和影響。在線性文化遺產空間結構研究方面, 李飛[21] 提出線性文化遺產空間要素包括節點、廊道和輻射域面。節點即資源點, 節點之間相互作用影響形成了廊道,節點和廊道在自然和社會環境共同作用下形成了輻射域面。整體來看, 線性文化遺產空間結構也隨著社會變革和環境影響進行不斷的演化, 如京杭大運河在不同歷史時期河道變遷歷程復雜多樣, 受文化、政策、軍事、經濟等多種因素影響, 但總體上呈現出鏈狀分布特征, 在地理空間上表現出明顯的延伸性。因此, 在對線性文化遺產資源進行知識表示及語義增強時, 需要充分考慮其空間鏈狀性特征, 將空間因素考慮到語義增強框架構建過程中。

2.3 時間流動性

時間流動性指的是線性文化遺產在歷史長河中的流動和演變特征。具體來說, 這些遺產的產生、發展和消亡都是在特定的歷史時期和歷史背景下發生的, 需要歷經時間的沉淀和積累, 記錄了人類社會在不同歷史時期的文化、經濟、政治和社會變遷,是歷史文化發展的產物, 呈現出動態變化特征。例如京杭大運河歷史悠久, 溯源于春秋, 完成于隋朝, 繁榮于唐宋, 取直于元, 疏通于明清, 距今已2 500多年的歷史。大運河的開鑿、發展及繁榮的歷史進程凝結著中國人民的智慧。不管是因河道、船閘、行船等而興起的文物資源, 還是沿線的戲曲、文學、藝術、美食、民謠等非遺資源都在流動的變遷之中, 孕育著中華民族頑強不息的文化基因。放眼于歷史長河, 大運河線性遺產盡顯歷史滄桑變遷的年輪, 具有典型的時間流動性特征。因此, 在對線性文化遺產資源進行知識表示及語義增強時, 也同樣需要考慮資源的時間序列關系, 構建時空整合的語義模型, 增強數據的語義特征。

3 線性文化遺產資源知識表示及語義增強研究框架

本文在線性文化遺產資源特征分析基礎上, 構建線性文化遺產知識表示及語義增強框架, 如圖2所示。首先, 從知識概念本源視角出發, 解析知識的分類維度, 從陳述性知識、程序性知識和情境性知識3 個維度進行定義, 結合線性文化遺產資源特征, 分析其知識體系的層級結構; 其次, 采用元數據、本體建模技術, 參考成熟的本體模型, 從概念對象層、內容表征層和語義情境層構建線性文化遺產知識表示模型; 最后, 以認知科學中的表征理論和情境認知理論為基礎, 從結構化語義增強和情境化語義增強維度探究線性文化遺產語義增強方法。在上述框架基礎上, 以京杭大運河線性文化遺產為例, 進行大運河知識體系構建、知識表示模型構建及語義增強方法研究。

3.1 線性文化遺產知識體系層級結構

知識是人們在改造世界的實踐中所獲得的認識和經驗的總和, 是對客觀世界的概括和總結, 也是對自然界、人類社會和思維活動規律的認識。知識體系是描述特定專業知識綜合的概念性術語, 知識需要人們經過實踐活動獲取經驗, 對經驗進行消化、積累、思考、歸納、理解、抽象而上升為知識體系。本文參考經濟合作與發展組織(OECD)對知識分類, 并結合用戶情境認知理論中對于知識的獲取要依賴一定的社會情境, 歸納出陳述性知識、程序性知識和情境性知識3 個維度, 以此為基礎, 在不同的知識維度內定義知識體系的層級結構, 如圖3所示。

陳述性知識包括概念層和對象層, 程序性知識包括狀態層和特征層, 情境性知識包括關系層、時空層和敘事層。概念層主要用以表達線性文化遺產知識體系中的概念描述, 從宏觀維度解析, 將線性文化遺產劃分為物質文化遺產和非物質文化遺產,前者又可以進一步劃分為可移動文物和不可移動文物, 概念結構層層遞進; 對象層主要用以表示線性文化遺產的構成對象; 狀態層是指對象在特定的事件演化過程中所發生的變化、動作和記錄; 特征層定義了不同對象所具有的外部特性; 關系層用以表達線性文化遺產概念、對象、狀態等之間的聯系;時空層主要以建構時空框架為主要目標, 參考俞肇元等[22] 學者提出的地理信息要素“七維度”, 即地理語義、空間位置、幾何形態、屬性特征、要素關系、演化過程和作用機制, 可以構建地理信息時空框架圖; 敘事層是以數據故事化理論為基礎, 對敘事過程進行建模分析, 遵循數據故事工程化思維展開研究。

3.2 線性文化遺產知識表示模型

知識表示是一種用來描述和組織知識的形式化方法, 通過定義實體及其關系來表示知識。線性文化遺產知識表示模型是一種用于描述和組織線性文化遺產數據的形式化方法, 旨在將復雜的線性文化遺產知識以計算機可理解和處理的形式進行表示和存儲。本文在3 1 知識體系層級結構基礎上, 將概念層和對象層概括為概念對象層, 將狀態層和特征層概括為內容表征層, 將關系層、時空層及敘事層概括為語義情境層, 從以上3 個維度構建線性文化遺產資源知識表示模型。

概念對象層聚焦于線性文化遺產知識體系中的概念描述和對象表達, 將概念和對象抽象為本體建模中的類和實例, 定義概念類和對象實例之間的層次關系。內容表征層聚焦于線性文化遺產的內容特征及狀態變化, 將特征和狀態抽象為本體中的數值屬性和對象屬性, 以表示線性文化遺產對象的特征和狀態, 如文物的年代、材質、尺寸等。語義情境層聚焦于線性文化遺產內容的語義關系及語境信息的傳遞及表達, 如所屬文化機構及其在時間和空間上的關聯, 實現對知識的關聯性分析和語義豐富。

3.3 線性文化遺產語義增強框架

語義增強本質上是一種語義組織活動, 能進一步揭示數據語義內涵, 增強數據內容表達的外延能力, 提高數據利用價值。本文在線性文化遺產知識表示模型基礎上, 結合線性文化遺產“資源族群性、空間鏈狀性、時間流動性” 等特征, 從認知心理學的表征理論和情境認知理論解析語義增強的兩個不同維度, 即結構化語義增強和情境化語義增強。

表征理論是指人類思維中的信息被組織成一系列表征, 每個表征均包含事物的知識和特征, 任何表征都依賴一定的結構, 即表征方式或結構方式。結構化語義增強從表征理論出發, 在原有知識體系基礎上, 對結構化數據進行語義擴展, 如基于本體擴展的語義增強和基于實體鏈接的語義增強等, 目的是豐富數據的語義表達, 更好地支持數據復用、共享和智能化處理。線性文化遺產結構化語義增強是從資源特征信息入手, 在原有數據基礎上增加有關此數據的外部信息源, 構建資源的“聚集性” 和“網絡性” 集群, 契合線性文化遺產的族群性特征,實現數據的互聯互通。

情境認知理論是在行為主義、認知學習理論及建構主義基礎上發展起來的, 強調知識獲取依賴一定的情境, 不能孤立存在。情境化語義增強考慮情境認知理論相關要素, 結合線性文化遺產的時空特性, 從時間和空間兩個維度建構知識的情境場域,拓展線性文化遺產語義表達內涵, 讓語義描述更加豐富、精準, 以提高信息準確性和實用性, 滿足用戶個性化和沉浸化需求。線性文化遺產情境化語義增強是從線性文化遺產語義信息入手, 在原有數據基礎上增加多維信息特征和內容, 結合線性文化遺產資源的空間鏈狀性和時間流動性特征, 采用時間序列方法及空間POI(Point of Interest)技術來構建線性文化遺產的“情境化” 集群, 實現數據集成共享。

4 實例探究———京杭大運河線性文化遺產知識表示及語義增強

4.1 京杭大運河線性文化遺產概覽

京杭大運河是世界上最長的人工運河, 始建于春秋時期, 見證了我國2 500余年的歷史, 北起通州, 南至杭州, 流經北京、天津、河北、山東、江蘇、浙江等省市, 全長1 794km, 是中國歷史上南糧北運、軍資調配和水利灌溉等用途的生命航道,是中華民族的寶貴財富。大運河沿線文化遺產資源豐富, 沿河興起的碼頭、城鎮、船閘、橋梁、堤壩、石刻、墓葬、建筑園林、戲曲歌舞等形成了大量的線性文化遺產, 其中擁有世界文化遺產的河道遺產、水工遺存及相關遺產共計85 處, 非物質文化遺產450 余項[23] 。2014 年6 月, 京杭大運河被正式列入《世界文化遺產名錄》。2021 年8 月, 國家文化公園建設工作領導小組印發《大運河國家文化公園建設保護規劃》, 以整合大運河沿線8 個省市文物和文化資源為主要目標。2022 年6 月,江蘇省文投集團打造了大運河國家文化公園數字云平臺, 由“知運河、探運河、游運河” 3 個核心板塊構成, 以全新方式展示了運河文化產業生態圈。本文以京杭大運河線性文化遺產作為主要研究對象, 在大運河知識概念體系基礎上, 構建大運河線性文化遺產資源知識表示模型及語義增強框架, 以此推進線性文化遺產數據的深度組織和挖掘。

4.2 京杭大運河線性文化遺產知識體系層級結構

根據圖3 線性文化遺產知識體系層級結構, 結合京杭大運河資源特征, 繪制京杭大運河線性文化遺產知識體系層級結構, 如圖4 所示。概念層揭示了線性文化遺產的分類體系; 對象層列舉了大運河沿線具體的實例對象, 如岳飛墓等; 狀態層描述了部分資源的演化狀態; 特征層主要對資源外部特征進行揭示, 如資源材質、來源、風格、載體等; 關系層揭示了概念、對象、狀態之間的關聯關系; 時空層表達了時間和空間維度的結構和特征; 敘事層傳遞了相關事件的敘事單元, 與時空框架關系緊密。

4.3 京杭大運河線性文化遺產知識表示模型

本文主要采用本體建模方式對大運河線性文化遺產資源進行知識表示, 從概念對象層、內容表征層和語義情境層3 個維度構建京杭大運河線性文化遺產知識表示模型。針對概念對象層所表達的內容,抽象出大運河“核心類”, 即大運河類、河道類、文物類及非遺類; 針對內容表征層及語義情境層所表達的內容, 為提高數據互操作性, 主要復用文化遺產領域使用較為廣泛的歐洲數據模型(EuropeanData Model, EDM) 和CIDOC-CRM 本體模型中的相關類和屬性, 它們在文化遺產領域提供了廣泛認可的通用概念、屬性和關系框架, 通過復用模型,可以避免重復性工作, 在已有基礎上對大運河線性文化遺產數字資源進行數值屬性、對象屬性、時空關系及事件情境等的描述, 建立起適用于大運河線性文化遺產的數據模型, 從而提高數據的互操作性、標準化程度和跨領域的可擴展性。本文所構建的模型共包括8 個類, 39 個屬性, 這些屬性來源于CRM、EDM、DC、OWL、FOAF、RDFS、SKOS、GEO 等, 且包括10 個自定義屬性, 如圖5、圖6 所示。表1 以實例形式展示大運河線性文化遺產知識表示模型。

4.4 京杭大運河線性文化遺產語義增強

4.4.1 京杭大運河線性文化遺產結構化語義增強

1) 基于本體擴展的語義增強

本體擴展是在原有本體基礎上添加新的實體、屬性或關系, 增加原有知識表示模型的關系豐富度、屬性豐富度, 提高模型數據內容表達的外延能力,以適應新的應用場景。主要方法包括基于知識體系的本體擴展和基于推理技術的本體擴展。

基于知識體系的本體擴展。本文在3 1 線性文化遺產知識體系基礎上, 結合《中國古代建筑分類標準》《文物保護單位建筑物分類和代碼》《中華人民共和國文物保護法》等多個標準規范, 對京杭大運河線性文化遺產知識表示模型進行內容擴展。根據模型中核心類和情境類對象特征, 進一步劃分子類, 如圖7 所示, 如文物類可以分為可移動文物和不可移動文物, 前者包括實物、藝術品等,后者包括水利工程遺址、古墓葬及古建筑等; 事件類可以劃分為展覽、會議及節日事件等。其中情境類可以參考成熟的本體模型, 如Event、ORG、FOAF、TIME、GEO 等。大運河屬性值擴展主要基于核心類資源屬性特征及資源的實際具體應用情況, 并參考相關本體模型的屬性加以擴展, 如引入Event 本體中的isSubEventOf、isSuperEventOf 屬性;Time 本體中intervalMeets、intervalOverlaps、before、after 屬性; Geo 本體中timezone、adjacent 屬性等。

在京杭大運河知識表示模型構建過程中, 只將古建筑作為文物大類進行子類劃分, 在實際的大運河領域本體應用過程中, 必然要細化資源類和屬性特征, 以滿足用戶實際需求。本文以大運河蘇州盤門古建筑為例, 闡釋基于知識體系的本體擴展過程。依據建筑敘事學理論(Architectural Narratives), 借鑒陸邵明[24] 學者提出的建筑敘事學本體建構維度,將古建筑劃分為空間敘事主體(Agent)、空間敘事載體(Carrier)、空間敘事結構(Structure)、空間敘事風格(Style)4 個類。敘事主體(Agent)又可以劃分為人物(Person)和組織(Organization) 兩個子類;空間敘事載體(Carrier) 分為虛擬空間、空間語言及空間實踐3 個子類; 空間敘事結構(Structure)包括金字塔式、迷宮式、鏡像式、迭代式、離散式以及線性模式等概念類別, 用skos:Concept 表示;空間敘事風格(Style)包括歷史圖式風格、自然圖式風格、現實圖式風格、烏托邦式風格等, 用skos:Concept 表示, 如圖8 所示。對于屬性擴展可以根據實際具體情況進行自定義擴展, 或參考本體詞表進行擴充。

基于推理技術的本體擴展。推理是對本體中概念及關系進行邏輯推理和判斷, 自動生成新概念及關系, 以此擴展本體語義表示能力。通常采用基于規則和語義相似度的本體方法, 根據規則和實體間語義相似度推斷出新概念、實例屬性及關系。表2展示了兩組基于規則的本體推理描述性語言。在實際應用過程中, 可以利用OWL-RL 推理引擎定義復雜的一些規則來推導新知識。

基于語義相似度的本體推理主要應用于本體的實例拓展, 將外部數據源引入到本體知識框架體系中, 豐富本體知識內容。以大運河古建筑“蘇州盤門” 為例, 如圖9 所示, 在大運河古建筑本體基礎上, 采集有關蘇州盤門游記、歷史書籍及網絡資源等, 用自然語言處理技術進行數據預處理, 提取簡介、建筑風格、特征等數據, 再利用LDA 或LSA 主題建模抽取文本內容主題類別, 比如有建筑風格、歷史沿革、旅游信息及地理環境等主題, 用余弦相似度或歐幾里得距離計算該主題類別與大運河古建筑本體中的實體相似度, 降序排列, 選取最優實體概念擴展原有本體。

2) 基于實體鏈接的語義增強

實體鏈接是將文本實體鏈接到知識庫對應實體的過程, 是自然語言處理和信息檢索等領域的重要任務。在大運河線性文化遺產本體模型基礎上, 以“蘇州盤門” 為例, 通過鏈接VIAF、TGN、ASCDC、AAT、LOCAH 等外部詞表來增強盤門實體語義內涵, 如圖10 所示。通過OWL 中的owl:sameAs 屬性, 將本地實體“盤門” 與DBPedia、WikiPedia、BaiduBaike 等外部數據源進行實體關聯, 通過URI鏈接到本地, 如圖11 所示。

4.4.2 京杭大運河線性文化遺產情境化語義增強

1) 基于時間序列的語義增強

時間維度是歷史事件敘事過程中不可或缺的要素, 助力學者厘清事件演變過程中的時序變化特征,深化對事件來龍去脈的認知。大運河歷史悠久, 具有典型的時間流動性特征。本文以大運河(江蘇段)河道演變事件為軸心, 融合多模態數據, 如文本、圖像、視頻等資源, 從大尺度和長時段視角揭示大運河河道的歷史演變特征, 并將大運河河道知識表示模型映射到河道演變事件的時序建模過程中, 采用TimeLineJS 工具可視化呈現大運河線性文化遺產河道演變的時序特征, 如圖12 所示, 數據源如表3 所示, 呈現了不同歷史時期河道開鑿事件的演變歷程, 以增強數據的內容表達力。圖12 中底部橫軸表示時間跨度, 上部左側是大運河(江蘇段)在先秦時期河道開鑿地圖, 參照大運河國家文化公園數字云平臺相關資料, 同時增加外部視頻鏈接以擴展河道知識內容。上部右側展示的是河道開鑿事件的本體知識表示模型, 以“邗溝河道” 為例,結合本文構建的大運河知識表示模型, 構建“邗溝河道” 知識網絡圖, 對其事件要素進行結構化呈現。其他河道知識網絡圖如表3 Media 列所示。通過揭示大運河河道歷史演變的時序特征, 深化對河道形態、開鑿事件和重要歷程的認知。通過時序建模和可視化展示, 能夠連貫地呈現大運河河道在不同時期的變化, 使歷史事件與具體時代相結合,豐富知識表示模型。這不僅幫助學者厘清歷史事件的連續性, 還提供了更深入的歷史背景信息, 可以更加準確地理解和感知大運河作為線性文化遺產的重要價值。

2) 基于空間POI 的語義增強

興趣點(Point of Interest, POI)是地理信息系統領域的一個概念, 通常由地理坐標和一些附加屬性(如名稱和類別)定義, 指地理空間中的特定位置場所, 被用作地圖上的標記點, 作為地理信息的重要組成部分, 已成為人們日常生活中獲取信息和進行位置服務的重要途徑。本文通過POI 數據來增強文化遺產數據中所包含的空間語義內涵, 使POI 更具有可讀性、可理解性和可操作性。

京杭大運河通常被劃分為通惠河與北運河段、南運河段、梁濟運河段、南四湖區段、不牢河段、中運河段、里運河段及江南運河段[25] 。本文以江南運河段為例進行空間POI 遺產數據的語義增強,采用TimeMapper5 工具對江南運河段的文化遺產進行空間POI 數據呈現, 如圖13 所示, 并以蘇州盤門古建筑為例, 進行POI 數據的語義增強, 如圖14所示, 首先將盤門古建筑與古建筑知識表示模型進行關聯, 其次增加外部實體超鏈接, 鏈接百度地圖盤門POI 位置, 利用百度地圖API 獲取盤門固定半徑之內的POI 數據, 包括圍繞盤門景區的“衣、食、住、行、游” 等維度數據。同時, 收集外部旅游數據平臺如馬蜂窩、攜程、同程、飛豬等網站上關于盤門的游記文本信息, 采用地名實體識別工具LTP 進行POI 數據擴展, 從而構建圍繞盤門的POI 數據語義增強模型, 實現盤門POI 數據從知識概念層到知識應用層的轉換。通過空間維度的語義增強, 運用POI 數據進一步豐富線性文化遺產數據的空間語義內涵, 使特定位置場所更具實際含義, 具備更高的可讀性、可理解性和可操作性, 提升地理信息的交互性與實用性, 使人們能夠更深入地了解、感知并參與文化遺產的傳承與傳播, 進一步拓展了地理信息的應用價值。

5 結 論

隨著信息技術的飛速發展和數字化時代的到來, 文化大數據化已成為發展趨勢。線性文化遺產作為我國豐富而獨特的文化瑰寶, 蘊含著豐厚的歷史價值和文化內涵。本文在此背景下, 以京杭大運河線性文化遺產為例, 深入到線性文化遺產內容層面, 深度剖析線性文化遺產知識體系的層級結構,建構線性文化遺產知識表示模型, 并依據表征理論和情境認知理論, 從結構化語義增強和情境化語義增強視角對線性文化遺產進行語義增強, 創新性地提出“時空” 雙重維度語義增強路徑。其中, 時間維度的語義增強主要通過在大運河(江蘇段)河道演變事件中引入時間維度, 融合多模態數據如文本、圖像、視頻等, 采用TimeLineJS 工具的時序可視化呈現, 以大尺度和長時段視角揭示大運河河道的歷史演變特征, 有助于更清晰地厘清不同歷史時期的河道開鑿事件, 使事件的時序變化特征得以凸顯, 為學者提供更具體、更完整的歷史敘事。空間維度的語義增強主要通過POI 數據實現, 利用TimeMapper 工具對文化遺產的空間POI 數據進行可視化呈現, 以及通過盤門古建筑實例進行語義增強, 通過將古建筑與知識表示模型關聯、超鏈接至百度地圖、整合周邊維度數據等方式, 從多個維度豐富POI 信息, 旨在使POI 數據更富有可讀性、可理解性和可操作性, 進一步豐富地理空間中的特定位置場所的信息, 為人們提供更豐富的位置服務和文化遺產的互動體驗, 加深對文化遺產的認知與了解。在后續的研究中, 筆者將會繼續完善本文所建構的線性文化遺產知識體系, 通過量化分析和統計分析方法對線性文化遺產POI 數據進一步挖掘和處理, 從實證角度探索更多的可能性。

參考文獻

[1] 單霽翔. 大型線性文化遺產保護初論: 突破與壓力[ J]. 南方

文物, 2006, (3): 2-5.

[2] Gon?alves A R, Dorsch L L P, Figueiredo M. Digital Tourism:

An Alternative View on Cultural Intangible Heritage and Sustain?

ability in Tavira, Portugal [ J]. Sustainability, 2022, 14 ( 5):

2912.

[3] Brinia V, Psoni P, Ntantasiou E K. How to Instill Cultural Values in

the New Generation Through Cultural Promenades and Ancient Drama:

A Field Research [J]. Sustainability, 2019, 11 (6): 1758.

[4] 李飛, 鄒統釬. 線性文化遺產重要節點旅游發展模式研究———

以云南碧色寨為例[J]. 地理與地理信息科學, 2022, 38 (5):

138-144.

[5] 劉軍民, 張清源, 鞏岳, 等. 國土空間規劃中線性文化遺產的

保護利用研究———以咸陽市為例[ J]. 城市發展研究, 2021,

28 (3): 7-13.

[6] 俞孔堅, 奚雪松, 李迪華, 等. 中國國家線性文化遺產網絡構

建[J]. 人文地理, 2009, 24 (3): 11-16, 116.

[7] 劉美杏, 徐芳. 古道文化遺產信息資源元數據標準制定———以

瀟賀古道為例[J]. 情報資料工作, 2019, 40 (4): 77-83.

[8] 孫紹丹, 鄧君, 常嚴予, 等. 近代報紙資源細粒度語義描述模

型設計及應用———以《盛京時報》為例[ J]. 圖書情報工作,

2022, 66 (7): 35-46.

[9] 李章超, 何琳. 文化遺產語義組織研究進展[J]. 圖書情報工

作, 2020, 64 (7): 4-12.

[10] 侯西龍, 王曉光, 翁夢娟. 文化遺產領域知識綱要研究[ J].

圖書情報工作, 2022, 66 (22): 106-118.

[11] 孫紹丹. 數字人文視域下歷史報紙資源語義化知識組織研究

[D]. 長春: 吉林大學, 2023.

[12] Wang X, Chang W, Tan X. Representing and Linking Dunhuang

Cultural Heritage Information Resources Using Knowledge Graph

[J]. Knowledge Organization, 2021, 47 (7): 604-615.

[13] 宋雪雁, 張偉民, 張祥青. 基于檔案文獻的清代祭祀禮器知

識圖譜構建研究[J]. 圖書情報工作, 2022, 66 ( 3): 140-

151.

[14] 張衛, 王昊, 李躍艷, 等. 面向非遺文本的知識組織模式及

人文圖譜構建研究[J]. 情報資料工作, 2021, 42 (6): 91-

101.

[15] 曾蕾, 譚旭. 數據的語義增強———解讀圖檔博支持數字人文

的新動向[J]. 數字人文研究, 2021, 1 (1): 65-86.

[16] Damjanovic-Behrendt V, Kurz T, Westenthaler R, et al. Seman?

tic Enrichment: The Key to Massive and Heterogeneous Data Pools

[C] / / Proceeding of the 20th International IEEE ERK ( Electro?

technical and Computer Science) Conference, 2011: 413-416.

[17] Abgaz Y, Souza R R, Methuku J, et al. A Methodology for Se?

mantic Enrichment of Cultural Heritage Images Using Artificial Intel?

ligence Technologies [J]. Journal of Imaging, 2021, 7 (8): 121.

[18] Tan X, Luo X, Wang X, et al. Representation and Display of

Digital Images of Cultural Heritage: A Semantic Enrichment Ap?

proach [J]. Knowledge Organization, 2021, 48 (3): 231-247.

[19] World Heritage List [ EB/ OL]. https: / / whc. unesco. org/ en/

list/ ?&, 2023-05-04.

[20] 張書穎, 劉家明, 朱鶴, 等. 線性文化遺產的特征及其對旅游

利用模式的影響———基于《世界遺產名錄》的統計分析[J].

中國生態旅游, 2021, 11 (2): 203-216.

[21] 李飛. 線性文化遺產空間結構演化研究———兼述旅游于其中的

影響[J]. 地理與地理信息科學, 2019, 35 (5): 133-140.

[22] 俞肇元, 袁林旺, 吳明光, 等. 地理學視角下地理信息的分

類與描述[J]. 地球信息科學學報, 2022, 24 (1): 17-24.

[23] 孫婷, 黃泰. 多維視角下大運河遺產認知與保護傳承[ N].

中國社會科學報, 2023.

[24] 陸邵明. 當代建筑敘事學的本體建構———敘事視野下的空間特

征、方法及其對創新教育的啟示[J]. 建筑學報, 2010, (4):

1-7.

[25] 俞孔堅, 李迪華, 李海龍, 等. 京杭大運河國家遺產與生態

廊道[M]. 北京: 北京大學出版社, 2012.

(責任編輯: 王 維)

主站蜘蛛池模板: 久久精品亚洲专区| 国产精品久久久久婷婷五月| 欧美精品啪啪一区二区三区| 99视频在线观看免费| 久久这里只精品国产99热8| 亚洲成人手机在线| 2021国产精品自拍| 一级毛片免费观看不卡视频| 欧美日韩激情| 综合天天色| 日韩视频福利| 日韩一区精品视频一区二区| 91久久夜色精品| 狼友视频一区二区三区| 日本三区视频| 五月天福利视频| 亚洲日韩国产精品无码专区| 日韩av资源在线| 国产在线精品美女观看| 亚洲人成色在线观看| 曰韩人妻一区二区三区| 日韩小视频在线播放| 91精品人妻互换| 国产国语一级毛片在线视频| 精品国产自| 亚洲人成日本在线观看| 日本亚洲成高清一区二区三区| 好久久免费视频高清| 国产成人精品午夜视频'| 欧美精品一二三区| 国产精品漂亮美女在线观看| 这里只有精品免费视频| www.国产福利| 亚洲六月丁香六月婷婷蜜芽| 日韩色图在线观看| 国产午夜福利在线小视频| 国产欧美视频综合二区| 国产成人精彩在线视频50| 国产无码性爱一区二区三区| 国产内射一区亚洲| 91久久精品日日躁夜夜躁欧美| 国产精品嫩草影院av| 99久久国产综合精品2020| 免费无码AV片在线观看中文| 亚洲国产成人精品青青草原| 国国产a国产片免费麻豆| 欧美日韩午夜视频在线观看| 好紧太爽了视频免费无码| 国产第二十一页| 女人18毛片一级毛片在线| 视频二区亚洲精品| 欧美自拍另类欧美综合图区| 亚洲日韩第九十九页| 亚洲人成色在线观看| 午夜福利在线观看入口| 欧美日韩精品在线播放| 丁香婷婷激情网| 在线观看欧美国产| 亚洲中文字幕在线一区播放| 国产精品亚洲天堂| 国内精品视频在线| 亚洲天堂免费| 99精品高清在线播放| 99免费视频观看| 日本黄色a视频| 新SSS无码手机在线观看| 99热最新网址| 伊人丁香五月天久久综合| 在线视频97| 日韩国产精品无码一区二区三区| 久久精品女人天堂aaa| 亚洲成aⅴ人在线观看| 精品一区二区三区无码视频无码| 国产一在线观看| 亚洲日韩日本中文在线| 国产美女免费网站| 国产男女免费完整版视频| 国产成人综合日韩精品无码首页| 日韩免费毛片| 亚洲天堂久久新| 国产青榴视频| 99re精彩视频|