999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字人文視角下古代農書語義知識組織與多維知識發現研究

2025-04-15 00:00:00吳艷飛?張強?周樹斌?譚淑
新世紀圖書館 2025年2期

摘 要 論文選取“古代四大農書”為實例對象,搭建基于知識圖譜的古農書資源的語義知識組織框架。首先,通過分析與整理相關數據,構建古農書史料資源的本體模型,以規范化描述資源中的概念與關系。其次,利用已建構的模型對數據進行知識抽取,運用知識融合技術解決存在的共指問題,最后將三元組數據儲存至Neo4j數據庫中,從而完成對古農書史料資源的語義組織和多維知識發現。本研究提出了古農書史料資源語義知識組織的研究方案,為數字人文熱潮下古農書資源的深度開發與應用提供了全新的研究視角。

關鍵詞 古代農書;知識組織;知識發現;數字人文

分類號 G250

DOI 10.16810/j.cnki.1672-514X.2025.02.008

Research on Semantic Knowledge Organization and Multidimensional Knowledge Discovery of Ancient Agricultural Books From the Perspective of Digital Humanities

Wu Yanfei, Zhang Qiang, Zhou Shubin, Tan Shu

Abstract This paper selected the “Four Ancient Agricultural Books” as the case object to construct a semantic knowledge organization framework of ancient agricultural book resources based on knowledge graph. Firstly, by analyzing and sorting out the relevant data, the ontological model of the historical resources of the ancient agricultural books was constructed to standardize the description of the concepts and relationships in the resources. Secondly, the constructed model was used to extract the knowledge of the data, the knowledge fusion technology was used to solve the existing co-referential problem, and finally the triplet data was stored in the Neo4j database, so as to complete the semantic organization and multi-dimensional knowledge discovery of the historical resources of the ancient agricultural books. This study proposes a research scheme on the semantic knowledge organization of ancient agricultural book historical resources, which provides a new research perspective for the in-depth development and application of ancient agricultural book resources under the boom of digital humanities.

Keywords Ancient agricultural books. Knowledge organization. Knowledge discovery. Digital humanities.

0 引言

古籍是中華傳統文化的重要載體,是寶貴的文化遺產,詳細記載了中國長達五千年的歷史和文化,蘊含著深厚的傳統文化精神和中華民族特有的想象力與創造力[1]。近年來,古籍資源的保護和利用受到黨和政府的高度重視,2022年頒布的《關于推進新時代古籍工作的意見》中針對新時代古籍工作的展開與推進提出了具體要求,充分強調開發利用古籍資源的重要性[2]。古農書是古籍不可或缺的組成部分,反映了中國古代各時期農耕社會的發展狀況,全面系統地記述了中華傳統農業的生產知識與技術經驗,具有豐富的史料價值。作為傳統農耕文化的載體,古農書有著豐富的傳統農業科學實踐經驗,對其進行挖掘、整理和研究,不僅有助于深入推進中華優秀傳統農耕文化創造性轉化與創新性發展,還能為當代農業的可持續發展和鄉村振興提供重要的科學價值與實踐意義。

數字人文是一門將數字化技術和傳統人文研究相融合形成的交叉學科,其徹底顛覆了傳統人文學科的研究范式。語義網技術在數字人文研究中被視為知識組織的核心技術,深受人文學者的廣泛關注[3]。古農書多以紙質文獻形式存于館藏機構,資源分布相對分散,亟需對其進行數字化乃至語義化來解決存在的“重藏輕用”問題。知識圖譜作為關鍵的語義網技術之一,突破了不同場景下的數據隔離,揭示了資源中的實體與實體間的關系,并利用關系將各實體關聯起來形成知識網絡[4]。通過具備語義處理能力的知識圖譜可對古農書的知識結構進行揭示與表達,有助于重構農書中涵蓋的知識,實現農書資源的關聯化組織,為古農書的知識組織與知識發現提供語義化的支撐方式。

本研究以“四大農書”為研究對象,通過分析農書資源的特征提取相關概念及關系,利用本體技術構建通用性強的語義描述模型,進而構建古農書資源知識圖譜,以實現古農書資源的多維知識發現研究,探索古農書資源的知識組織與發現模式,為深入挖掘古農書資源提供理論與實踐支持。

1 數字人文研究現狀

數字人文以人文科學為旨歸,運用計算技術對傳統人文進行分析研究,打破了傳統人文學科研究的壁壘。數字人文基礎設施作為支持人文學科研究的關鍵基礎,為人文學者開展人文領域研究提供了支撐跨學科研究的資源、軟件工具、數據管理與分析等基礎設施[5]。當前,國外在數字人文基礎設施建設方面較為成熟,如美國圖書館建設的“中文善本書目數據庫”,哈佛燕京圖書館開發的“線裝古籍計算機檢索系統”,日本京都大學編制的“全國漢籍書目數據庫”等。國內也在借鑒國外基礎設施建設經驗的基礎上取得了一定的進展,如上海圖書館推出了“中國家譜知識服務平臺”“中文古籍聯合目錄及循證平臺”和“人名規范庫”等[6]資源;國家圖書館依托中華古籍保護計劃建設了中華古籍資源庫[7],以實現特藏數字資源的共享。此外,國家圖書館與法國國家圖書館合作開發了“法藏敦煌”,與哈佛大學燕京圖書館合作共建了“哈佛大學善本特藏”。北京大學數字人文研究中心將智能技術賦能古籍數字化,形成一系列成果,包括“宋元學案傳承可視化系統”“中國歷代人物資料庫WEB檢索系統”“朱子年譜可視化系統”等[8]。目前我國的數字人文基礎設施建設主要側重于典籍資源,然而針對古農書數字資源基礎設施建設仍存在不足,且古農書特定領域下的史料大多是非結構化的館藏紙質文獻,缺乏對其知識結構的深度挖掘與知識組織。

近年來,歷史人文領域研究迎來了新變革,這一變革在數字人文浪潮的影響下逐漸成形。數字人文研究的主流技術,如本體、知識圖譜與關聯數據等語義網技術,正在重塑人文研究的知識組織模式,為古籍資源的知識組織研究提供全新的研究路徑。在現有的研究中較少以整體視角探究古籍資源,主要有鄧仲華等使用本體庫的構建技術對古籍版本數據進行組織,形成古籍版本本體庫[9]。白林林等則借助Drupal平臺完成對CNMARC格式編目的中文古籍書目數據的關聯化發布[10]。歐陽劍等運用知識圖譜技術對中國歷代存世典籍進行知識組織,構建古籍知識關聯網絡[11]。當前大部分研究更多聚焦于古籍中的特定領域,譬如在中醫古籍方面,丁侃等在設計中醫古籍資源元數據方案的基礎上,通過構建中醫文獻和人物本體將中醫學術傳承的脈絡關聯起來[12];在方志典籍方面,徐晨飛等以機構特藏的《方志物產》為數據來源,完成方志物產知識本體的構建,利用關聯數據實現對方志物產史料的知識關聯與發布[13];在敦煌古籍方面,程結晶等分析敦煌遺書圖像的特征,并運用關聯數據進行敦煌遺書圖像知識關聯研究[14]。

縱觀前述研究可知,古籍資源的開發與應用研究目前已有一定的進展,對其特定對象的知識組織研究也有了可行性的探索。古農書作為古籍資源的關鍵組成部分,絕大部分研究集中于古代農書的思想、出版與校注等方面,對古農書資源的知識組織研究相對有限,仍停留在粗粒度階段,缺乏對其細粒度知識關聯與語義組織。為填補這一研究空白,本文借助本體理論和技術對古農書資源中涉及的概念屬性進行統一的語義描述,提出古農書本體模型,以展示知識之間的語義關聯,并以此為基礎構建古農書知識圖譜,實現資源的多維知識發現,為進一步開發利用古農書資源提供了新路徑。

2 古農書資源語義化知識組織研究框架

我國古農書資源數量豐富且挖掘潛力巨大,然而卻面臨“藏而不用”的矛盾,尚未對多源異構的古農書資源進行深層次的語義化組織。為解決這些問題,必須運用知識圖譜等語義網技術將古農書資源中分散的知識元素進行全面深入地知識描述和組織,以建立知識之間的互聯互通,從而促進古農書資源的共享、傳播及利用。基于此,本文提出構建古農書資源的語義化知識組織模型設想,其具體流程框架如圖1所示。該模型從層次結構上劃分為數據資源層、知識組織層、知識關聯層和知識應用層四個層次,內容上涵蓋了數據獲取、數據預處理、知識表示、知識抽取、知識融合、知識存儲和知識發現等方面。

數據資源層作為基礎層,其主要任務是采集分散的數據資源,將大量離散且多源異構的古農書資源進行整合。古農書資源的數據來源多種多樣,以散存于高校、圖書館和檔案館等文化機構的紙質文獻作為主要的數據來源。對于異構的文獻資源,需要進行數字化處理,并采用OCR技術和人工校對相結合的方式將其轉化為文獻文字文本,同時結合領域內相關的數據資源進行補充和完善。由此形成的原始數據集屬于非結構化數據,需經過數據預處理操作將非結構化和半結構化的數據轉化成結構化數據,并存儲于關系型數據庫(RDB)中作為后續研究的數據基礎。

知識組織層的主要任務是從概念層面對領域內的知識進行組織管理,即構建古農書資源本體。古農書資源本體構建是知識圖譜構建的核心,通過構建本體模型實現從原始數據資源到數字化實體標注資源的轉換,并確定了實體集所涵蓋的概念和屬性,以實現對領域內知識的規范描述。結合古農書資源的結構特征,在明確古農書資源本體的核心概念和屬性的基礎上,探討運用現有本體和自建本體相結合的方式來構建古籍資源本體模型,進而實現模式層的搭建。這既滿足了對古農書資源知識組織和描述的需求,也為后續的知識關聯和應用提供了模型基礎。

知識關聯層的主要任務是對原始數據集進行知識抽取、知識融合與知識存儲,以實現古農書資源實體間的深層次語義關聯。知識抽取是基于已構建的本體模型,從古農書數據庫中提取實體、屬性與關系,并以S-P-O三元組的形式存儲數據,完成實體間的語義關聯。由于經過知識抽取后獲取到的數據存在歧義和冗余問題,需通過知識合并、共指消解和實體消歧等方法進行信息的整合和消歧。在完成知識融合任務后,以古農書資源本體模型為根據,將處理后的結構化數據轉化成RDF數據,為古農書資源的知識應用提供數據支持。

知識應用層的主要任務是基于語義化知識組織框架為用戶提供古農書知識的開發利用服務,以滿足數字人文研究領域的特定需求,進而推動古農書資源的深入研究。RDF三元組數據將分散的知識聯系起來,為構建知識圖譜與關聯數據提供統一標準的表現形式。古農書知識圖譜以圖的形式展示古農書知識間復雜的語義關系,為用戶提供檢索服務,用戶可通過Cypher語句查詢相應節點和關系。此外,知識圖譜還采用先進的挖掘算法,通過查詢最短路徑實現古農書資源相關知識的聚合展示與知識挖掘,挖掘節點之間的隱藏關系,為古農書資源的深度利用與知識發現研究做鋪墊。

3 古農書資源本體模型構建及整合處理

農為邦本,本固邦寧。農業作為我國古代社會的支柱產業,是中華文明生存和發展的基石,歷經長達萬年的演進,為今人留下了琳瑯滿目的中國農學著作。據統計,從公元前3世紀至清朝末年,共有376種古代農學著作問世[15],而有“古代四大農書”之稱的《氾勝之書》[16]《齊民要術》[17]《王禎農書》[18]和《農政全書》[19]是最具有代表性和影響力的著作,其反映了中國古代各時期農耕社會的發展狀況。《氾勝之書》是由西漢氾勝之所著,是我國最早的一部農書,其記載了西漢時期黃河流域的農業生產實踐與智慧,強調天時、地利、人和是進行農耕的總原則,為后世反復征引。《齊民要術》是北魏時期杰出農學家賈思勰所著的一部綜合性農書,也是中國現存最完整的農學著作,該書涉及面廣,運用“采捃經傳”的方法去征引古農書及同時代有關農學的文字記錄,系統且全面地總結了中國古達農業的農業生產知識和經驗。《王禎農書》對我國南北方各地的農業進行系統研究,將農器列為綜合性農學著作的重要組成部分,并以圖文并茂的方式呈現農業知識。由明代徐光啟所著的《農政全書》貫穿了徐光啟的治國治民的農政思想,還專門設置“荒政”和“水利”卷目用以探討開墾和水利問題。四大農書是先民萬年農耕智慧的結晶,以其作為實例對象進行研究對弘揚中國傳統農業文化具有重要的現實價值。

本文選擇《氾勝之書輯釋》(中華書局出版)、《齊名要術譯注》(上海古籍出版社出版)、《東魯王氏農書譯注》與《農政全書》作為數據來源。首先對紙質文獻進行數字化掃描生成圖像掃描本,采用OCR與人工校對相結合的方式實現數字化及文本化,并將形成的文獻文本以二維表形式儲存起來。同時利用中華古籍資源庫中的數字資源對其校對獲得非結構化數據,然后通過數據預處理將其存儲到關系型數據庫中作為知識抽取的語料。

3.1 古農書資源知識本體頂層概念

本體是一種描述知識的抽象模型,常用于表示特定領域中的概念及其相互關系,可定義為共享概念模型明確的形式化規范說明[20]。現階段,本體被廣泛應用于文史知識工程等領域,本體模型設計遵循領域本體設計流程,即在調研已有的本體模型理論與國內外相關本體模型的基礎上,通過復用本體對領域內所包含的概念及關系進行描述與揭示,同時考慮自建詞表設計本體模型。本研究選用七步法構建本體,結合古農書資源的結構特點,參考FOAF、DC、Time、GeoNames及上海圖書館本體SHL等本體詞表,對本體中的人物、地點、時間等屬性進行復用。然而,由于復用的本體詞表無法滿足古農書資源組織描述的需求,因此需要構建自建詞表古農書史料資源(Agricultural book historical resources,ABHR),以完善與補充古農書知識的實體及屬性,從而完成古農書資源本體模型屬性的構建。

在充分分析古農書資源的基礎上,構建古農書資源知識本體模型,首先需要在明確領域本體的核心概念及相關屬性后,進一步確定概念屬性中的核心元素,以便于更好地揭示和描述概念間的相互聯系及古農書資源間的關聯。依托從古農書資源中梳理出的知識元素,將古農書資源的頂層概念劃分為六大類,包括農書(abhr: AgriculturalBook)、史料(abhr: HistoricalResources)、空間(shl: SpatialThing)、時間(time:TemporalEntity)、資源(abhr:Resource)和人物(foaf:Agent),并納入到本體模型中。

3.2 本體的核心類與層級定義

在依托古農書資源中梳理出的知識元素基礎上,將古農書資源的頂層概念劃分為農書、史料、時間、地點、人物和資源六個核心類后,還需要對核心類概念進行細分,確定其所涉及的類及類的父子關系,從而建立核心概念及內容中的具體聯系,完善古農書知識的關鍵語義要素體系。古農書資源類及層次關系詳見表1所示。

農書類旨在揭示與描述古農書資源的外部屬性特征,表征其所包含的書目特征。依據現行的古籍編目規范以及中文古籍書目數據,確定了農書類所涵蓋的數據屬性主要有題名、版本、正文、注釋、冊數等。

史料是本體構建的核心和主體,是對古農書史料資源的內容描述與歸納。為確保細粒度地描述古農書史料資源,分析現有農書的編目情況,將史料類分為農本思想、農事、水利、畜牧、飲食、百谷、農器、荒政、雜俎九大類。農本思想貫穿農業生產的全過程,充分體現了中國古代的“重農”思想,且與人物類、時間類緊密相連。百谷又稱百榖,主要包含各種作物栽種、培育、收獲等方法,還涉及到林木、纖維與藥材的種植與利用。農器是從事農業生產的重要工具,其主要涉及農業機械的制造方法。農事是關于農田的田制、開墾、經營管理與農時等問題,與百谷及農器密切相關。畜牧是對家畜及家禽等飼養技術的記錄 。飲食是農書史料資源的特色,主要包括各種食物、酒類的加工和制作方法。荒政也是農書史料的獨特之處,體現了災荒時期“預弭為上、有備為中、賑濟為下”的救災政策。水利是農業生產的命脈,記載了古代興修水利的方法和措施。雜俎又稱為雜錄,用來標識無類可歸的文章,主要包括其他與農業生產相關的活動,如貨殖、涂甕、筆墨等。

人物類涵蓋了與古籍資源相關的個人、群體、機構等,主要分為個人(foaf:Person)、群體(foaf:group)、機構(foaf:Organization)三個子類。人物是歷史的見證者,也是史料資源的創作者,是指與古農書資源緊密相關的責任者和編撰者;群體主要是與古籍資源相關的族群;機構則包含古農書資源的研究、保護與館藏機構等。人物類包括數據屬性和對象屬性,對于古農書資源中的個人子類,其數據屬性包括名稱、姓氏、字、號、仕途等。

時間類是用來描述古農書資源的時間特征,如農書的出版時間、個人的生卒年等。時間類能以時間跨度為根據劃分成時間點(time:Instant)和時間段(time:Interval)兩個子類。時間點是對時間的詳細描述,可用年月日來表示。因不同歷史階段使用的紀年方式存在一定差異,故需要將時間點進一步劃分為年號紀年(abhr:ReignTitleEra)和公元紀年(abhr:CommonEra)兩個子類。時間段則使用朝代(shl:Dynasty)、年號(shl:Reign)和特定時間范圍(time:ProperInterval)三個子類進行范圍性描述。

空間類是指古農書資源中所包含的位置信息,包括農書資源的出版地、個人的出生地及史料資源中的特定地區等內容。空間類可分為地點和地區兩個子類,地區用于描述農書內容中涉及到的范圍相對模糊的傳統地域及現有區劃,如關中地區、黃河流域等。

資源類是指古農書資源的呈現類型。古農書資源本體模型不僅充分描述了其所擁有的外部和內部特征信息,還表達了古農書史料資源知識呈現的形式化信息。這有助于從多維度出發展示古農書資源,包括文本、視頻、圖像等形式。資源類的數據屬性包括文本資源、專家述評、視頻資源及圖片資源。

3.3 各類實體屬性描述及關系

在完成古農書史料資源本體核心概念及層次關系的構建后,需要對各類實體的屬性進行定義與描述。屬性分為對象屬性和數據屬性,為古農書史料資源概念知識范圍內的關系和特征提供了豐富的語義描述。對象屬性又稱為關系屬性,其作用是定義類與類之間的相互關系,定義域和值域均為類,在本研究中用來表述古農書史料資源類間的關系特征,進而支持古農書史料資源知識圖譜的關聯檢索、知識發現與知識推理等,具體的對象屬性如表2所示。數據屬性是用來描述類目自身的屬性特征,其定義域為一種或多種類,值域為指定的數據類型[21],具體的數據屬性如表3所示。建立數據屬性的目的是為確保對資源的具體描述,一方面可以幫助用戶了解古農書史料資源實例的特征,另一方面可以輔助用戶進行語義檢索與知識發現。

完成本體詞表與屬性的定義說明后,參考已有研究中構建本體模型的思路,形成古農書史料資源本體模型,如圖2所示。該模型詳細描述了古農書資源的基本屬性特征,使其具有可擴展性和復用性。同時借助本體開發工具Protégé創建本體模型,以便為后續的知識組織與關聯奠定堅實的模型基礎。

3.4 知識抽取與融合

知識抽取是以構建的本體模型為依據,從古農書資源知識庫中提取實體、屬性和關系,并將其轉換成RDF數據格式存儲于數據庫中。RDF數據具有規范的資源描述模式,以S-P-O三元組進行描述,通常表現為“實體-屬性-值”或“實體-關系-實體”。古農書文獻的數字化程度較低,文獻內容繁多且雜亂,因此在進行知識抽取時需要進行規范化的語義標注。本研究采用數字化文本標注工具Markus對文本進行實體標注,其原理是根據本體模型設置語義標簽構建語義標簽集,并利用其實體關系標注功能將文本轉換成標簽下的標注實體關系,進而抽取出文本中的史料、人物、時間、空間等實體關系,如圖3所示。為完善農書領域內的相關數據資源,還需利用百科網絡資源進行補充,對于半結構化數據可通過調用Jiagu深度學習自然語言處理工具包來實現實體關系抽取,具體如圖4所示。

完成知識抽取后,多源異構的古農書史料資源通過轉換形成由實體和關系組成的三元組數據集,但仍存在諸多挑戰,如表達的冗余、語義方面的歧義等,需要采用知識融合方法進行信息的整合處理。本研究主要面臨實體共指問題,即同一概念的實體指向交叉,不同文獻對同一實體的描述不一致,因此必須將實體的多個指稱項順理統一起來。例如,《農政全書·農器篇》中“镈”與《纂文》中“耨”都指代同一農器,而“耨”實際上是“镈”的別名,于是將其合并為“镈”,其他名稱歸入農器的屬性中。此外,古農書資源中還存在同人異名情況,如“耿橘”,其字為“藍陽”,又字“庭懷”,同一個人具有多個稱謂,為此以其名作為統一標識,而字、號則置于屬性中。知識融合能夠將異源數據中同一實體不同表達進行合并,有效解決數據冗余和共指問題,提高了古農書史料資源語義組織的質量。

4 古農書史料資源知識圖譜構建及應用

本研究以Neo4j圖數據庫為基礎構建古農書史料資源知識圖譜。由于本體模型與知識圖譜的表現形式存在差異,需利用RDF三元組這一通用數據鏈接方式,將已建的本體模型映射至圖數據庫中。具體映射規則(見圖5):一是將本體中的類與實例映射為圖數據庫的節點;二是實現本體中對象屬性與圖數據庫中關系類型的相互映射;三是實現本體中數據屬性與節點屬性的相互映射。根據本體到知識圖譜的映射規則,實現古農書史料資源的圖數據庫存儲。最終形成的古農書史料資源知識圖譜涵蓋1236個實體節點,2654個三元組關系,節點和關系共同構建了多維的古農書史料資源關聯網絡,詳細描述了古農書中蘊含的深厚的史料資源,便于利用知識推理、路徑計算等方式進行知識單元內容的細粒度挖掘,為后續知識發現奠定基礎。

4.1 知識關聯

知識圖譜以強大的可視化特性脫穎而出,在完成知識存儲后,采用圖譜的形式可視化展示古農書史料資源。知識圖譜還可詳細地描述節點和關系的知識結構。用戶通過點擊節點可以靈活調整節點的顏色與大小,實體類型以顏色加以區分,如人物實體以大紅色表示,時間實體則以淺綠色呈現。用戶可按需進一步查看節點的詳細信息及節點間的關聯。本研究通過知識圖譜實現對古農書史料資源的實例化展示,將涉及古農書史料資源的農書、人物、時間、空間等知識單元有序地聯結起來,實現從靜態知識到動態知識網絡的轉化,以便更好地挖掘隱含知識。

4.2 知識檢索

古農書史料資源知識圖譜能夠將分散零碎的知識單元聯結起來,用戶可根據需求構建適合的查詢語句將知識從數據庫中檢索出來。Cypher語言作為圖查詢工具,具有簡便高效的優勢,以“富弼”為例進行檢索,通過Cypher查詢語句:MATCH(n)-[r:創作者]-(m:Person{name:'富弼'}) return n,m可呈現相關節點與關系,查詢結果見圖6。圖6展示了富弼創作的五項史料,包括《擘畫屋舍安泊流民事行移》《曉示流民許令諸般采取營運不得邀阻事》《告諭勸誘人戶各量出斛米以救濟饑民事》《支散流民斛斗畫一指揮行移》《宣問救濟流民事札子》,這五項史料資源均與荒政相關,且發生在北宋時期,在一定程度上反映了富弼對災民救濟方面的見解。

4.3 知識發現

知識圖譜以可視化方式將知識結構展示給用戶,其最重要的價值是為用戶提供知識發現服務,促進科學研究的開展。古農書史料資源蘊含的知識單元具有細粒度的特征,能夠從多個角度對知識內容進行挖掘與重組,探究古農書史料資源中隱含知識,進而實現對史料資源深度的知識發現研究。如以人物為線索進行知識發現,可為歷史人物研究提供豐富多樣的史料資源,幫助用戶更加全面深刻地了解古農書史料資源的知識內涵。以范仲淹為例,輸入查詢語句通過知識圖譜展示從人物到史料的知識脈絡,發現其創作的史料資源,包括《宋范仲淹上呂相公呈中丞咨目》 《開河法》和《建閘法》,如圖7所示。這些史料資源與當時的水利建設密切相關,在一定程度上論證了范仲淹的水利思想,體現了其先憂后樂、關懷民生的高尚品格。通過點擊相關節點,可以進一步呈現其具體的數據屬性,從而獲取相關信息,為挖掘背后的知識提供支持。

知識圖譜為實現古農書史料資源知識內容的深度發現提供研究途徑,可深入挖掘資源中潛在的知識,詳細描述史料資源的歷史文化內涵。知識圖譜的優勢在于知識查詢與推理,為推動古農書資源的知識組織與發現研究提供了重要的思路。此外,知識圖譜拓展了古農書史料資源的應用范圍,通過可視化的方式清晰呈現了古農書史料資源的知識結構特征,使資源中所蘊含的歷史文化記憶得以再現,深入分析了古農書領域知識傳播與歷史文化再現的價值,對中華優秀傳統農耕文化的保護與傳承具有重要意義。

5 結語

我國自古以來高度重視農業,農業作為中華民族賴以生存和發展的基石,為后世留下了諸多珍貴的農學著作,這些璀璨的農書資料為相關領域的研究提供了豐富詳盡的史料。古農書資源數據量龐大,具有悠久的編修傳統,蘊含著豐富的歷史文化價值。然而現階段,針對古農書資源的開發利用相對有限,且大多為紙質文獻資源,缺乏對其進行數字化、知識化處理,迫切需要借助數字技術來實現資源的深度知識組織。本研究以“古代四大農書”為數據源,結合領域內相關學者的研究思路,在深入分析資源所包含的知識元素與語義關系后,界定了古農書史料資源的實體屬性與本體模型。基于此,將RDF數據導入圖數據庫中生成古農書史料資源知識圖譜,實現了古農書史料資源的語義聚合,為古農書資源的數字化乃至知識化研究提供理論基礎與技術支持,探索了資源間的知識關聯語義化組織方案。

本研究為古農書史料資源提供了語義化組織方法,揭示其語義內涵與人文價值。但仍有不足之處:其一,目前僅以“四大農書”為數據源進行數據采集與整理,其所涵蓋的數據量相對有限且薄弱,后續有待將更多的農書資源加入數據庫,以擴大研究規模。其二,由于古農書相關文獻資源所包含的信息量龐大,大多為非結構化數據,其數據采集與提取工作繁重,耗時長,僅僅仰賴人工方式顯得效率不足。因此,針對龐雜的古農書館藏資源,需要引入更多半自動化、全自動化的數據標注和信息抽取方法來完善數據處理過程。

參考文獻:

蹤凡.讓古籍文獻“活起來”[EB/OL].[2024-07-13].https://epaper.gmw.cn/gmrb/html/2017-11/30/nw.D110000gmrb_20171130_3-14.htm.

中國政府網.中共中央辦公廳 國務院辦公廳印發《關于推進新時代古籍工作的意見》[EB/OL].[2024-07-13].http://www.gov.cn/zhengce/2022-04/11/content_5684555.htm.

鄧君, 宋先智, 鐘楚依.我國數字人文領域研究熱點及前沿探析[J].現代情報,2019,39(10): 154-164.

陳濤, 劉煒, 單蓉蓉, 等.知識圖譜在數字人文中的應用研究[J].中國圖書館學報,2019,45(6): 34-49.

劉煒,謝蓉,張磊,等.面向人文研究的國家數據基礎設施建設[J].中國圖書館學報, 2016,42(5): 29-39.

上海圖書館家譜聯合編目系統[EB/OL].[2024-03-08].https://jplb.library.sh.cn/index.

中華古籍資源庫[EB/OL].[2024-07-16].http://read.nlc.cn/thematDataSearch/toGujiIndex.

北京大學數字人文研究中心項目展示平臺[EB/OL].[2024-07-16].http://digitalhumanities.pku.edu.cn/project/.

鄧仲華,黃鑫,陸穎雋,等.論中文古籍版本本體庫的構建[J].圖書情報知識, 2014(4):80-87,93.

白林林, 祝忠明.基于Drupal的中文古籍書目關聯數據發布研究[J].圖書情報工作, 2017,61(4): 123-129.

歐陽劍, 梁珠芳, 任樹懷.大規模中國歷代存世典籍知識圖譜構建研究[J].圖書情報工作, 2021,65(5): 126-135.

丁侃, 張麗君.基于本體的中醫學術傳承脈絡構建[J].中醫文獻雜志,2018,36(5): 32-35.

徐晨飛, 包平, 張惠敏, 等.基于關聯數據的方志物產史料語義化知識組織研究[J].大學圖書館學報,2020,38(6): 78-88.

程結晶,王心雨.敦煌遺書圖像知識關聯與語義描述[J].圖書情報工作,2021,65(7): 123-131.

張晴丹.守望農史學[N].中國科學報, 2020-09-08(005).

萬國鼎.氾勝之書輯釋[M].北京:中華書局, 1957.

繆啟愉, 繆桂龍.齊民要術譯注[M].上海:上海古籍出版社, 2006.

王禎. 東魯王氏農書譯注[M].繆啟愉,譯.上海:上海古籍出版社, 1994.

徐光啟.農政全書[M].石聲漢,點校.上海:上海古籍出版社, 2020.

STUDER R, BENJAMINS V R, FENSEL D. Knowledge engineering: principles and methods[J].Data amp; Knowledge Engineering, 1998, 25(1-2): 161-197.

李永卉, 周樹斌, 周宇婷, 等.基于圖數據庫Neo4j的宋代鎮江詩詞知識圖譜構建研究[J].大學圖書館學報,2021,39(2): 52-61.

吳艷飛 華中師范大學信息管理學院碩士研究生。湖北武漢,430079。

張 強 華中師范大學信息管理學院博士研究生。湖北武漢,430079。

周樹斌 華中師范大學信息管理學院博士研究生。湖北武漢,430079。

譚 淑 華中師范大學信息管理學院碩士研究生。湖北武漢,430079。

(收稿日期:2024-06-27 編校:陳安琪,曹曉文)

主站蜘蛛池模板: 性色生活片在线观看| 国产精品19p| 国产精品久久精品| 美女一级毛片无遮挡内谢| 午夜激情福利视频| 亚洲娇小与黑人巨大交| 在线五月婷婷| 亚洲第一视频网站| 国产成人精品视频一区二区电影 | 国产精品主播| 久久婷婷六月| 亚洲国产成人综合精品2020| 日韩国产高清无码| 亚洲AV无码不卡无码| 国产高清自拍视频| 亚洲欧美日韩综合二区三区| 99精品免费欧美成人小视频| 中文字幕在线一区二区在线| 亚洲人成网站18禁动漫无码| 54pao国产成人免费视频| 国产人人射| 日韩欧美在线观看| 国产jizzjizz视频| 久久久久免费精品国产| 婷婷六月激情综合一区| 无码高潮喷水专区久久| 久久久久亚洲精品无码网站| 国产网站免费| 国产精品女在线观看| 精品视频一区二区三区在线播| 欧美不卡视频在线| 欧美日韩一区二区在线免费观看| 欧美a级在线| 一级高清毛片免费a级高清毛片| 99视频全部免费| 欧美日韩v| 成年午夜精品久久精品| 国内精品九九久久久精品| 欧美日韩动态图| 欧美日韩一区二区三区在线视频| 欧美在线综合视频| 国产精品七七在线播放| 国产成人精品综合| 91精品福利自产拍在线观看| 国产网站黄| 国产第一页亚洲| 亚洲国产成人久久精品软件| 26uuu国产精品视频| 亚洲色图欧美| 国产精品尤物铁牛tv| 中文字幕啪啪| 亚洲人成色在线观看| 精品国产电影久久九九| 色吊丝av中文字幕| 久久青草精品一区二区三区| 久久国产精品无码hdav| 高潮毛片无遮挡高清视频播放| 国产精品自拍露脸视频| 亚洲天堂日韩av电影| 成人午夜网址| 亚洲日韩AV无码一区二区三区人| 国产又黄又硬又粗| 婷婷六月综合网| 青青青草国产| 在线亚洲小视频| 日韩美女福利视频| 免费国产黄线在线观看| 亚洲国产天堂久久九九九| 免费播放毛片| 亚洲天堂日本| 国产精品短篇二区| 伊人激情综合网| 国产成人综合亚洲网址| 国国产a国产片免费麻豆| 亚洲综合二区| 又黄又湿又爽的视频| 亚洲熟女中文字幕男人总站| 91亚洲精品国产自在现线| 久久综合干| 1级黄色毛片| 91美女视频在线观看| 免费毛片在线|