李悅 孫坦,2 趙瑞雪,2 李嬌 黃永文 羅婷婷 鮮國建,2
(1. 中國農業科學院農業信息研究所,北京 100081;2. 農業農村部農業大數據實驗室,北京 100081)
當前,全球已進入數據密集型科學研究第四范式、開放科學和媒體融合發展新時代。同時,我國也正加速推進人工智能、大數據中心等新型基礎設施建設。而大數據作為新的生產要素,只有在使其數據化、知識化、關聯化和可計算化之后,才能真正成為大數據智能時代支撐科技創新發展的新引擎。隨著語義網和知識圖譜的快速發展與場景式應用,數據之間的互聯互通和互操作變得至關重要。目前,海量結構化、半結構化數據廣泛存儲在各類關系數據庫系統和文件系統中。關系型數據庫由于數據結構的不同而導致互操作困難、只有結構缺乏語義[1]等缺點逐漸顯現出來,而以大量分散孤立的文件存在的數據資源開放共享狀況則更不樂觀。
RDF是W3C為促進語義網的應用而推出的資源描述規范,包括RDF抽象模型和一組RDF編碼格式規范,如RDF/XML、Turtle、N-Triples等[2]。RDF的基本模型是有向標記圖,圖中節點表示實體或資源,邊表示實體間關系或實體的屬性[3]。RDF通過主語、謂語和賓語形成的三元組描述互聯網資源之間的語義關系,是實現數據可查找、可訪問、可交互、可再用(FAIR原則)[4]的重要路徑,有利于實現數據的共享、重用和語義互操作,是構建新型大數據基礎設施的基石。而與關聯數據一脈相承的知識圖譜,作為信息互聯、知識共享時代的知識庫,在智能搜索、智慧醫療、社區推薦、網絡安全等領域發揮著重要作用[5]。……