蔡穎
(國家圖書館,北京 100081)
2006年萬維網的發明者Berners-Lee[1]首次提出關聯數據(Linked Data)的概念。關聯數據可以視作一種輕量級的語義網實現方式。它采用資源描述框架(Resource Description Framework,RDF)三元組數據模型,使用統一資源標識符(Uniform Resource Identifier,URI)標識資源實體,發布類數據及實例數據,并且通過HTTP協議來揭示、獲取這些數據,關聯數據主要強調數據之間的相互關聯關系,以及語義信息可以被人機理解[2]。關聯數據的提出可以有效解決自主、異類、異構的海量數據的知識發現問題[3]。關聯數據的提出受到廣泛關注和重視,各界紛紛加入關聯數據的研究與實踐中,截至2019年3月,關聯開放數據(Linking Open Data,LOD)項目已經發布包括政府數據、生命科學、地理數據等各個領域共1 239個數據集[4]。
關聯數據可以將圖書館的海量資源與外界資源進行有效地連接,從而解決圖書館資源“數據孤島”的現狀,進一步優化和開拓圖書館的資源發現系統,提升圖書館資源發現的服務水平。萬維網聯盟(World Wide Web Consortium,W3C)報告認為,在關聯數據運動中圖書館可以擔任領導者的角色。2010年,W3C正式成立圖書館關聯數據孵化小組,為圖書館建立、應用關聯數據提供幫助[5]。對此,圖書館界也給予充分的重視,主要將關聯數據應用于圖書館的各種規范詞表、圖書館記錄集、圖書館的元數據元素集等多個方面。
國外圖書館關聯數據建設大多先從規范詞表數據開始,然后推廣至書目數據。規范詞表關聯數據的典型應……