谷紫藤
【摘要】本文梳理了語義出版的概念及發展歷程,對語義出版給傳統出版模式下的對象帶來的影響進行分析。最后,得出語義出版對于傳統出版模式的要素都產生了很大程度上的影響,從學術期刊的增強型出版以及學科本體庫的建立,到圖書館必須改變原有資源建設的內容及方式,積極參與到數字出版和語義出版中來,最后到新的科技出版資源組織方法——基于本體的出版資源組織方式、納米出版物和知識元出版的出現。
【關鍵詞】出版環境 語義
一、引言
語義出版的概念在2009年被首次提出,D.Shotton等人對語義出版的概念進行界定,即提升期刊文章的語義,以促進其自動獲取為目的,通過構建語義相關的文章之間的鏈接,提供多種獲取文章內數據的可行途徑,也使文章之間的數據整合更容易實現。鑒于語義出版的前景廣闊,2011年5月在召開第五屆世界語義網大會期間還舉辦了首屆語義出版研討會,討論內容包括語義網如何影響出版業、如何實現文檔的互操作、學術交流的新方式、如何在EPUB和其他格式電子圖中嵌入和鏈接語義以及什么樣的本體可以用來表示文檔結構要素等多個與語義出版相關主題。
二、語義出版對傳統出版模式要素的影響
(一)語義出版對學術型期刊出版的影響
語義出版是利用語義標識、關聯數據、自然語言處理等操作對傳統的數字出版物進行增強型出版,達到增值服務的目標。而學術出版物,尤其是專業性質較強的出版物,與自然語言有很大的差異,而讀者或者用戶理解信息內容的能力和精力是有限的,通過將出版物經過豐富的語義標注與關聯,提供豐富的語義信息,使讀者能夠快速理解文獻背景知識等相關信息。相對于傳統出版物,語義出版物的互聯與交互性更強,具有精確查詢、閱讀便利等諸多優勢。
對期刊出版物進行語義出版技術的加工,對期刊中的本體進行自動提煉,摒棄原來只有題目、關鍵詞、摘要等標引字段的傳統出版方式,真正實現期刊出版物的關聯。通過增強網絡環境下讀者的用戶體驗,增添標識符和語義標注,增強文章與文章之間、知識與知識之間的鏈接和關聯度,使用戶在閱讀過程中,可以無障礙地理解資源內容進行非線性閱讀,使讀者對信息的獲取和有效利用得到保障。在此基礎上,對于學科的期刊進行集合,以每篇文章作為學科本體庫的組成要素,使得不同期刊之間、不同文章之間、期刊與文章之間都形成關聯數據,實現整個學科由底向上的本體庫的建立。同時,將學科本體庫的數據與每本期刊、每篇文章的數據、圖片、模型等相關聯,實現整個學科從上至下的數據關聯,真正實現語義關聯的數據網絡。
(二)語義出版對圖書館資源建設的影響
語義出版在發布前就完成了概念、內外部特征和相關關系的深度標引、揭示和組織,其對信息資源的選擇、組織、描述都對圖書館的資源建設產生了很大程度上的影響。圖書館作為信息資源組織、加工、描述的專業職能機構,其在語義出版的沖擊下,其專業特征不再明顯。所以,在當下語義出版的大環境下,圖書館應積極順應時代潮流的改變,積極參與語義出版,體現自身獨有的價值。
圖書館參與數字出版,可重點從資源內容及出版流程上分擔用戶的精力、促進資源開放共享,而參與語義出版,則更需要技術上突破,提升資源描述、組織與呈現深度,通過對內容的揭示以及外部資源的知識關聯提升學術出版功能。二者相輔相成,只有有機結合,才能從整體上改善用戶信息利用環境,促進知識創新。當然,圖書館在語義環境下所提供的服務及資源也應該隨之改變,應對學術交流模式的變化,圖書館必須改變原有資源建設的內容及方式,關注知識呈現、傳播和服務方式的變革以及環境和讀者需求的變化,開放創新、轉型發展,在新的知識創造模式和新的學術社區環境中重新定位。
(三)語義出版對科技出版資源組織方式的影響
在信息資源規模及其增速呈現爆炸式發展的今天,傳統的科技資源組織方式顯然已經無法適應科研人員方便、快速獲取科研信息的要求,其語義揭示程度不夠深入,資源組織顆粒度過粗,僅關注內容的線性層面。為滿足科學交流發展的需要,新型的科技出版資源組織方式隨之出現。
基于文獻的資源組織方式是一種線性的、粗粒度的方式,計算機很難根據人們的偏好自動地完成對它們的重組和復用,嚴重制約了科學交流的效率。為了打破這種資源組織的模式,出現了納米出版物和基于知識元的資源組織方式。納米出版物主要以概念或實體作為基本元素,描述科學文獻中的科學結論、科學事實或大量實驗數據中的實驗結果,并提供唯一標識,描述結論的出處、原文作者、納米出版物的創建者等背景及語境信息,是科學文獻在細粒度上的語義表示、組織和出版。基于知識元的資源組織方式,能夠對現有數據中的細粒度知識單元進行表示和抽取,同時建立不同知識元之間以及知識元與原始文獻之間的語義鏈接。
納米出版物模式和基于知識元的資源組織模式突破了文獻組織方式粗粒度、線性化的局限,能夠在更細粒度上實現資源的有效組織,提供全方位知識服務。在這種模式下,用戶將不僅可以獲得基于文獻的粗粒度資源,也可以獲得基于知識元或者納米出版模式的細粒度資源,粗細結合,極大的增加了信息的可發現性與計算機可讀性,提高了數據的利用效率。
三、總結與啟示
綜上所述,語義出版作為數字出版的高級形式,體現了Journal3.0的關聯數據的特征。首先,語義出版對于傳統出版模式的要素都產生了很大程度上的影響,從學術期刊的增強型出版以及學科本體庫的建立,到圖書館必須改變原有資源建設的內容及方式,積極參與到數字出版和語義出版中來,最后到新的科技出版資源組織方法——基于本體的出版資源組織方式、納米出版物和知識元出版的出現。當下語義出版對于傳統出版模式的要素產生了很大的影響,除了在理論上加緊研究,跟上語義出版的要求之外,也應該捉緊實踐層次的建設,例如平臺建設、學科語料庫建設,做到理論與實踐相輔相成。
參考文獻:
[1]SHOTTON D,PORTWIN K,GRAHAM K,et al. Adventuresin semantic publishing: exemplar semantic enhancements of a re-search article [J]. PLoS Computational Biology, 2009.
[2]宋丹輝. 語義出版及其對圖書館資源建設影響探析[J]. 蘭臺世界,2017,(06).
[3]杜小勇,李曼,王大治.語義Web與本體研究綜述[J].計算機應用,2004,(10).endprint