999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于語義網背景下信息組織方法變化的思考

2018-01-18 10:52:41,
圖書館界 2017年6期
關鍵詞:關聯語義信息

,

(首都圖書館,北京 100021)

1 引 言

信息組織是人類檢索信息、利用信息的前提,是圖書館學研究的核心。隨著信息資源數量激增、形式和載體形態的不斷發展,信息組織方法也從早期的分類法、主題法、分類主題一體化,發展到搜索引擎、主題樹、元數據等方法。20世紀以來信息組織方法與計算機、互聯網技術的發展更加密不可分。1998年語義網設想的提出,為信息組織方法向關聯性、細粒度的知識組織方法發展提供了一個契機。完整的語義網絡模型從下至上包括Unicode與URI層、XML Schema層、RDF Schema層、Ontology Voca-bulary層、Logic層、Proof層、Trust層這7層結構。由于語義網絡模型過于復雜,其應用基本局限于學術研究領域的試驗性開發。2006年,蒂姆·伯納斯-李拋開語義網絡模型中的復雜成分,在URI和RDF技術基礎上,再次提出“關聯數據”的概念。關聯數據是以URI作為數據標識,以資源描述框架RDF的三元組結構作為數據模型,并基于HTTP發布到互聯網上的數據應用形式。由于關聯數據是將相關數據鏈接起來,是語義鏈接,而不是將相關文件、網頁鏈接起來,所以關聯數據可看作是語義網的簡化實現,旨在構建計算機可理解的語義數據網絡,而非只有人才能讀懂的文檔網絡。語義網與關聯數據帶來了信息組織對象的新變化,數據的龐大以及數據間網狀的語義關系,讓信息組織工作者開始利用新的技術手段和方法,對知識、信息進行更科學的組織。本文在對信息組織方法做簡單梳理的過程中,結合語義網、關聯數據等背景,對未來信息組織的對象及方法進行了思考與探索。

2 信息組織到知識組織的傳承與發展

任何事物都離不開歷史的傳承,梳理信息組織方法的發展歷程,不難發現信息組織方法正在從傳統文獻組織階段、網絡信息組織階段,向知識組織的階段過渡。

2.1 傳統文獻信息組織方法

分類法和主題法是傳統的信息組織方法,是幾代哲學家、科學家、圖書情報學家集體智慧和經驗的結晶。分類法是指依據一定的分類體系,根據文獻的內容屬性和其他特征,對文獻分門別類地、系統的組織與揭示的方法。主題法一般指直接以表示文獻主題的詞語做標識,提供字順檢索途徑,并主要采用參照系統揭示詞間關系的標引和檢索文獻的方法。分類法是語法信息組織和語義信息組織的綜合,從學科角度集約信息,便于族性檢索;主題法建立在自然語言基礎之上,是另一種形式的語義信息與語法信息組織的綜合,是從事物角度集約信息,便于特性檢索。這兩類方法在傳統文獻組織階段發揮了巨大作用。直到現在,我國圖書館領域在非數字化文獻的信息組織方面仍在采用這兩種方法。由于這兩種方法誕生于紙質文獻時期,對信息組織對象的揭示還屬于線性和粗粒度的,所以隨著時代和技術的發展,這兩種信息組織方法也必然會發生改變。

2.2 網絡環境下信息組織方法

從1969年10月29日22點30分,阿帕網加州大學洛杉磯分校(UCLA)第一節點與斯坦福研究院(SRI)第二節點的聯通,實現了分組交換網絡的遠程通訊,就宣告了互聯網的誕生。從此以后,網絡信息資源鋪天蓋地而來。在信息資源的主導類型已由印刷型轉變為數字型的現實背景下,元數據的研究更是十分具有現實意義的課題。1995年由圖書館領域和計算機領域的專家共同提出DC元數據方案,DC元數據來自于圖書館文獻標引和電子文件管理的結合,并成為這個交叉領域語義描述的主導標準格式。元數據對信息資源進行描述和解釋,促進信息資源的檢索、管理和利用。通常元數據方案的總體結構可以分為三個層次:內容結構、句法結構、語義結構;這種特征讓元數據為分布的、多種信息資源組成的信息系統提供了整合的工具和紐帶。

此后,圖書館學領域和計算機領域分別在各自方向上進行網絡信息資源組織的探索。圖書館學主要以網絡信息資源為研究對象,側重于傳統的文獻信息分類組織思想與主題詞表對網絡信息資源組織的科學性、完備性和適應性等問題的研究,關注元數據研究,同時對傳統的信息組織方法進行改造,如分類主題詞表的網絡化和自動構建、自動分類、自動標引、元數據的互操作等。計算機科學主要以互聯網環境下用戶信息搜索行為為研究對象,注重于網絡信息資源組織管理的智能化、高效率和簡便性研究,關注搜索引擎技術、超本文方法、自然語言檢索等。二者之間缺乏有效的融合,且對信息資源的組織仍停留在較大粒度的文獻和文件層面。

2.3 語義網背景下信息組織向知識組織發展

語義網的誕生、關聯技術的發展,讓信息之間通過網絡發生了千絲萬縷的聯系。信息之間邏輯意義上的關系,通過計算機技術得到立體的、多維的實現,形成了一個巨大的網絡。這個網絡在某種意義上與人類認識事物時,頭腦中形成的知識地圖是有一定相似性的。同時,網絡化、關聯化、語義化可以將信息變成更有價值的知識,為人們最大限度地獲取信息提供了可能。從本體論意義上說,信息泛指一切事物(物質的、精神的)運動的狀態和運動的方式;從認識論意義上說,信息是關于事物運動狀態和運動方式的反映。人類認識世界的過程,就是不斷從外界取得信息和加工信息的過程。沒有信息,就不能認識和改造世界。而知識是比信息更高層次的人類的精神財富,是信息的一部分,是經過提煉、推理、整理了的信息。在語義網時代,信息通過關聯可以產生知識。信息組織在語義網背景下,也必定會向知識組織方向發展。

信息組織向知識組織轉變,計算機、互聯網技術起了決定性因素。這些科學技術讓信息組織的對象、信息組織的方法以及人們對信息組織的需求都發生了改變。URI允許用戶對任何(包括本地和互聯網)的資源通過特定的協議進行交互操作,信息資源通過使用URI標識在網上發布,讓開放獲取成為可能。RDF作為元數據的統一描述框架和標記語言,由資源、屬性和聲明語句組成。RDF三元組對元數據基本描述方式的定義,將網絡資源與特征、性質、關系等屬性都聯系起來了。這種關聯讓無序的信息查詢向有序的知識組織發展了一大步。RDF的誕生讓信息的揭示更加細致,并且可以在不同的信息中建立起相關的語義關系,解決語義異構的問題。這種細粒度的揭示,是以前平面二維的信息組織方法無法比擬的。細粒度是知識化的一個標志。

3 知識組織方法與單元信息組織

3.1 知識組織方法

知識組織的概念最初由美國圖書館學家布利斯(H.E.Bliss)于1929年提出,他最早闡述了以圖書分類為基礎的知識組織思想。隨后,美國圖書館學家謝拉(J.H.Shera)全面論述了知識組織在圖書館工作中的重要作用和方法。所謂知識組織,是指對知識客體進行諸如整理、加工、揭示、控制等一系列組織序化過程。廣義的知識組織則是針對知識的兩個構成要素進行的,即知識因子的有序化和知識關聯的網絡化?,F在主要使用的知識組織方法有本體、知識地圖等。

“本體”一詞源于哲學領域,20世界90年代中期以來,人類將“本體”概念引入人工智能、知識工程和圖書情報領域。目前大家比較認同的是美國斯坦福大學知識系統實驗室的Gruber在1993年提出的定義,即本體是概念體系的規范。本體創建是本體知識獲取的核心,即從某個領域中抽取知識,形成描述該領域的語義概念、實例和其間的關系。知識本體在描述領域知識時,將領域知識的一些重要屬性和操作與知識本身緊密聯系,因此其表示方法更加形象、準確與合理。

“知識地圖”概念最早由布魯克斯于1988年在其經典著作《情報學的基礎》中提出,他認為人類的客觀知識結構可繪制成以各個單元概念為節點的學科認知地圖。知識地圖是一個包括了各種知識及其關系的集合體,它的構建涉及知識資源的分類、聚類,知識的挖掘、鏈接、檢索和可視化等方面。以計算機智能技術,如自動標引技術、自動分類技術、信息提取技術、關聯挖掘技術、可視化技術等為基礎。通過對知識的挖掘、聚類來形成語義和知識層次上描述知識的模型。可以說,知識地圖在知識組織方面是綜合了上述多種組織方法,是一種綜合性的方法。

3.2 文獻單元信息知識組織

文獻單元、信息單元、知識單元一直是信息組織研究的對象。只不過在互聯網誕生之前,人們只能對物質載體進行信息收集、組織、整理、保管,對文獻內容進行簡單揭示。但是隨著互聯網技術的發展,元數據、本體、關聯數據讓知識組織方法有了更廣闊的探索空間。知識組織可以從揭示一本書、一張光盤,到揭示書中的某一篇、某一段,盤上的一段樂曲、一首歌。對信息、知識細粒度的揭示,是知識組織在語義網階段發展的必然。

3.2.1 單元信息的界定。語義網背景下,知識組織的對象可以突破傳統的印刷型文獻、網絡信息資源,轉入文獻粒度更細的單元信息領域。所謂單元信息,也稱精粹信息,是指原始文本中隱含的有價值的觀點、方法、資料、事實、結論等片段語句。單元信息不同于信息單元,也不同于知識單元。文庭孝等曾在《知識單元研究述評》一文中指出:文獻單元是一個載體單元或物理單元。以一定形式的載體形態或物理形態表達和存貯知識。文獻單元是知識單元的一種形態,文獻單元中包含著知識單元,知識單元最終附著在一定形式的文獻單元中,體現為文獻單元。由此不難看出文獻單元與知識單元有著相互滲透的關系。本文中的單元信息與文獻單元和知識單元均有著密切聯系,單元信息來自于文獻單元,是隱含在文獻單元中的有價值的片段信息。另一方面,單元信息屬于廣義層面的知識單元,是知識單元的一種形式。

3.2.2 單元信息知識組織方法構想。單元信息組織方法以本體構建為主體,本體作為語義網的關鍵技術,是從語義層面進行知識組織的方法,其所涵蓋的主題詞和詞間關系更豐富,適合于對內容的深度揭示。通過本體對單元信息的標注,實現語義檢索和可視化顯示。具體實現示意圖如圖1。

圖1

3.2.3 單元信息組織過程中的關鍵點。

(1)單元信息的抽取。單元信息來源于文獻,通過文獻信息的搜集獲得文獻資源集合,接著通過對文獻的分析,按照一定的標準和原則抽選出有價值的單元信息,最后形成單元信息集合。單元信息的抽取分為人工抽取和計算機抽取兩種方式。人工抽取獲得的單元信息質量較高,但耗時耗力。計算機抽取需要采用文本分析、中文分詞等相關技術并通過一定的算法實現,效率高但是抽取的質量較差。因此,最好將兩者相結合,實現機器半自動抽取,并配合人工審校完成單元信息的抽取。

(2)構建領域本體?;诒倔w的信息組織方法的核心是構建領域本體,包括領域范圍的確定;主題概念和詞間關系的確定,以及形式化表示。領域本體的構建是一項非常專業和耗時耗力的工作,領域范圍以及詞和詞間關系的確定必須要有領域專家的參與。目前本體形式化的工具很多,常用的是斯坦福大學開發的Protégé軟件,該軟件可將主題概念以及概念之間的關系形式化表達并可視化顯示。本體在單元信息組織中的作用主要是對單元信息進行主題標引,形成主題詞索引,并借助本體概念之間的關聯實現語義檢索。

(3)語義檢索與可視化顯示。語義網環境下的知識組織的特點是語義關聯。本體是語義網的關鍵技術,利用本體技術進行單元信息的標注,可以借助概念之間的語義關系實現單元信息的語義關聯,從而構建單元信息網絡。知識組織實現了知識單元的有序化和知識關聯的網絡化,信息可視化相關技術能夠實現對信息數據的分析和提取,然后以圖形、圖像、虛擬現實等易為人們所辨識的方式展現原始數據間的復雜關系、潛在信息以及發展趨勢,以便能夠更好地利用所掌握的信息資源。信息可視化不僅給信息以形象,為我們提供直觀的結果,方便我們觀察;而且能夠揭示信息之間的關聯,挖掘隱含的模式和結構,讓我們有效地利用信息、發現知識。

4 對未來信息組織方法的展望

信息組織的最終目的是為了用戶需求,在面向用戶需求的基礎上,通過數據、信息、文獻等相互映射和語義關聯,使數據、信息、文獻等上升為能夠實現知識服務的知識組織。面向單元信息的知識組織的方法,是語義網階段知識組織方法的一個新的嘗試。單元信息精準、靈活、關聯的特點,更符合人類思維習慣。按這種方法生產的單元信息知識庫,將為用戶知識服務提供新的體驗。經過知識關聯重組后的信息,不僅可以使用戶在組織化的知識系統中快捷、準確地獲得所需知識,而且由于改變了知識因子間的原有聯系,往往能夠提供新知識,這些新知識將成為知識創新的直接動因。

隨著各種計算機技術、通信技術、控制技術、傳感技術的不斷發展,像自動標引、數據挖掘、知識發現、標記語言等技術都會為知識組織向單元信息、片段信息發展提供良好的發展條件。未來知識組織的方法可能會出現更先進的技術支持,但是細粒度、語義化應該是知識組織的一個基本要求。希望單元信息的知識組織方法能為將來信息組織方法的改變提供一點參考。

[1]李 潔,丁 穎.語義網關鍵技術概述[J].計算機工程與設計,2007(4):1831—1836.

[2]劉 煒,胡小菁,張春景,等.RDA與關聯數據[J].中國圖書館學報,2012(1):34—42.

[3]劉 煒,夏翠娟,張春景.大數據與關聯數據:正在到來的數據技術革命[J].現代圖書情報技術,2013(4):2—9.

[4]謝 銘.關聯數據和知識表示的自動語義標注技術[D].武漢:武漢大學,2012.

[5]司 莉.信息組織原理與方法[M].武漢:武漢大學出版社,2011.

[6]周 寧,吳佳鑫.信息組織[M].武漢:武漢大學出版社,2010.

[7]劉 煒,樓向英,趙 亮.DC元數據的歷史、現狀及未來[EB/OL].[2017-05-27].https:∥core.ac.uk/download/pdf/11878293.pdf.

[8]索傳軍.網絡信息資源組織研究的新視角[J].圖書情報工作,2013(4):5—12.

[9]劉 嘉.網絡信息資源的組織:從信息組織到知識組織[M].北京:北京圖書館出版社,2002:2—3.

[10]從信息組織到知識組織[EB/OL].[2012-05-09].https:∥wenku.baidu.com/view/307b29380912a21614792920.html.

[11]常 娥,夏 婧.多種知識組織方法比較[J].圖書館論壇,2016(8):1—6.

[12]B.C Brookers.情報學的基礎(四)——第四篇情報學:變化中的范式[J].王崇德,鄧亞橋,劉繼剛,譯.情報科學,1984(1):66—77.

[13]蘇 潔.知識地圖在高校圖書館流通服務工作中的應用[J].高等教育,2011(10):26.

[14]倪曉建.基于新信息環境下的精粹信息鑒選研究[J].深圖通訊,2008(2):6—9.

[15]周靜怡,孫 坦.信息可視化在數字圖書館中應用淺析[J].現代圖書情報技術,2005(1):5—8.

[16]周 寧,張會平,陳勇躍.信息可視化與知識組織[J].現代圖書情報技術,2006(7):62—65.

[17]徐緒堪,蘇新寧,馮蘭萍.面向知識服務的知識組織過程研究[J].情報資料工作,2015(1):7—13.

猜你喜歡
關聯語義信息
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
語言與語義
奇趣搭配
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
語言學與修辭學:關聯與互動
當代修辭學(2011年2期)2011-01-23 06:39:12
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 国产欧美在线观看视频| 欧美精品影院| 91视频99| 亚洲三级a| 成人精品视频一区二区在线| 2021无码专区人妻系列日韩| 国产免费黄| 99色亚洲国产精品11p| 欧美成人免费| 911亚洲精品| 国产91视频免费| 久久久久亚洲精品成人网| 69国产精品视频免费| 亚洲国产综合第一精品小说| 就去色综合| 一本大道视频精品人妻| 欧美福利在线| 91亚洲精选| 91精品国产自产在线观看| 在线免费看黄的网站| 一级看片免费视频| 福利一区在线| 三级视频中文字幕| 亚洲成在线观看| 国产91丝袜在线观看| 久久伊人操| 国产午夜看片| 中美日韩在线网免费毛片视频 | 久久国产高清视频| a级毛片免费网站| 亚洲欧美另类日本| 亚洲最大福利网站| 色播五月婷婷| 亚洲福利片无码最新在线播放| 国产在线91在线电影| 精品亚洲麻豆1区2区3区| 国产拍在线| 国产91导航| 欧美亚洲国产视频| 亚洲视频免费在线看| 久久青草免费91观看| 亚洲国产精品成人久久综合影院| 国产国产人免费视频成18| 国产在线观看成人91| 亚洲狠狠婷婷综合久久久久| 免费无码AV片在线观看中文| 在线观看无码av五月花| 91视频青青草| 国产亚洲欧美日韩在线一区二区三区| 亚洲91在线精品| 国产精品亚洲综合久久小说| 无码粉嫩虎白一线天在线观看| 91在线视频福利| 在线精品自拍| 在线免费观看a视频| 色婷婷久久| 美女免费精品高清毛片在线视| 亚洲高清在线天堂精品| 国产精品无码翘臀在线看纯欲| 国产欧美日韩另类| 五月天综合婷婷| 亚洲无码高清视频在线观看| 精品人妻AV区| 亚洲资源站av无码网址| 热九九精品| 性色生活片在线观看| 日韩精品一区二区三区免费| 好吊日免费视频| 国产三级成人| 国产永久在线观看| 香蕉99国内自产自拍视频| 国产91色| 国产在线精品人成导航| 久久99久久无码毛片一区二区| 极品国产在线| 日韩美毛片| 久久6免费视频| 免费人成网站在线高清| 日韩黄色在线| 992tv国产人成在线观看| 亚洲一区无码在线| 黄色污网站在线观看|