〔摘 要〕本文對領(lǐng)域本體及知識整合的相關(guān)理論及實(shí)踐應(yīng)用進(jìn)行了簡要的介紹與分析,并對領(lǐng)域本體引入知識整合中做了必要性及可行性研究。同時筆者還構(gòu)建了基于領(lǐng)域本體的知識整合模型,以期對相關(guān)領(lǐng)域的理論研究有所貢獻(xiàn)。
〔關(guān)鍵詞〕領(lǐng)域本體;知識整合;知識組織體系
DOI:10.3969/j.issn.1008-0821.2011.12.007
〔中圖分類號〕G250.73 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2011)12-0027-03
Research on Knowledge Integration Based Domain OntologyXu Debin
(College of Science,Changchun University,Changchun 130022,China)
〔Abstract〕This article conducted the analytical study to the related theory and practical application of domain ontology and knowledge,and analysed the necessity and feasibility of ontology being introduced to knowledge integration.Simultaneously the author also constructed the model of knowledge integration based domain ontology,with having contribution by the time to the related domains fundamental research.
〔Key words〕domain ontology;knowledge integration;knowledge organization systems
信息時代正面臨著一場資源環(huán)境的大變革:信息資源局部有序,整體無序的狀況日趨嚴(yán)重,單一、孤立的微觀信息組織呈現(xiàn)指數(shù)冪增加,這不僅沒有解決用戶準(zhǔn)確獲取所需信息的難題,反而使得信息整合的難度加大;同時,知識環(huán)境下用戶對信息形式的獲取正向著知識組織的方向發(fā)展,不再局限于一次或是二次信息資源,而是經(jīng)過智能化處理的由知識元及知識元間相互的聯(lián)系組成的信息知識體系。
在信息環(huán)境的大變革時期,微觀有序而宏觀龐雜的資源如何有效的整合,各異構(gòu)系統(tǒng)中不同形式的信息如何合理轉(zhuǎn)化、建立聯(lián)系,如何提高用戶獲取信息體系的準(zhǔn)確程度等都是知識整合研究所面臨的緊迫課題。
1 知識整合概述
知識整合是整合實(shí)踐發(fā)展的需要,從數(shù)據(jù)整合、信息整合到如今的知識整合這一漸進(jìn)的發(fā)展脈絡(luò)是基于整個社會信息需求的基調(diào)而展開的。在整個資源整合體系中,知識整合位于最高層,它在數(shù)據(jù)整合、信息整合的基礎(chǔ)上,揭示資源知識結(jié)構(gòu)中概念及概念間的關(guān)系。通過知識整合,可把信息社會中眾多孤立的概念建立起有機(jī)的聯(lián)系,形成便于大眾獲取、理解的知識網(wǎng)格,提高整個信息傳輸流的速率和效率[1]。
1.1 知識整合的組成
知識整合是一整套基于知識的組織,筆者從操作者得角度將其分為知識組織和知識檢索兩個方面。
所謂知識組織是對知識元及知識元間的有機(jī)聯(lián)系進(jìn)行組織與展示的機(jī)制;而知識檢索系統(tǒng)則是按照一定方式將知識的整合結(jié)果清晰有序的在統(tǒng)一的界面展示,在知識組織的基礎(chǔ)上,以技術(shù)合理呈現(xiàn)知識。知識整合的兩個方面是相互聯(lián)系的統(tǒng)一體,如圖1。
1.2 知識整合的特點(diǎn)
通過對知識整合的研究與分析,筆者總結(jié)出知識的幾個顯著特點(diǎn):
1.2.1 以知識組織體系為基礎(chǔ)
知識組織體系是用以定義并組織知識的一套概念和符號的空間有序集合,它通常包括概念類聚體系和概念關(guān)聯(lián)體系兩個不可或缺的組織方式,而概念關(guān)聯(lián)體系是其中最
圖1 知識整合的兩個組分
優(yōu)的知識組織體系,是知識整合的精華之所在。只有通過該體系建立信息集合中的概念關(guān)系,才能實(shí)現(xiàn)真正意義上的知識整合[2]。
1.2.2 以知識展示為手段
知識網(wǎng)絡(luò)是用以展示知識的最主要手段,網(wǎng)格可以將知識元組成的多維空間進(jìn)行可視化描述,定位單獨(dú)的知識元,揭示知識元間聯(lián)系,可以說知識整合的一切成果都可以以知識網(wǎng)格的形式展示,這是知識整合的顯著特征。
1.2.3 以知識檢索為目的
在知識整合、知識關(guān)聯(lián)的基礎(chǔ)上構(gòu)筑的概念語義智能化獲取是知識檢索實(shí)現(xiàn)的途徑,它逆化了知識整合的流程,是知識整合所要達(dá)到的實(shí)用目標(biāo)[3]。
基于領(lǐng)域本體的知識整合淺析2 領(lǐng)域本體的研究現(xiàn)狀
“本體”一詞來源于西方哲學(xué)理論體系,本體論是用來體現(xiàn)概念及概念間關(guān)系的系統(tǒng),它是通過邏輯抽象而逐步建立起來的。哲學(xué)框架下本體的思想方法正符合信息時代下大眾對知識的需求。于此,本體一詞很快的被應(yīng)用到信息科學(xué)與圖書情報(bào)領(lǐng)域,并快速成為知識整合的基礎(chǔ)理論及技術(shù)方法。
2.1 領(lǐng)域本體的特點(diǎn)及意義
國內(nèi)外對于本體的概念、分類等基礎(chǔ)理論的研究存在很多不同的觀點(diǎn),在總結(jié)、分析國內(nèi)外眾多理論的基礎(chǔ)上,筆者認(rèn)為領(lǐng)域本體在知識整合中將發(fā)揮著越來越重要的作用。
領(lǐng)域本體是對特定領(lǐng)域知識的抽象概括與規(guī)范描述。領(lǐng)域本體的兩個基本特征是:①領(lǐng)域本體是描述某一特定學(xué)科或社會活動領(lǐng)域的概念、概念的屬性和概念間關(guān)系及某些需要遵從規(guī)則的知識元;②領(lǐng)域本體具有較強(qiáng)的實(shí)際應(yīng)用性[4]。
領(lǐng)域本體反應(yīng)特定領(lǐng)域的知識結(jié)構(gòu),通過對領(lǐng)域概念精確的規(guī)劃,不僅使信息系統(tǒng)的高度智能化變?yōu)榭赡?,同時也不斷疏正大眾的本意;而領(lǐng)域本體中概念關(guān)系的形式化表述更利于web環(huán)境下本體的交換、共享和高效檢索。從宏觀上講,領(lǐng)域本體概念體系的構(gòu)建更符合信息大眾準(zhǔn)確、便捷的知識需求。
2.2 領(lǐng)域本體的研究領(lǐng)域
領(lǐng)域本體作為一種微觀知識組織體系,其重要性日益被人們所重視。學(xué)者從不同角度出發(fā),來研究領(lǐng)域本體在知識組織、知識檢索中的作用、地位以及其構(gòu)建方式。目前的研究主要集中在以下幾個領(lǐng)域:領(lǐng)域本體與知識門戶、本體與語義網(wǎng)、領(lǐng)域本體與異構(gòu)數(shù)據(jù)庫集成、領(lǐng)域本體與知識檢索、領(lǐng)域本體與知識庫。
領(lǐng)域本體是對具體學(xué)科領(lǐng)域知識的規(guī)范性描述,目前本體實(shí)踐應(yīng)用的焦點(diǎn)就集中在學(xué)科領(lǐng)域本體的構(gòu)建上,而具體構(gòu)建的基本流程與方法是該領(lǐng)域研究的熱點(diǎn)。筆者相信,在各具體領(lǐng)域本體基礎(chǔ)上構(gòu)建的各項(xiàng)知識應(yīng)用定會發(fā)揮更加關(guān)鍵的作用。
3 領(lǐng)域本體引入知識整合的必要性及可行性分析
知識整合是一項(xiàng)理論及技術(shù)要求都極高的知識體系構(gòu)建手段,它的層次邏輯性很嚴(yán)密,如圖2,是知識整合體系的基礎(chǔ)框架,在多種數(shù)據(jù)源的基礎(chǔ)上,抽取出元數(shù)據(jù),對抽取、集成的數(shù)據(jù)源進(jìn)行本體加工,利用科學(xué)分析等相關(guān)方法獲取領(lǐng)域本體概念,依據(jù)描述領(lǐng)域知識的相關(guān)規(guī)范,構(gòu)建領(lǐng)域本體概念模型,通過模型對信息集合進(jìn)行語義分析與標(biāo)注,形成語義關(guān)聯(lián)的元數(shù)據(jù)集合,存入本體知識庫中。
圖2 知識整合體系的基礎(chǔ)架構(gòu)
可見,隨著社會大眾對信息獲取程度的不斷加深,簡單的、大量的信息推送已不能滿足其需求了,信息機(jī)構(gòu)的工作應(yīng)走在需求的前頭,主動的將用戶的信息需求凝練成知識,并將相關(guān)概念的關(guān)系直觀的展現(xiàn)給用戶?;诖?,本體尤其是領(lǐng)域本體的構(gòu)建就顯得尤為重要,它是知識整合的堅(jiān)實(shí)基礎(chǔ),也可以說知識整合建立在眾多領(lǐng)域本體的基礎(chǔ)上,沒有領(lǐng)域本體,知識整合就只是泛泛的空談。
目前,部分學(xué)科的領(lǐng)域本體已逐步構(gòu)建起來,而且在此領(lǐng)域本體基礎(chǔ)上的知識組織及檢索系統(tǒng)也相應(yīng)的建立起來,如“經(jīng)濟(jì)學(xué)科領(lǐng)域本體”及“經(jīng)濟(jì)學(xué)學(xué)科知識檢索系統(tǒng)”等,該系統(tǒng)是以經(jīng)濟(jì)學(xué)領(lǐng)域本體資源整合思路為基礎(chǔ),實(shí)現(xiàn)經(jīng)濟(jì)學(xué)領(lǐng)域?qū)W科知識組織和知識檢索方面的一次積極嘗試。
綜上,將領(lǐng)域本體引入知識整合的流程中不僅是必要的,而且是可行的。
4 基于領(lǐng)域本體的知識整合模型構(gòu)建
將領(lǐng)域本體引入知識整合中,作為一個堅(jiān)實(shí)的根基并在此基礎(chǔ)上進(jìn)行知識組織、知識檢索活動。領(lǐng)域本體的建設(shè)已經(jīng)初步開展起來,在現(xiàn)階段應(yīng)考慮的是如何合理有效的將各個學(xué)科領(lǐng)域的本體引入知識整合的活動中來,筆者認(rèn)為模式的構(gòu)建和規(guī)劃是非常重要的,它既是對以往實(shí)際操作經(jīng)驗(yàn)的總結(jié),又是對未來知識活動的理性設(shè)計(jì)。
筆者在分析、研究相關(guān)理論成果及實(shí)踐應(yīng)用的基礎(chǔ)上,將以領(lǐng)域本體為基礎(chǔ)的活動分為理論整合層、應(yīng)用拓展層和知識檢索層,如圖3。圖3 基于領(lǐng)域本體的知識整合模型
4.1 理論整合層面的構(gòu)建
理論整合層面主要涉及以領(lǐng)域本體為基礎(chǔ)構(gòu)建堅(jiān)實(shí)的知識組織體系,并以此來描述特定領(lǐng)域的知識結(jié)構(gòu)。在此層中,領(lǐng)域本體起著關(guān)鍵性的作用:
(1)以領(lǐng)域本體為描述工具來展現(xiàn)知識結(jié)構(gòu),知識是有結(jié)構(gòu)的,知識是結(jié)構(gòu)化的信息。結(jié)構(gòu)化的信息是知識組織所要揭示與描述的對象。知識資源的結(jié)構(gòu)化不是簡單的線性或是等級式的,而是表面復(fù)雜實(shí)則清晰的空間網(wǎng)狀式的。知識結(jié)構(gòu)的網(wǎng)狀表現(xiàn)形式就是要客觀的體現(xiàn)各種關(guān)系的概念群,而知識組織就是在概念的基礎(chǔ)上,將資料或文獻(xiàn)中的這種概念群間的結(jié)構(gòu)關(guān)系揭示出來。
(2)知識組織體系是知識整合的基礎(chǔ)。所謂知識組織體系,是對內(nèi)容概念及概念間的相互關(guān)系進(jìn)行描述與組織的機(jī)制。這里的資源內(nèi)容概念及其相互關(guān)系即是知識結(jié)構(gòu),而領(lǐng)域本體是先關(guān)知識結(jié)構(gòu)性的基本描述,只有以領(lǐng)域本體作為知識組織的技術(shù)和方法,最終實(shí)現(xiàn)基于語義的知識檢索。
(3)以領(lǐng)域本體構(gòu)建的知識網(wǎng)絡(luò)為表現(xiàn)形式,有什么樣的組織方式就有什么樣的顯示方式,知識組織基于領(lǐng)域知識本體,通過對學(xué)科知識結(jié)構(gòu)和概念關(guān)聯(lián)的組織,形成客觀有序的知識網(wǎng)格,以反映知識內(nèi)容和概念的關(guān)聯(lián)。
4.2 應(yīng)用拓展層的構(gòu)建
隨著信息技術(shù)發(fā)展及專業(yè)知識的不斷充實(shí)與更新,領(lǐng)域本體應(yīng)在實(shí)踐的發(fā)展中不斷拓展自身的應(yīng)用范圍,同時自身內(nèi)容的更新也是不可或缺的:
(1)領(lǐng)域本體的更新與概念群關(guān)聯(lián)的建立,現(xiàn)代信息社會,知識的更新速度不斷加快,知識庫更應(yīng)跟上不斷發(fā)展的信息知識化進(jìn)程,對于本體而言,它自然也要不斷的更新來適應(yīng)實(shí)際需要的發(fā)展,特別是對于應(yīng)用性很強(qiáng)的領(lǐng)域本體,可以說,本體的進(jìn)化就是該領(lǐng)域知識生命的延續(xù),這就要求我們在領(lǐng)域本體的構(gòu)建過程中,要不斷的對概念、概念群關(guān)聯(lián)及本體結(jié)構(gòu)進(jìn)行豐富與完善。
(2)本體與異構(gòu)數(shù)據(jù)庫集成,異構(gòu)數(shù)據(jù)庫集成是對異構(gòu)數(shù)據(jù)源系統(tǒng)中的數(shù)據(jù)在物理上或是邏輯上有機(jī)地集中,提供統(tǒng)一的表示和查詢的一種資源整合方式。但目前的異構(gòu)數(shù)據(jù)庫集成多表現(xiàn)為集成數(shù)據(jù)在數(shù)量上的變化,基本沒有反映數(shù)據(jù)之間的有機(jī)關(guān)聯(lián)。要想解決數(shù)據(jù)源的語義異構(gòu)問題只能是引入領(lǐng)域本體[5]。
(3)本體與知識庫,領(lǐng)域知識庫是面向特定領(lǐng)域的知識集合,隨著知識整合不斷的深入,對知識的互操作性、共享性及可維護(hù)性等方面的要求越來越高,傳統(tǒng)的數(shù)據(jù)庫構(gòu)建方法與人工智能技術(shù)已不能滿足需要[6]。
(4)本體與知識門戶,信息門戶是集成與揭示某一領(lǐng)域的重要信息及其信息間有機(jī)關(guān)聯(lián)的整合方式。由于信息門戶采用的是以分類法、主題詞表等信息組織體系組織資源對象,僅對細(xì)心實(shí)體間的關(guān)聯(lián)進(jìn)行整合,而并沒有揭示信息實(shí)體內(nèi)部的概念和語義,所以目前信息門戶的發(fā)展趨勢是在資源集成的上層構(gòu)建一個本體層,以領(lǐng)域本體代替?zhèn)鹘y(tǒng)的組織方式,對資源集合進(jìn)行知識整合,由信息門戶向知識門戶演化[7]。
(5)本體與語義網(wǎng),語義網(wǎng)是信息時代技術(shù)發(fā)展的產(chǎn)物,它以一種機(jī)器可以理解的方式來傳遞人類知識,把人與人的信息交流模式轉(zhuǎn)化成人與機(jī)器之間的傳遞方式,這樣異構(gòu)、分布網(wǎng)絡(luò)信息的檢索、訪問問題就借助語義網(wǎng)解決了。語義網(wǎng)的構(gòu)建需要將萬維網(wǎng)中孤立的信息元發(fā)展成巨大的信息網(wǎng)絡(luò),這就需要領(lǐng)域本體的全方位構(gòu)建與互聯(lián)[8]。
4.3 基于領(lǐng)域本體的知識檢索層面的構(gòu)建
目前大多數(shù)檢索工具是基于關(guān)鍵詞的機(jī)械匹配進(jìn)行的,這種檢索方式割裂了字、詞間的語義關(guān)聯(lián),難以滿足知識準(zhǔn)確獲取的需求。于此,領(lǐng)域本體的引入不僅是必要的而且是迫切的,在領(lǐng)域本體語義互聯(lián)的基礎(chǔ)上根據(jù)查詢請求和信息源進(jìn)行語義分析,實(shí)現(xiàn)基于語義理解的知識檢索正在成為學(xué)界的研究熱點(diǎn)。
5 展 望
隨著知識信息時代的逐步發(fā)展,各種知識整合的支撐技術(shù)日益成熟,以領(lǐng)域本體為基礎(chǔ),對微觀有序而宏觀龐雜的信息資源進(jìn)行整合,對異構(gòu)系統(tǒng)中的數(shù)字資源進(jìn)行融合、重組,最終形成體系化的知識組織,以此來提高數(shù)字資源傳播與利用的效率,這是知識整合發(fā)展的基本脈絡(luò);同時,隨著對領(lǐng)域本體的展現(xiàn)與服務(wù)的研究,構(gòu)建本體的可視化手段不斷完善,筆者相信在不久的未來,領(lǐng)域本體定能以更加直觀、形象的方式實(shí)現(xiàn)知識導(dǎo)航、知識構(gòu)建和知識服務(wù),從而推動整合知識社會的發(fā)展。
參考文獻(xiàn)
[1]李廣建.整合研究的幾個理論問題[J].圖書情報(bào)工作,2005,(10):6-10.
[2]李寧,送文.對于知識組織體系概念以及構(gòu)建模式的一些思考[J].圖書情報(bào)工作,2005,(10):37-40.
[3]馬文峰.人文社會科學(xué)信息檢索[M].北京:北京圖書館出版社,2004:160.
[4]杜小勇,馬文峰.學(xué)科領(lǐng)域知識本體構(gòu)建方法研究[J].圖書情報(bào)工作,2003,(8):74-78.
[5]雷瓊.基于本體的異構(gòu)數(shù)據(jù)庫集成研究[J].東北大學(xué)學(xué)報(bào),2005,(6):13-15.
[6]王曉東.基于Ontology知識庫系統(tǒng)建模與應(yīng)用研究[J].華東師范大學(xué)學(xué)報(bào),2003:1-2.
[7]祝忠明,吳新年,孫成權(quán).資源環(huán)境學(xué)科信息門戶的研究與建設(shè)[J].圖書情報(bào)工作,2005,(7):65-68.
[8]劉柏嵩.基于知識的語義網(wǎng):概念、技術(shù)及挑戰(zhàn)[J].中國圖書館學(xué)報(bào),2003,(2):18-21.
[9]邱琳.基于知識管理的專業(yè)圖書館數(shù)字資源整合策略[J].現(xiàn)代情報(bào),2007,(8):90-93.