□于秀麗 王旭坪 張娜娜
[大連理工大學(xué) 大連 116023]
應(yīng)急領(lǐng)域中,通常單個(gè)系統(tǒng)的功能比較單一,如果能夠把各個(gè)系統(tǒng)集成協(xié)作起來(lái),這種聯(lián)動(dòng)就會(huì)產(chǎn)生一種思維能力。通過(guò)迅速生成的可共享的實(shí)時(shí)信息可以統(tǒng)一全面地籌劃處理應(yīng)急事件。在應(yīng)急管理的智能化過(guò)程中,首要解決的是系統(tǒng)語(yǔ)義的集成問(wèn)題。
使用本體可以實(shí)現(xiàn)應(yīng)急領(lǐng)域系統(tǒng)的語(yǔ)義集成。本體作為一種領(lǐng)域知識(shí)概念化和模型化的方法,可用來(lái)描述計(jì)算機(jī)處理數(shù)據(jù)的語(yǔ)義信息。領(lǐng)域本體就是獲取領(lǐng)域知識(shí)的語(yǔ)義信息,確定該領(lǐng)域內(nèi)共同認(rèn)可的概念,給出了領(lǐng)域中的概念、概念屬性、概念間的關(guān)系及領(lǐng)域活動(dòng)的描述,為領(lǐng)域提供了一種可共享的概念化規(guī)范。這種規(guī)范以一種形式化描述方式,使人和計(jì)算機(jī)能夠結(jié)構(gòu)化共享和重用領(lǐng)域知識(shí)。
目前已有的研究能解決本體構(gòu)建的一部分問(wèn)題,但仍存在一定的問(wèn)題:(1) 由于應(yīng)急領(lǐng)域涉及的部門(mén)及應(yīng)用系統(tǒng)繁多,在為應(yīng)用部門(mén)構(gòu)建本體的過(guò)程中,缺乏一致的概念基礎(chǔ)與設(shè)計(jì)模式,因此需要形成應(yīng)急領(lǐng)域本體的構(gòu)建方法;(2) 應(yīng)急領(lǐng)域目前的構(gòu)建方法研究較少,多數(shù)針對(duì)某個(gè)單一應(yīng)用,僅注重應(yīng)用的某個(gè)側(cè)面而且領(lǐng)域本體作為共享的概念體系,需以領(lǐng)域中通用的標(biāo)準(zhǔn)規(guī)范來(lái)抽取;(3) 由于應(yīng)急領(lǐng)域系統(tǒng)十分復(fù)雜,領(lǐng)域本體幾乎不可能一次性構(gòu)建完善,因此本體構(gòu)建需要考慮到開(kāi)放性與擴(kuò)展性的要求。
本文分析應(yīng)急領(lǐng)域現(xiàn)狀、特點(diǎn)、業(yè)務(wù)應(yīng)用等,研究了本體的構(gòu)建模型的方法,構(gòu)建出應(yīng)急領(lǐng)域的本體模型,并利用Protégé構(gòu)建應(yīng)急領(lǐng)域本體,從而系統(tǒng)地解決上述問(wèn)題。
從我國(guó)應(yīng)急系統(tǒng)的實(shí)際出發(fā),詳細(xì)研究了應(yīng)急領(lǐng)域現(xiàn)有系統(tǒng)的基本構(gòu)成,基礎(chǔ)業(yè)務(wù),業(yè)務(wù)功能組成及體系結(jié)構(gòu),提出了基于本體的應(yīng)急領(lǐng)域集成框架,如圖1所示。

圖1 基于本體的應(yīng)急領(lǐng)域集成框架
由圖1可見(jiàn),系統(tǒng)的應(yīng)用層中存儲(chǔ)了大量的應(yīng)急信息,因而抽取概念在構(gòu)建應(yīng)急領(lǐng)域的本體過(guò)程中,是首要的任務(wù)。在構(gòu)建出基于本體的應(yīng)急領(lǐng)域集成框架后,進(jìn)一步實(shí)現(xiàn)本體和數(shù)據(jù)庫(kù)的映射,就可以有效地解決應(yīng)急系統(tǒng)的語(yǔ)義集成問(wèn)題。利用語(yǔ)義集成信息則可以實(shí)現(xiàn)該領(lǐng)域的智能化信息檢索等信息增值服務(wù)。本文主要研究該框架的基礎(chǔ)層內(nèi)容,為領(lǐng)域本體的構(gòu)建提供來(lái)源。
斯坦福大學(xué)的Gruber給出的定義得到了許多同行的認(rèn)可,即“本體是概念化的明確的規(guī)范說(shuō)明”[1]。
本體的定義包含4層含義:概念模型、明確、形式化和共享[2]:(1)概念模型是指抽象出客觀世界中一些現(xiàn)象的相關(guān)概念而得到的模型;(2)明確是指所使用的概念及使用這些概念的約束都有明確的定義;(3)形式化指機(jī)器可讀的;(4)共享指本體中體現(xiàn)的是共同認(rèn)可的知識(shí),反映的是相關(guān)領(lǐng)域中公認(rèn)的概念集,而非個(gè)體[3]。
這四層含義有效地對(duì)本體進(jìn)行了說(shuō)明,本體能夠描述概念及概念之間的聯(lián)系,從而促進(jìn)知識(shí)和信息的共享和重用。
構(gòu)建領(lǐng)域本體,在對(duì)本體的構(gòu)建技術(shù)全面研究的基礎(chǔ)上,還要對(duì)該領(lǐng)域有系統(tǒng)的理解。我國(guó)應(yīng)急領(lǐng)域構(gòu)成復(fù)雜,子系統(tǒng)數(shù)量多,應(yīng)用與服務(wù)廣泛,因此需要一個(gè)通用的易擴(kuò)展的體系結(jié)構(gòu),從而使構(gòu)建的本體具有實(shí)用價(jià)值。
領(lǐng)域知識(shí)建模是本體的一個(gè)重要應(yīng)用。目前,關(guān)于本體構(gòu)建的方法還不成熟,每個(gè)本體開(kāi)發(fā)組都有自己的構(gòu)建原則、設(shè)計(jì)標(biāo)準(zhǔn)和開(kāi)發(fā)階段。對(duì)于本體構(gòu)建的方法而言,沒(méi)有一個(gè)是“完全正確”的,也無(wú)法找到一個(gè)“完全正確”的本體構(gòu)建方法[4]。七種典型的本體構(gòu)建方法的成熟度依次為:七步法、Methontology法、IDEF5法、TOVE方法(評(píng)價(jià)法)、骨架法(企業(yè)建模法)、SENSUS法和KACTUS法。這些方法各具特色,方法之間沒(méi)有優(yōu)劣之差,它們是面向不同應(yīng)用需求的本體構(gòu)建方法,因此要根據(jù)不同的領(lǐng)域選擇不同的方法[5]。
為了能針對(duì)應(yīng)急領(lǐng)域構(gòu)建本體,本文提出了應(yīng)急領(lǐng)域資源的本體描述模型,該模型將領(lǐng)域資源抽象成概念集、屬性集、關(guān)系集。本模型對(duì)資源的描述是開(kāi)放式的,可以擴(kuò)充領(lǐng)域中新的資源及其描述,在領(lǐng)域本體的構(gòu)建中,這種開(kāi)放式的描述是十分適合的,可以使領(lǐng)域本體不斷的進(jìn)化和完善。以下對(duì)應(yīng)急領(lǐng)域本體中的概念作定義:
定義1 概念,進(jìn)行規(guī)范化描述的概念,是概括一類(lèi)事物表現(xiàn)出來(lái)的特征,是事物本質(zhì)的反應(yīng)。
定義2 屬性,描述某一特定概念中的相關(guān)特征或者性質(zhì),每個(gè)概念都有一組屬性進(jìn)行描述。
定義3 關(guān)系,概念間內(nèi)在聯(lián)系的描述。
定義4 應(yīng)急領(lǐng)域本體,可以用一個(gè)三元組O=(C,P,R) 來(lái)描述,其中:
C={C1,C2,…,Cn}表示不同分類(lèi)的服務(wù)主體;
P={P1,P2,…,Pn}表示分類(lèi)的領(lǐng)域服務(wù)活動(dòng);
R={R1,R2,…,Rn}表示C到P之間的映射關(guān)系集合。
本體中存在的關(guān)系:
1.is_Kind_of繼承關(guān)系:表達(dá)概念之間的繼承關(guān)系。
2.is_Part_of組合關(guān)系:表達(dá)概念之間部分與整體的關(guān)系。
3.is_Property_of屬性關(guān)系:表達(dá)某個(gè)概念是另一個(gè)概念的屬性。
4.is_Synonym_of同義關(guān)系:表達(dá)概念之間的同義關(guān)系。
實(shí)際應(yīng)用中,上面的幾種關(guān)系并不能滿(mǎn)足全部概念之間的關(guān)系,為滿(mǎn)足應(yīng)用的需要,在領(lǐng)域本體建模過(guò)程中,可以根據(jù)某個(gè)特定領(lǐng)域的具體情況對(duì)概念之間的關(guān)系進(jìn)行相應(yīng)的定義。
從中國(guó)應(yīng)急系統(tǒng)的應(yīng)用實(shí)際出發(fā),根據(jù)《國(guó)家突發(fā)公共事件總體應(yīng)急預(yù)案》為參考,應(yīng)急領(lǐng)域本體層次結(jié)構(gòu)如圖2所示。

圖2 應(yīng)急領(lǐng)域本體層次結(jié)構(gòu)
應(yīng)急領(lǐng)域本體的構(gòu)建,需要整合的資源一方面包括概念及相應(yīng)的規(guī)范等,另一方面包括領(lǐng)域內(nèi)系統(tǒng)中已有的信息資源。針對(duì)于應(yīng)急領(lǐng)域的特點(diǎn),主要構(gòu)建步驟如下:
1.確定本體的領(lǐng)域與范圍 首先明確需要構(gòu)建的本體所覆蓋的專(zhuān)業(yè)領(lǐng)域和應(yīng)用范圍。
2.領(lǐng)域信息的收集和分析 可通過(guò)專(zhuān)家、書(shū)籍、網(wǎng)絡(luò)等方式收集領(lǐng)域信息,充分了解領(lǐng)域知識(shí)。
3.確定領(lǐng)域中重要的概念和關(guān)系 收集和分析領(lǐng)域信息之后,確定領(lǐng)域中的重要概念和概念之間的關(guān)系,作為領(lǐng)域本體的核心概念集。由于領(lǐng)域知識(shí)背景良莠不齊,這個(gè)過(guò)程并不強(qiáng)求得到能反映領(lǐng)域知識(shí)最關(guān)鍵的概念及關(guān)系。但應(yīng)滿(mǎn)足以下兩個(gè)基本要求:一是確定的重點(diǎn)概念及其關(guān)系一定是領(lǐng)域相關(guān)的;二是能夠采用精確的術(shù)語(yǔ)表達(dá)上述重點(diǎn)概念及關(guān)系[6]。
4.建立本體框架 按照一定的邏輯規(guī)則將概念集分組,并得到領(lǐng)域本體的框架結(jié)構(gòu)。
5.對(duì)領(lǐng)域本體編碼、形式化 選用合適的本體描述語(yǔ)言對(duì)建立的領(lǐng)域本體進(jìn)行編碼、形式化[7]。
6.集成相關(guān)的已有本體 在創(chuàng)建本體時(shí)除了自己定義,也應(yīng)該通過(guò)調(diào)研找到該領(lǐng)域中現(xiàn)存的本體,加以重用[8]。
7.評(píng)價(jià)與優(yōu)化 目前沒(méi)有對(duì)本體評(píng)價(jià)的標(biāo)準(zhǔn),但有一些基本指標(biāo),即上述的構(gòu)建原則[9]。此外,本體模型的構(gòu)建是螺旋上升的,需要不斷迭代優(yōu)化。通過(guò)原型法,先建立出核心的本體模型,在之后的使用過(guò)程中不斷擴(kuò)展,完善優(yōu)化。抽取應(yīng)急領(lǐng)域本體,是構(gòu)建的重要任務(wù)之一。根據(jù)對(duì)領(lǐng)域的分析,提出了應(yīng)急領(lǐng)域的本體構(gòu)建框架,如圖3所示。

圖3 應(yīng)急領(lǐng)域的本體構(gòu)建框架
為了對(duì)應(yīng)急領(lǐng)域更好的理解,構(gòu)建本體給出以下關(guān)于對(duì)服務(wù)客體,服務(wù)主體,服務(wù)領(lǐng)域和服務(wù)客體的相關(guān)定義:
定義5 服務(wù)客體,服務(wù)領(lǐng)域面對(duì)的主要用戶(hù)。
定義6 服務(wù)主體,提供服務(wù)的主要實(shí)踐對(duì)象。
定義7 服務(wù)領(lǐng)域,按照服務(wù)的功能進(jìn)行劃分的領(lǐng)域。
定義8 客體服務(wù),向用戶(hù)鄰接層所提供的服務(wù)。
根據(jù)上述定義,應(yīng)急領(lǐng)域本體模型,如圖4所示。

圖4 應(yīng)急領(lǐng)域本體模型
其中服務(wù)領(lǐng)域包含的服務(wù),如表1所示:

表1 應(yīng)急領(lǐng)域的服務(wù)定義
由于篇幅的原因,僅以服務(wù)主體為示例展示本體的結(jié)構(gòu)信息。一級(jí)服務(wù)主體分為監(jiān)控預(yù)警部門(mén)、突發(fā)事件管理部門(mén)、物資保障部門(mén)、交通管理中心、政府行政部門(mén)、媒體中心和應(yīng)急恢復(fù)中心。在一級(jí)的基礎(chǔ)上可繼續(xù)細(xì)分為二級(jí)服務(wù)主體。如表2所示。

表2 應(yīng)急領(lǐng)域服務(wù)主體的定義
本文使用美國(guó)斯坦福大學(xué)開(kāi)發(fā)的本體編輯工具Protégé構(gòu)建應(yīng)急服務(wù)本體。它能夠定義類(lèi)和類(lèi)層次、屬性、屬性值、屬性關(guān)系和屬性約束,以及類(lèi)和屬性間的關(guān)系,而且本體結(jié)構(gòu)以樹(shù)形的層次目錄結(jié)構(gòu)顯示,允許用戶(hù)在概念層次上進(jìn)行領(lǐng)域模型設(shè)計(jì)。
圖5是對(duì)于應(yīng)急領(lǐng)域中的服務(wù)主體、服務(wù)領(lǐng)域以及服務(wù)客體中的本體概念、屬性、關(guān)系所構(gòu)建的結(jié)構(gòu),層次直觀明了,對(duì)應(yīng)急領(lǐng)域的本體構(gòu)建有一定的應(yīng)用價(jià)值。通過(guò)推理進(jìn)而發(fā)現(xiàn)概念的一致性關(guān)系,形成映射,也為今后的本體映射方法研究打下基礎(chǔ)。

圖5 應(yīng)急領(lǐng)域本體構(gòu)建
信息時(shí)代的到來(lái),數(shù)據(jù)和信息充斥著每個(gè)角落。如何充分利用所需要的信息,逐漸成為人們關(guān)注的核心。本體理論能夠促進(jìn)知識(shí)和信息的共享和重用,為領(lǐng)域本體的構(gòu)建奠定了堅(jiān)實(shí)的基礎(chǔ)。本文在介紹了本體理論的基礎(chǔ)知識(shí)之后,主要研究如何在應(yīng)急領(lǐng)域應(yīng)用本體,給出了應(yīng)急領(lǐng)域本體的構(gòu)建方法,以便方便快捷地獲取、交流信息。在內(nèi)容上有待進(jìn)一步探討研究的方面如下:
1.現(xiàn)有的本體構(gòu)建方法參差不齊。在本體評(píng)價(jià)方面,也就是構(gòu)建得到的本體是否符合用戶(hù)的應(yīng)用,這還沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),也是今后應(yīng)該研究的主要內(nèi)容。
2.根據(jù)應(yīng)急領(lǐng)域不同于其他領(lǐng)域的特點(diǎn),研究適用于應(yīng)急領(lǐng)域的本體,創(chuàng)新構(gòu)建方法,更好地實(shí)現(xiàn)共享與重用。
[1]GRUBER T R.A translation approach to portable ontology specification[J].Knowledge Acquisition,1993,5(1):199-220.
[2]楊建池,韓守鵬,黃柯棣.軍事領(lǐng)域本體構(gòu)建研究[J].計(jì)算機(jī)仿真,2007,24(12):6-9.
[3]官冰,黨德鵬.財(cái)務(wù)管理領(lǐng)域本體的構(gòu)建[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(2):10-13.
[4]NOY N F,MCGUINNESS D L.Ontology development 101:A guide to creating your first ontology[R].Stanford,CA:Stanford University,2001.
[5]李景.本體理論及在農(nóng)業(yè)文獻(xiàn)檢索系統(tǒng)中的應(yīng)用研究——以花卉學(xué)本體建模為例[D].北京:中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,2004.
[6]曾慶田.面向知識(shí)處理的領(lǐng)域本體及其應(yīng)用研究[J].情報(bào)學(xué)報(bào),2006,36(6):1-11.
[7]GENSERETH M R,FIKESL R E.Knowledge interchange format version reference manual[R].Stanford,CA:Stanford University,1992.
[8]何燕,穗志芳,段慧明,等.基于專(zhuān)業(yè)術(shù)語(yǔ)詞典的自動(dòng)領(lǐng)域本體構(gòu)造[J].情報(bào)學(xué)報(bào),2007,13(8):35-38.
[9]李勇,張志剛.領(lǐng)域本體構(gòu)建方法研究[J].計(jì)算機(jī)工程與科學(xué),2008,30(5):129-131.
電子科技大學(xué)學(xué)報(bào)(社科版)2015年3期