◎張晨彭芮
基于Protégé的鐵路信息公開目錄知識(shí)建模
——以客貨營(yíng)銷領(lǐng)域?yàn)槔?/p>
◎張晨1彭芮2
為了滿足廣大用戶希望充分了解鐵路方面的相關(guān)信息,享受信息獲取權(quán)利的要求,也為了適應(yīng)鐵路信息化的全面發(fā)展。本文采用本體知識(shí)建模工具Protégé,對(duì)鐵路信息公開目錄中客貨營(yíng)銷領(lǐng)域構(gòu)建知識(shí)模型,在知識(shí)層次上實(shí)現(xiàn)客貨營(yíng)銷領(lǐng)域鐵路信息公開的相關(guān)概念和語(yǔ)義關(guān)系描述,從而展開鐵路信息公開的深入分析。
鐵路作為國(guó)家基礎(chǔ)設(shè)施,堪稱國(guó)民經(jīng)濟(jì)的大動(dòng)脈,在全民奔向小康社會(huì)的進(jìn)程中肩負(fù)著重要的歷史使命。作為自然壟斷行業(yè),鐵路和消費(fèi)者之間信息嚴(yán)重不對(duì)稱,侵犯消費(fèi)者知情權(quán)的現(xiàn)象屢見(jiàn)不鮮。而隨著政府加大信息公開力度,公民逐漸開始咨詢與自己利益相關(guān)的政府信息,對(duì)于與日常生活相關(guān)的鐵路信息知情權(quán)的呼聲也越來(lái)越高。但是鐵路數(shù)據(jù)紛繁復(fù)雜,其中涉及到國(guó)家安全、商業(yè)秘密和個(gè)人隱私這些保密事項(xiàng)。基于此,如何向社會(huì)公開鐵路信息,又保障信息的保密性,劃定公開與保密的界限成為重中之重。
本文欲利用Protégé 相關(guān)軟件對(duì)鐵路信息知識(shí)模型進(jìn)行構(gòu)建,在“七步法”的基礎(chǔ)上,提出鐵路領(lǐng)域模型的構(gòu)建方法。結(jié)合Protégé 工具,將鐵路信息公開模型的搭建過(guò)程進(jìn)行了詳盡論述:通過(guò)類層次關(guān)系、類屬性以及實(shí)例的添加搭建模型框架;通過(guò)SWRL規(guī)則與軟件推理功能的結(jié)合,進(jìn)一步完善模型,將鐵路公開數(shù)據(jù)中部分保密信息顯現(xiàn)出來(lái),有助于合理確定信息公開與保密界限。
Protégé是一個(gè)基于Java語(yǔ)言編寫的開放源代碼的本體編輯器,該工具由斯坦福大學(xué)Stanford Medical Informatics開發(fā)。Protégé是一個(gè)自由、具有開放性資源的本體編輯器,也是建立知識(shí)體系的框架。其以樹形的層次目錄結(jié)構(gòu)顯示,界面簡(jiǎn)單易操作,用戶可以通過(guò)點(diǎn)擊相應(yīng)的項(xiàng)目來(lái)增加或編輯類、子類、屬性、實(shí)例等,繼而用戶可以在概念層次上設(shè)計(jì)領(lǐng)域模型。
框架。Protégé知識(shí)模型是基于框架的,框架是知識(shí)庫(kù)系統(tǒng)的主要支撐。
在Protégé中,一個(gè)Protégé本體由類、槽、面和公理(classes,slots,facets,axioms)組成,見(jiàn)圖1-1。
類描述了關(guān)于這個(gè)本體領(lǐng)域的概念。在Protégé中,所有的類組成一個(gè)層次結(jié)構(gòu),可以用樹來(lái)描述,樹的根為Protégé系統(tǒng)類THING。類a是類b的子類,則類a的實(shí)例也是類b的實(shí)例。Protégé中,類支持多重繼承,一個(gè)類可以有一個(gè)以上的超類。個(gè)體和類都能作為類的實(shí)例。一個(gè)元類是一個(gè)類,也是他們自己的類的實(shí)例。
槽描述了類的屬性和特征。一個(gè)槽可以定義為一個(gè)獨(dú)立的類。當(dāng)槽依附于一個(gè)本體時(shí),它描述那個(gè)本體的屬性。槽分為自有槽和模板槽,自有槽描述它所依附對(duì)象本身的屬性,自有槽不能繼承到類的子類或傳遞給類的實(shí)例。模板槽只能依附于一個(gè)類,它描述一個(gè)實(shí)例應(yīng)該有的屬性,模板槽作為被子類繼承并且成為實(shí)例的自有槽。Protégé并不允許自有槽直接附于類或者實(shí)例。一個(gè)實(shí)例只能以類的模板槽作為它的自有槽,一個(gè)類的自有槽只能從它的元類的模板槽來(lái)獲得。
面描述了槽的屬性,具體制定槽值的范圍、類型。面的定義僅限于它所依附的槽。公理是這個(gè)本體領(lǐng)域中的統(tǒng)一約束。一個(gè)Protégé知識(shí)庫(kù)包括了這個(gè)本體和有特殊槽值的類的個(gè)體實(shí)例。

本體構(gòu)建方法
同本體的規(guī)則一樣,本體的構(gòu)建方法也是參差不齊,因?yàn)榇蟛糠謽?gòu)建本體的項(xiàng)目組都是采用人為手工的方式,沒(méi)有將其大規(guī)模的開發(fā)應(yīng)用。況且每個(gè)項(xiàng)目組都擁有自己的開發(fā)原則和設(shè)計(jì)標(biāo)準(zhǔn),難以統(tǒng)一,更難獲得廣泛的認(rèn)同和遵循,所以對(duì)本體的共享、重用和互操作還難以實(shí)現(xiàn),下面列舉了幾種比較典型的本體開發(fā)方法:
骨架法:骨架法由英國(guó)愛(ài)丁堡大學(xué)研究所發(fā)明,是構(gòu)建企業(yè)本體的方法。這種方法只有開發(fā)的梗概,缺少具體詳細(xì)的方法和實(shí)例。其步驟是圖2-5 骨架法。
IDEF5法: IDEF5又稱實(shí)體描述獲取法,它的作用是方便構(gòu)建人員之間的溝通,美國(guó)KBSI公司將其進(jìn)行優(yōu)化設(shè)計(jì),變成企業(yè)本體的構(gòu)建方法。其具體步驟如圖2-6所示。
本體的本質(zhì)其實(shí)是特定領(lǐng)域的一張完整的準(zhǔn)確的定義了規(guī)則和術(shù)語(yǔ)含義的詞表,這是為了保證知識(shí)再用時(shí)的一致。IDEF5提供了一種領(lǐng)域?qū)<铱梢蚤_發(fā)和維護(hù)領(lǐng)域本體的技術(shù)。IDEF5構(gòu)建本體的方法其實(shí)質(zhì)是獲得客觀世界目標(biāo)對(duì)象的定義和屬性,以及它們之間的內(nèi)在關(guān)系。
企業(yè)建模法:企業(yè)建模法又稱為TOVE法,因?yàn)槭怯糜赥OVE項(xiàng)目中,TOVE本體包括企業(yè)設(shè)計(jì)本體、工程本體、計(jì)劃本體和服務(wù)本體。TOVE法首先需要明確設(shè)計(jì)動(dòng)機(jī),然后提出將要搭建的本體是否滿足所有需求,然后用本體定義提取出來(lái)的術(shù)語(yǔ)使其形式化,接著將規(guī)則形式化為公里,最后完善整個(gè)知識(shí)本體。步驟如圖2-7 所示。
七步法:七步法顧名思義是由七個(gè)環(huán)節(jié)構(gòu)成的,它條理清晰,步驟明確,是最為常用的一種方法。七個(gè)環(huán)節(jié)如下:確定目標(biāo)模型的行業(yè)背景;考查設(shè)計(jì)動(dòng)機(jī)以及是否在其他領(lǐng)域重用模型;羅列對(duì)象模型的相關(guān)概念及知識(shí);挖掘類與類之間的聯(lián)系;建立領(lǐng)域內(nèi)涉及的屬性,其中包括對(duì)象屬性和數(shù)據(jù)屬性,之后會(huì)有詳細(xì)介紹;定義屬性的具體數(shù)據(jù);
建立類的每個(gè)實(shí)例,本體模型搭建完成。以上就是常用的本體構(gòu)建方法,而本文將采用七步法,結(jié)合鐵路領(lǐng)域的特點(diǎn),進(jìn)行知識(shí)模型的構(gòu)建,然后結(jié)合保密條例使得保密范疇的信息被推理到保密類中去。

SWRL語(yǔ)言
本體模型雖然支持推理,但是因?yàn)闆](méi)有提供用于推理的規(guī)則,使得隱性的類間關(guān)系不能被發(fā)掘。所以說(shuō),要想讓信息之間的聯(lián)系顯性化,讓本體模型更豐富,就要設(shè)置SWRL語(yǔ)言來(lái)規(guī)定一些條例。
SWRL規(guī)則的基本形式是表示前提和結(jié)論的推導(dǎo)關(guān)系。前提和結(jié)論都可以包括單個(gè)或者多個(gè)基本命題,基本命題之間是邏輯與的關(guān)系。在本體中,規(guī)則主要使用兩種形式:
C(x)是最常用的一種表達(dá)方式。C是類,x為變量或者實(shí)例。譬如本文中的客戶(?x),說(shuō)明x是客戶類的一個(gè)實(shí)例,而客戶(Customer_1)則代表客戶_1是客戶類的一個(gè)實(shí)例,二者一個(gè)是變量,一個(gè)是規(guī)定好的實(shí)例。
P(x,y): P代表對(duì)象屬性。而(x,y)可以是變量或者本體的實(shí)例。這個(gè)整體表示y與x之間具有某種屬性P,譬 如 本 文 中 的hasDeliver(?x,?y),說(shuō)明客戶y手里有x的貨運(yùn)單,而hasDeliver(Product_2,Customer_1)則代表客戶_1擁有貨運(yùn)訂單_2,二者一個(gè)是變量,一個(gè)是規(guī)定好的實(shí)例。
而SWRL規(guī)則體現(xiàn)如下:
hasSecrecy(?x,?x),hasDeliver(?y,?x)->hasSecrecy(?y,?y)
在上面的例子中,x為類客戶的實(shí)例,y為類貨運(yùn)單的實(shí)例,hasSecrecy, hasDeliver, 為2個(gè)不同的對(duì)象屬性。該規(guī)則的前提是:如果客戶x擁有保密屬性,并且x的名下有y這個(gè)貨運(yùn)訂單,則結(jié)論是:y這個(gè)貨運(yùn)訂單也擁有保密屬性。
本體知識(shí)模型的作用
鐵路信息十分紛繁復(fù)雜,處理起來(lái)有一定難度,加之所做出來(lái)的模型不僅要包含所有鐵路信息,理清數(shù)據(jù)項(xiàng)之間的關(guān)系,有些信息還需要被推理出是否屬于保密項(xiàng),若想要搭建模型,使用本體知識(shí)模型是必不可少的,對(duì)于處理鐵路方面的信息,本體知識(shí)模型具有的優(yōu)點(diǎn)如下:
本體論提供了一種結(jié)構(gòu)化的方式來(lái)表達(dá)領(lǐng)域知識(shí)。對(duì)于領(lǐng)域,本體論清楚地解釋了兩個(gè)概念之間的關(guān)系。除此之外,如果需要擴(kuò)展現(xiàn)有本體時(shí),對(duì)領(lǐng)域術(shù)語(yǔ)的分析歸類就反映出它的非比尋常的作用,也就是說(shuō),一旦清晰的描述了某個(gè)領(lǐng)域中的術(shù)語(yǔ),就可對(duì)該領(lǐng)域進(jìn)行分析。
本體為人和主體之間的溝通搭起了橋梁。關(guān)于信息的共同理解是本體論發(fā)展的基本目標(biāo)之一。譬如說(shuō),假設(shè)有幾個(gè)不同的網(wǎng)站擁有一些學(xué)術(shù)信息并且可以查詢論文。如果它們彼此分享其使用的術(shù)語(yǔ)本體,那么任何一臺(tái)計(jì)算機(jī)都可以從它們之中提取和收集信息,以便這些信息可以用來(lái)回應(yīng)用戶的查詢。開發(fā)領(lǐng)域本體的主要目的即提供一種共同的理解機(jī)制,消除人們與軟件之間對(duì)信息結(jié)構(gòu)的理解鴻溝。
實(shí)現(xiàn)同一本體不同領(lǐng)域的多用。本體提供了獨(dú)立于應(yīng)用的描述方法使之可在不同系統(tǒng)間重用。譬如有許許多多不同領(lǐng)域的模型都需要表達(dá)時(shí)間這一概念,時(shí)間的定義包含時(shí)間間隔、時(shí)間指針以及測(cè)量方法等等。而恰好有一個(gè)組織搭建了滿足要求的本體模型,其他領(lǐng)域的組織可以非常快速方便地把時(shí)間本體用到他們自己的領(lǐng)域。除此之外,如果需要開發(fā)一個(gè)大型的本體,可以通過(guò)集成描述大型本體某些部分的多個(gè)現(xiàn)成的本體來(lái)實(shí)現(xiàn)。此舉有效的提高了工作效率,促進(jìn)了來(lái)自不同領(lǐng)域的研究人員和組織間的交流。
客貨營(yíng)銷領(lǐng)域理論知識(shí)。客貨營(yíng)銷主要包含從營(yíng)銷、產(chǎn)品設(shè)計(jì)到銷售、客戶服務(wù)的全過(guò)程業(yè)務(wù)管理等各項(xiàng)工作。
客運(yùn)方面負(fù)責(zé)管理和維護(hù)客票基礎(chǔ)數(shù)據(jù);負(fù)責(zé)編制票額分配計(jì)劃、發(fā)布席位、執(zhí)行調(diào)度命令、調(diào)整票額、組織票額的共享和再次利用;負(fù)責(zé)對(duì)票額進(jìn)行調(diào)整,包括手工票額調(diào)整、剩余票額自動(dòng)調(diào)整、席位復(fù)用、票額共用和站車交接等;負(fù)責(zé)對(duì)窗口售票業(yè)務(wù)和售票作業(yè)進(jìn)行管理。
貨運(yùn)方面負(fù)責(zé)鐵路貨運(yùn)從傳統(tǒng)“站到站”運(yùn)輸向“門到門”物流服務(wù)轉(zhuǎn)變;管理鐵路運(yùn)輸及綜合物流服務(wù)需求的提報(bào),合理安排貨物運(yùn)輸資源,對(duì)貨物運(yùn)輸過(guò)程進(jìn)行反饋、追蹤、監(jiān)督、控制。
除此之外,客貨營(yíng)銷領(lǐng)域還有其他工作,如:擬定總公司旅客運(yùn)輸服務(wù)質(zhì)量標(biāo)準(zhǔn),檢查、指導(dǎo)總公司所屬運(yùn)輸企業(yè)客運(yùn)服務(wù)質(zhì)量標(biāo)準(zhǔn);檢查、指導(dǎo)總公司所屬運(yùn)輸企業(yè)客運(yùn)服務(wù)質(zhì)量工作,組織網(wǎng)絡(luò)客運(yùn)監(jiān)察開展客運(yùn)服務(wù)質(zhì)量監(jiān)察,組織開展客運(yùn)服務(wù)質(zhì)量綜合評(píng)價(jià)。處理客戶提出的問(wèn)題、建議或投訴;跟進(jìn)問(wèn)題、建議或投訴處理的全過(guò)程;促進(jìn)員工提高服務(wù)質(zhì)量;負(fù)責(zé)制訂客戶回訪計(jì)劃和客戶滿意度調(diào)查工作等等。
客貨營(yíng)銷領(lǐng)域框架結(jié)構(gòu)。在實(shí)際工作中,客貨營(yíng)銷領(lǐng)域下包含的信息很多,比如火車訂票信息,貨運(yùn)訂單信息,以及與這些信息相關(guān)聯(lián)的線路信息與機(jī)車信息等等。由于真正的客貨營(yíng)銷領(lǐng)域包含的信息太過(guò)復(fù)雜,所以本課題下的客貨營(yíng)銷領(lǐng)域只涉及到客運(yùn)訂單和貨運(yùn)訂單兩項(xiàng),而客運(yùn)訂單下設(shè)城際、動(dòng)車、高鐵、快速、特快、直達(dá)特快這六款常用客票,每種客票下設(shè)三個(gè)客票實(shí)例。而貨運(yùn)訂單下直設(shè)8個(gè)貨運(yùn)訂單實(shí)例,整車運(yùn)輸?shù)亩x是貨物重量大于等于3噸,零擔(dān)運(yùn)輸小于3噸,經(jīng)過(guò)推理引擎的分析,將8個(gè)貨運(yùn)訂單按照貨物重量可以分為整車運(yùn)輸和零擔(dān)運(yùn)輸兩類,如圖3-1所示。
定義類
定義類和理清類的層次結(jié)構(gòu)是搭建本體模型的關(guān)鍵步驟之一,類的作用是詳細(xì)描述鐵路領(lǐng)域中重要的概念。類的創(chuàng)建方法有三種:自頂向下、自底向上和綜合法。本文在構(gòu)建鐵路領(lǐng)域的模型時(shí)采用的是自頂向下法,即從領(lǐng)域中總概念出發(fā),逐步分解,按層次建立子類。
由于protégé 4.1版本支持中文輸入以及中文推理,加上本文需要?jiǎng)?chuàng)建的許多類,所以為了通俗易懂,本文中的類用中文表示,而屬性和實(shí)例則用英文和數(shù)字表示。
類的關(guān)系圖除了在編輯時(shí)可以看到,Protégé 軟件中還有OntoGraf插件工具可以清晰明了的看到類與類彼此之間的聯(lián)系。點(diǎn)擊OntoGraf Tab,即可看到關(guān)系圖,點(diǎn)擊Expand按鈕即可擴(kuò)展此類。圖4-2為OntoGraf插件顯示出來(lái)的部分類層次關(guān)系圖,左邊是父類,右邊是子類。








定義類的屬性
只定義了類和類的層次關(guān)系僅僅是打下了良好的基礎(chǔ),還不能為之后的推理提供有效的幫助,應(yīng)該繼續(xù)豐富出這些類的內(nèi)涵。屬性可以說(shuō)明類的特征或某些實(shí)例的專有特征,將實(shí)例和實(shí)例之間聯(lián)結(jié)了起來(lái)。Protégé 中的屬性共分三類:對(duì)象屬性、數(shù)據(jù)屬性和元數(shù)據(jù)屬性。對(duì)象屬性指的是類與類之間的聯(lián)系;數(shù)據(jù)屬性指的是類本身的屬性;元數(shù)據(jù)屬性指的是描述數(shù)據(jù)的信息。作者在搭建鐵路信息公開目錄模型時(shí),用到了對(duì)象屬性和數(shù)據(jù)屬性,具體如圖4-3所示。
創(chuàng)建實(shí)例
通過(guò)上述創(chuàng)建類的層次結(jié)構(gòu)以及各種屬性的添加,已經(jīng)為鐵路信息公開模型搭好了一個(gè)大框架,而在對(duì)應(yīng)的類中創(chuàng)建實(shí)例個(gè)體,并對(duì)它的屬性進(jìn)行個(gè)性化的賦值,這樣鐵路信息公開模型便愈加完善了。
Protégé 4.1中創(chuàng)建實(shí)例的步驟是選中“Class”標(biāo)簽,出現(xiàn)類編輯窗口;選中要添加的實(shí)例所對(duì)應(yīng)的類;選擇“Individual”標(biāo)簽,點(diǎn)擊圖中的第一個(gè)按鈕為其添加一個(gè)實(shí)例;完善實(shí)例所具有的屬性值。
圖4-4為添加的客戶實(shí)例。
鐵路方面雖然大力倡導(dǎo)信息公開,但是在實(shí)際情況中,有許多需要保密,不宜公開的信息。比如軍事運(yùn)輸?shù)男畔⒐_后可能會(huì)對(duì)國(guó)家安全造成危害,本課題依據(jù)這一情況,利用protégé 模型,將軍事運(yùn)輸信息從鐵路信息公開目錄中提取出來(lái),推理到保密那一類,屬于保密類的信息即是不能公開的信息。具體如圖5-1所示。
由上圖可知,在預(yù)定義下保密信息類下是沒(méi)有任何信息的,然后用SWRL語(yǔ)言在Rules中設(shè)置了一條規(guī)則,即擁有保密屬性的客戶屬于保密信息,保密客戶的貨運(yùn)訂單也屬于保密信息,如圖5-2所示。
設(shè)置這條規(guī)則后,再根據(jù)情況定義客戶4、客戶6和客戶8屬于軍方客戶,擁有保密屬性,在此情況下進(jìn)行推理,結(jié)果如圖5-3所示。
通過(guò)推理我們可以看到,客戶4、客戶6和客戶8,以及他們所擁有的貨運(yùn)訂單都屬于保密信息類,在此類下的信息不應(yīng)該被公開。
(作者單位:1.北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院;2.四川師范大學(xué)經(jīng)濟(jì)與管理學(xué)院)
book=35,ebook=37
中國(guó)鐵路總公司科技研究開發(fā)計(jì)劃項(xiàng)目(2015X003-B,2016X004-E)資助。
環(huán)球市場(chǎng)信息導(dǎo)報(bào)2016年41期