摘 要:構(gòu)建了基于本體的物流行業(yè)信息化知識(shí)庫(kù)。應(yīng)用語(yǔ)義Web和Web服務(wù)技術(shù)研究物流知識(shí)資源,設(shè)計(jì)了物流領(lǐng)域本體,實(shí)現(xiàn)了文本摘要、規(guī)則抽取、本體整合等關(guān)鍵功能,解決物流系統(tǒng)中語(yǔ)義和重用問題,提高了物流企業(yè)的知識(shí)共享和協(xié)作能力。這不僅為物流行業(yè)信息化奠定了堅(jiān)實(shí)基礎(chǔ),而且為知識(shí)庫(kù)的復(fù)用創(chuàng)造了條件。
關(guān)鍵詞:本體;物流;知識(shí)庫(kù);知識(shí)復(fù)用;面向服務(wù)的架構(gòu)
中圖分類號(hào):TP316 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2008)09-2734-04
Study on ontologybased logistics industry repository
RAO Guozheng1,F(xiàn)ENG Zhiyong1,ZHANG Li2,NIE Xufei1
(1. School of Computer Science Technology, Tianjin University, Tianjin 300072, China;2.School of Economy Management, Tianjin University of Science Technology, Tianjin 300222, China)
Abstract:This paper presented ontologybased logistics industry repository.Logistics knowledge resources were discussed with semantic Web and Web services technology.The problem of semantic and reuse in logistics information system was resolved by implementation of designing logistics domain ontology, text summary, rules extraction and ontology merge. The knowledge sharing ability of logistics enterprises is improved, which is the foundation of logistics industry informationization and the conditions of reusing repository.
Key words:ontology; logistics; repository; knowledge reuse; service oriented architecture
0 引言
隨著經(jīng)濟(jì)全球化和信息技術(shù)的迅猛發(fā)展,全球產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整不斷深入,社會(huì)生產(chǎn)、物資流通、商品交易及其管理方式正發(fā)生深刻的變革。繼物質(zhì)資源市場(chǎng)、人力資源之后的“第三利潤(rùn)源”——現(xiàn)代物流正在世界范圍內(nèi)迅速發(fā)展,成為現(xiàn)代經(jīng)濟(jì)中最活躍的增長(zhǎng)因素。
在我國(guó),隨著經(jīng)濟(jì)的快速發(fā)展和現(xiàn)代物流理念的逐漸普及,物流產(chǎn)業(yè)發(fā)展迅速,已經(jīng)作為國(guó)民經(jīng)濟(jì)中的一個(gè)新興的產(chǎn)業(yè)部門,成為21世紀(jì)我國(guó)的主要支柱產(chǎn)業(yè)和國(guó)民經(jīng)濟(jì)新的增長(zhǎng)點(diǎn)。據(jù)文獻(xiàn)[1]顯示,社會(huì)物流總額(指一定時(shí)期內(nèi)實(shí)現(xiàn)社會(huì)物流的全部物品的總價(jià)值,在一定意義上也就是采購(gòu)貨物的總價(jià)值)從2000年開始進(jìn)入快速增長(zhǎng)期,2000—2006年,全國(guó)社會(huì)物流總額由17.1萬(wàn)億元人民幣上升至59.7萬(wàn)億元人民幣,7年間增長(zhǎng)2.5倍,年均增幅19.6%,大大高于同期10.7%的GDP年均增長(zhǎng)率。隨著物流產(chǎn)業(yè)的發(fā)展,對(duì)物流信息化提出了更高、更新的要求。由于物流行業(yè)的復(fù)雜性、動(dòng)態(tài)性和分散性,以及管理模式的多變性,當(dāng)前物流企業(yè)的信息化水平還難以達(dá)到企業(yè)的需求,這直接影響了物流中心與用戶的溝通和協(xié)作,阻礙了物流服務(wù)質(zhì)量的提高。就整體來(lái)看,國(guó)內(nèi)的物流信息化狀況依然存在很多問題,還不能達(dá)到國(guó)際化的要求,從而制約了我國(guó)物流產(chǎn)業(yè)的發(fā)展。面對(duì)這種現(xiàn)狀,迫切需要針對(duì)物流信息化存在的問題,結(jié)合現(xiàn)代物流的發(fā)展趨勢(shì)和發(fā)展要求,分析物流產(chǎn)業(yè)對(duì)信息系統(tǒng)的具體要求,研究適合中國(guó)國(guó)情的物流信息化關(guān)鍵性技術(shù)。
行業(yè)信息化知識(shí)庫(kù),是對(duì)行業(yè)核心應(yīng)用軟件起支撐作用的行業(yè)信息化經(jīng)驗(yàn)積累的集合,也可以說(shuō)是行業(yè)經(jīng)驗(yàn)的沉淀;是行業(yè)信息化建設(shè)的關(guān)鍵知識(shí)、規(guī)律及訣竅等知識(shí)的匯聚;是知識(shí)復(fù)用和軟件開發(fā)的基礎(chǔ)。馬希文教授曾指出“軟件是人類知識(shí)的濃縮和結(jié)晶”, 知識(shí)開發(fā)將從軟件開發(fā)中分離出來(lái),知識(shí)模塊將從軟件平臺(tái)中分離出來(lái)。陸汝鈐院士也曾在2004年智能科學(xué)技術(shù)基礎(chǔ)理論重大問題研討會(huì)上提出:“知識(shí)產(chǎn)業(yè)要從軟件產(chǎn)業(yè)中分離出來(lái),我們將從軟件復(fù)用走向知識(shí)復(fù)用……”因此,行業(yè)應(yīng)用知識(shí)資源的開發(fā)利用水平很大程度上代表了行業(yè)信息化建設(shè)的成功與否,以及在行業(yè)信息化建設(shè)中所占有的舉足輕重的地位。在行業(yè)信息化中,無(wú)論是技術(shù)、管理,還是數(shù)據(jù),沉淀下來(lái)都是知識(shí)資源,尤其是以行業(yè)應(yīng)用知識(shí)體現(xiàn)的行業(yè)標(biāo)準(zhǔn)、行業(yè)模型、行業(yè)構(gòu)件,更是寶貴的知識(shí)資源。充分開發(fā)利用行業(yè)應(yīng)用知識(shí)資源,構(gòu)建先進(jìn)的行業(yè)信息化知識(shí)庫(kù),對(duì)分布在物流行業(yè)中的零散知識(shí)進(jìn)行有效管理,挖掘蘊(yùn)藏在行業(yè)中的寶貴的知識(shí)財(cái)富,并在物流行業(yè)中進(jìn)行充分的復(fù)用,是大勢(shì)所趨。
目前很多學(xué)者建立了各種不同的知識(shí)庫(kù)系統(tǒng)[2~5],大多作為專家系統(tǒng)的一部分。但是物流行業(yè)的知識(shí)庫(kù)比較少,且只有少量的國(guó)外研究者將知識(shí)庫(kù)應(yīng)用于物流中的某些環(huán)節(jié),如文獻(xiàn)[6]給出了一個(gè)利用知識(shí)庫(kù)制定物流戰(zhàn)略規(guī)劃的框架;文獻(xiàn)[7]基于知識(shí)庫(kù)實(shí)現(xiàn)了一個(gè)物料自動(dòng)編號(hào)的物流信息系統(tǒng);文獻(xiàn)[8]通過(guò)EDI和工作流為美國(guó)國(guó)防部提供了一個(gè)軍事物流(后勤)解決方案。但是這些系統(tǒng)難以實(shí)現(xiàn)知識(shí)的共享和交換。這種情況造成了用大量精力建立起來(lái)的基于領(lǐng)域知識(shí)的系統(tǒng)應(yīng)用面狹窄,不能充分發(fā)揮效率。因此設(shè)計(jì)良好的共享重用體系不僅可以減少知識(shí)庫(kù)的冗余,保證知識(shí)庫(kù)系統(tǒng)的簡(jiǎn)潔性,而且還可以提高知識(shí)系統(tǒng)的性能。
1 本體與知識(shí)庫(kù)
知識(shí)表示是研究用機(jī)器表示知識(shí)的可行性、有效性的一般方法;是一種數(shù)據(jù)結(jié)構(gòu)與控制結(jié)構(gòu)的統(tǒng)一體,既考慮知識(shí)的存儲(chǔ)又考慮知識(shí)的使用。知識(shí)表示可看成是一組描述事物的約定,即把人類知識(shí)表示成機(jī)器能處理的數(shù)據(jù)結(jié)構(gòu)。知識(shí)表示方法通常可以分為基于符號(hào)的表示方法和基于連接機(jī)制的表示方法。前者主要是面向邏輯知識(shí)的表示,如一階謂詞邏輯表示法、產(chǎn)生式表示法、框架表示法以及腳本表示法等;后者則主要是面向形象知識(shí)的表達(dá),如語(yǔ)義網(wǎng)絡(luò)表示法、過(guò)程表示法、Petri網(wǎng)表示法以及面向?qū)ο蟮谋硎痉ǖ取T趯?shí)際的知識(shí)表示過(guò)程中,傳統(tǒng)知識(shí)表示方法在知識(shí)表示、傳遞和共享過(guò)程中存在先天性的缺陷。其一方面,所表達(dá)的知識(shí)無(wú)法保證在傳遞和共享過(guò)程中知識(shí)理解的惟一性與無(wú)二義性;另一方面,在大量的原子性知識(shí)的環(huán)境中對(duì)復(fù)雜知識(shí)的表達(dá)與推理可能會(huì)產(chǎn)生組合爆炸。為了解決上述知識(shí)表示方法中存在的問題,在知識(shí)工程領(lǐng)域需要引入本體的概念[9]。
本體(ontology)是一個(gè)哲學(xué)概念,它是“共享概念化的形式的、明確的規(guī)范”[10]和“某些方面概念化的明確解釋或表示”[11]。
從知識(shí)表示角度考慮,本體和知識(shí)庫(kù)有類似之處,都是對(duì)一個(gè)具體或是抽象領(lǐng)域中包含的知識(shí)的定義、表示和組織。根據(jù)Gloria定義[12]知識(shí)庫(kù)是知識(shí)系統(tǒng)的知識(shí)模塊,它包含特定領(lǐng)域抽象或特定的知識(shí),這些知識(shí)以機(jī)器可讀的格式表達(dá)。在本體概念被提出來(lái)后,理想的領(lǐng)域知識(shí)庫(kù)是應(yīng)該建立在領(lǐng)域本體的基礎(chǔ)之上,并根據(jù)領(lǐng)域本體中的全部或部分概念生成系統(tǒng)所需的知識(shí)庫(kù)。而且本體為人們描述目標(biāo)世界提供了一組通用詞匯,而這種通用的詞匯正是實(shí)現(xiàn)知識(shí)系統(tǒng)化的基礎(chǔ)。通用詞匯和知識(shí)的系統(tǒng)化有利于實(shí)現(xiàn)知識(shí)的標(biāo)準(zhǔn)化。傳統(tǒng)的知識(shí)管理方法往往只是從語(yǔ)法上對(duì)知識(shí)進(jìn)行描述,并不對(duì)其意義進(jìn)行描述,常采用基于關(guān)鍵字的檢索方法(字符匹配),查全率和查準(zhǔn)率都較低。物流領(lǐng)域本體提供了領(lǐng)域相關(guān)的概念及其關(guān)系描述,因此可以對(duì)具體知識(shí)進(jìn)行標(biāo)注,形成含有豐富語(yǔ)義信息的知識(shí)庫(kù),進(jìn)而可以利用這些語(yǔ)義信息進(jìn)行檢索,查全率和查準(zhǔn)率都較高。此外由于基于本體的知識(shí)管理具有語(yǔ)義層、自動(dòng)化、支持推理等優(yōu)點(diǎn),不僅可以清晰地描述領(lǐng)域知識(shí)庫(kù)中的概念及其關(guān)系,還可以實(shí)現(xiàn)領(lǐng)域知識(shí)的共享和重用,十分有利于領(lǐng)域知識(shí)庫(kù)的管理和維護(hù),大大深化了知識(shí)管理的內(nèi)涵,促進(jìn)知識(shí)的共享和復(fù)用。
國(guó)內(nèi)外已有許多研究者將本體引入知識(shí)庫(kù)中,如文獻(xiàn)[13]從半結(jié)構(gòu)化的數(shù)據(jù)中采用語(yǔ)義模式創(chuàng)建疾病知識(shí)庫(kù);文獻(xiàn)[14]基于本體構(gòu)建了醫(yī)學(xué)知識(shí)庫(kù);文獻(xiàn)[15]基于ontology探討了領(lǐng)域知識(shí)庫(kù)構(gòu)建的分層模型,并將構(gòu)建的知識(shí)庫(kù)應(yīng)用于采用C++和ASP實(shí)現(xiàn)的基于Web的學(xué)習(xí)支持系統(tǒng)中;文獻(xiàn)[16]結(jié)合中國(guó)的法律法規(guī)給出了一個(gè)法律領(lǐng)域的本體模型DOLegal,介紹了法律知識(shí)庫(kù)的設(shè)計(jì)思路及架構(gòu)。
上述這些應(yīng)用領(lǐng)域相對(duì)而言問題比較單一,知識(shí)的變化較慢。但像物流這樣包含采購(gòu)、檢測(cè)、包裝、運(yùn)輸、倉(cāng)儲(chǔ)、配送等眾多環(huán)節(jié),包含的知識(shí)跨越了多個(gè)領(lǐng)域,而且錯(cuò)綜復(fù)雜,隨時(shí)間變化速度較快的行業(yè)應(yīng)用卻非常少見。
2 SOA與Web服務(wù)
伴隨著企業(yè)需求的不斷變化,一種被譽(yù)為下一代Web服務(wù)的技術(shù)架構(gòu),由于它是以實(shí)現(xiàn)服務(wù)資源的反復(fù)重用、服務(wù)資源之間的通信、協(xié)調(diào),從而消除服務(wù)資源的多樣性、層次性、復(fù)雜性帶來(lái)的困難為目標(biāo),再一次引起業(yè)內(nèi)關(guān)注,這就是面向服務(wù)的架構(gòu)(service oriented architecture, SOA)。它是一種完全低耦合的分布應(yīng)用集成方法[17],將成為占有絕對(duì)優(yōu)勢(shì)的軟件工程實(shí)踐方法。SOA中主要有三種角色(圖1):a)服務(wù)使用者。它是一個(gè)應(yīng)用程序、一個(gè)軟件模塊或需要一個(gè)服務(wù)的另一個(gè)服務(wù)。它發(fā)起對(duì)注冊(cè)中心的服務(wù)的查詢,通過(guò)傳輸綁定服務(wù),并執(zhí)行服務(wù)功能,服務(wù)使用者根據(jù)接口契約來(lái)執(zhí)行服務(wù)。b)服務(wù)提供者。它是一個(gè)可通過(guò)網(wǎng)絡(luò)尋址的實(shí)體,接收和執(zhí)行來(lái)自使用者的請(qǐng)求,并將自己的服務(wù)和接口契約發(fā)布到服務(wù)注冊(cè)中心,以便服務(wù)使用者可以發(fā)現(xiàn)和訪問該服務(wù)。 c)服務(wù)注冊(cè)中心。它是服務(wù)發(fā)現(xiàn)的支持者,包含一個(gè)可用服務(wù)的存儲(chǔ)庫(kù),并允許感興趣的服務(wù)使用者查找服務(wù)提供者接口。
SOA是一種新的分布應(yīng)用集成示范。Web服務(wù)是SOA的一個(gè)實(shí)例,基本的Web服務(wù)規(guī)范包括Web服務(wù)描述語(yǔ)言(WSDL)、簡(jiǎn)單對(duì)象訪問協(xié)議(SOAP)、通用描述、發(fā)現(xiàn)與集成(UDDI)、Web服務(wù)安全(WSSecurity)、Web服務(wù)事務(wù)(WS Coordination、WS AtomicTransaction) 等規(guī)范。Web服務(wù)體系使用WSDL描述服務(wù),使用UDDI來(lái)發(fā)布和查找服務(wù),使用SOAP協(xié)議來(lái)執(zhí)行服務(wù)調(diào)用[18,19]。WSDL就是描述XML Web服務(wù)的標(biāo)準(zhǔn)XML格式,由Ariba、Intel、IBM和微軟等開發(fā)商提出。它用一種與具體語(yǔ)言無(wú)關(guān)的以抽象方式定義了給定Web服務(wù)收發(fā)的有關(guān)操作和消息。
Web服務(wù)的規(guī)范的標(biāo)準(zhǔn)化和松耦合的特性使得我們可以把物流行業(yè)知識(shí)庫(kù)包裝成一個(gè)用Web服務(wù)來(lái)實(shí)現(xiàn)的SOA構(gòu)件,這樣知識(shí)庫(kù)不僅重用性好而且可維護(hù)性大大提高。
3 基于本體的物流行業(yè)知識(shí)庫(kù)
知識(shí)庫(kù)的構(gòu)建,是一個(gè)耗時(shí)長(zhǎng)、代價(jià)高的工作。首先需要建立一套科學(xué)的基于物流行業(yè)知識(shí)的可擴(kuò)展資源分類方法,對(duì)成千上萬(wàn)的異構(gòu)知識(shí)源進(jìn)行梳理;然后就是研究這種大型知識(shí)庫(kù)的知識(shí)表示和推理,以及這些知識(shí)如何在物流行業(yè)的眾多企業(yè)中得到廣泛的復(fù)用。
如圖2所示,基于本體的物流行業(yè)信息化知識(shí)庫(kù)體系結(jié)構(gòu)采用分層模式,自底向上分別為三層:a)行業(yè)知識(shí)資源層,在該層根據(jù)行業(yè)的實(shí)際情況,將行業(yè)知識(shí)資源分為不同的類型。b)知識(shí)庫(kù)層(第二層)。在該層總體上采用Web服務(wù)標(biāo)準(zhǔn),將知識(shí)庫(kù)中的經(jīng)過(guò)語(yǔ)義標(biāo)注的知識(shí)庫(kù)包裝成一個(gè)個(gè)Web服務(wù),每個(gè)Web服務(wù)可以作為一個(gè)獨(dú)立的整體被復(fù)用,從而方便行業(yè)的各種不同層次的應(yīng)用需求。c)應(yīng)用層(第三層)。該層主要是為不同的使用者提供API、Web服務(wù)和控制接口等提供各種各樣的應(yīng)用接口,方便不同的用戶查詢,從而更好地為不同的使用者服務(wù)。
1)行業(yè)知識(shí)資源梳理 物流行業(yè)隱藏著大量豐富的知識(shí),不能得到很好的應(yīng)用,行業(yè)知識(shí)資源可以分為物流行業(yè)報(bào)告、物流行業(yè)法律法規(guī)、物流行業(yè)標(biāo)準(zhǔn)規(guī)范、物流行業(yè)標(biāo)桿數(shù)據(jù)、物流行業(yè)業(yè)務(wù)規(guī)則、物流行業(yè)解決方案、物流行業(yè)業(yè)務(wù)模型、物流行業(yè)數(shù)據(jù)模型、物流行業(yè)領(lǐng)域構(gòu)件和物流行業(yè)數(shù)據(jù)庫(kù)、物流行業(yè)其他相關(guān)文檔等。其中物流行業(yè)報(bào)告又包含數(shù)以百計(jì)的像物流行業(yè)研究報(bào)告、物流行業(yè)分析報(bào)告、物流行業(yè)年度報(bào)告、物流行業(yè)發(fā)展趨勢(shì)、物流行業(yè)全景圖和物流行業(yè)規(guī)劃等。物流行業(yè)又包括上百個(gè)像海關(guān)通關(guān)類、進(jìn)出口類和運(yùn)輸類等類型的法律法規(guī),更是有數(shù)以百計(jì)的行業(yè)標(biāo)準(zhǔn)規(guī)范、物流行業(yè)標(biāo)桿數(shù)據(jù),數(shù)以千計(jì)的物流行業(yè)業(yè)務(wù)模型和物流行業(yè)數(shù)據(jù)模型、物流行業(yè)領(lǐng)域構(gòu)件等,以及數(shù)以萬(wàn)計(jì)的物流行業(yè)解決方案、物流行業(yè)其他相關(guān)文檔。這些成千上萬(wàn)的知識(shí)源異構(gòu)地分布在行業(yè)中,因此要建立完善的分類系統(tǒng)對(duì)行業(yè)知識(shí)資源進(jìn)行有效的梳理,通過(guò)像文本摘要工具和知識(shí)、規(guī)則抽取方法等,將這些知識(shí)以結(jié)構(gòu)化和半結(jié)構(gòu)化的形式存放到相應(yīng)的知識(shí)庫(kù)中,如文檔庫(kù)、規(guī)則庫(kù)、解決方案庫(kù)、模型庫(kù)和構(gòu)件庫(kù)等。
2)文本摘要 該摘要工具能用來(lái)對(duì)海量的文檔進(jìn)行摘要處理,從而為用戶產(chǎn)生物流相關(guān)文檔源的精簡(jiǎn)表示,使用戶可以方便省時(shí)地了解文本源的中心意思,從而快速地獲得有價(jià)值的信息。如圖3所示是網(wǎng)上的一篇與物流相關(guān)的文檔,經(jīng)過(guò)該工具的自動(dòng)摘要生成如圖4所示的能表達(dá)該文檔的縮略版,并最終能將該文檔的縮略版轉(zhuǎn)換為XML文檔,存儲(chǔ)在相應(yīng)的庫(kù)中(如文檔庫(kù))。
3)知識(shí)、規(guī)則抽取 OWL(Web ontology language)是一種本體語(yǔ)言,可以用于語(yǔ)義知識(shí)的表示。其主要作用是將領(lǐng)域內(nèi)的概念分類,通過(guò)約束、布爾組合等來(lái)描述概念自身的語(yǔ)義含義,利用屬性來(lái)表達(dá)概念與概念之間復(fù)雜的依賴。所以通過(guò)本體可以得到一個(gè)類的實(shí)例所具有的屬性,以及類與類之間的關(guān)系。但OWL所擁有的描述能力主要來(lái)自于以類別為基礎(chǔ)的關(guān)聯(lián)性的推理,若知識(shí)不是用類別的方式表達(dá)時(shí),OWL便難以表示。例如:If…Then…的關(guān)系是很普通的邏輯判斷,但是OWL描述以規(guī)則為基礎(chǔ)的知識(shí)的能力并不足。在物流領(lǐng)域中,有很多物流規(guī)則需要用類似的If…Then…來(lái)表達(dá),所以有必要在OWL概念知識(shí)庫(kù)基礎(chǔ)上制定一個(gè)規(guī)則庫(kù),從而更好地表達(dá)物流領(lǐng)域知識(shí)。
如在配貨過(guò)程中,要遵循的配貨規(guī)則為:易產(chǎn)生水分的貨物不能和怕水、怕潮的貨物一起運(yùn)輸;易燃燒的貨物和易爆炸的貨物不能一起運(yùn)輸;有毒、有放射性、有腐蝕性等的危險(xiǎn)品要分別單獨(dú)運(yùn)輸,不能和其他貨物一起運(yùn)輸。當(dāng)把貨物都配好之后,便可以為每批貨物找合適的運(yùn)輸工具進(jìn)行運(yùn)輸。需要遵循的規(guī)則為:怕潮、怕水的貨物要用篷車運(yùn)輸;液態(tài)貨物要用油罐車或管道運(yùn)輸;危險(xiǎn)品要用專用車輛運(yùn)輸?shù)纫?guī)則。
以上規(guī)則語(yǔ)義表達(dá)明確,便于理解,并且支持將規(guī)則放在規(guī)則庫(kù)中供程序調(diào)用,這就避免了在業(yè)務(wù)規(guī)則發(fā)生變化時(shí)更改源程序。以下是規(guī)則庫(kù)中描述上述規(guī)則的片段:
# rule file
@prefix LO:〈http://www.owlontologies.com/logistics.owl〉.
[hygroscopicRule: (?x LO:isHygroscopic ?b) (?y LO:isWatery ?b)(?b rdf:type LO:True)
→(?x LO:cannotTransportWith ?y)]
[explosiveRule:(?x LO:isExplosive ?b)(?y LO:isFlammable ?b)(?b rdf:type LO:True)
→(?x LO:cannotTransportWith ?y)]
[poisonousRule: (?x rdf:type LO: PoisonousCargo)(?y isPoisonous ?b)(?b rdf:type LO:False)
→(?x LO:cannotTransportWith ?y)]
[dangerousTransportRule: (?x rdf:type LO:DangerousCargo)
→(?x LO:isTranportedBy LO:SpecialVehicle]
規(guī)則庫(kù)獨(dú)立于應(yīng)用程序,所以規(guī)則可以動(dòng)態(tài)地增加、刪除、修改,而不會(huì)對(duì)應(yīng)用程序產(chǎn)生影響。
4)領(lǐng)域本體庫(kù)的構(gòu)建 領(lǐng)域本體的開發(fā)使用的是Protégé 3.1,利用從各個(gè)庫(kù)中的結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)完成本體的建模,構(gòu)建物流領(lǐng)域的本體庫(kù),并采用德國(guó)漢堡大學(xué)計(jì)算機(jī)學(xué)科學(xué)系所開發(fā)的描述邏輯推理機(jī)RACER對(duì)本體進(jìn)行推理。
圖5所示是物流本體模型的整體結(jié)構(gòu),依據(jù)該模型目前實(shí)現(xiàn)的頂層本體及其派生的領(lǐng)域本體模型中有171個(gè)類和300個(gè)屬性,是對(duì)物流領(lǐng)域建立的一個(gè)核心的本體模型,涉及到貨物、倉(cāng)庫(kù)、運(yùn)輸工具、物流模式、公司等幾個(gè)物流子領(lǐng)域。
5)本體整合 對(duì)于物流行業(yè)這樣一個(gè)較大的領(lǐng)域來(lái)說(shuō),建立一個(gè)大而全的本體幾乎是不可能,不同的人和組織可能根據(jù)自己的需要構(gòu)建不同的物流領(lǐng)域本體。由于不同的人們和組織可能具有不同的世界觀,這些不同的世界觀甚至有可能是沖突的,這就必然導(dǎo)致本體具有分布和異構(gòu)的屬性,并且本體本身并不能協(xié)調(diào)這種異構(gòu)性,這種異構(gòu)性為相同或不同領(lǐng)域的知識(shí)系統(tǒng)之間的互操作性帶來(lái)了嚴(yán)重的問題。本體整合是解決本體自身語(yǔ)義異構(gòu)性的一種重要手段。圖6所示的是基于Jena開發(fā)的本體整合工具OntMerge,它采用實(shí)體內(nèi)外部特征分析相結(jié)合的方式來(lái)計(jì)算實(shí)體間的相似度,并以此為依據(jù)進(jìn)行本體整合。針對(duì)實(shí)體內(nèi)部特征中缺少語(yǔ)義理解的問題,在使用字符串比較方法的基礎(chǔ)上引入字典對(duì)概念的語(yǔ)義進(jìn)行識(shí)別。同時(shí),該工具綜合語(yǔ)法和語(yǔ)義兩個(gè)方面得到的結(jié)果作為內(nèi)部特征相似度,并通過(guò)字典技術(shù)克服本體層中同義詞、近義詞的問題;其次,針對(duì)實(shí)體的外部特征,采用啟發(fā)式規(guī)則計(jì)算本體中實(shí)體間的結(jié)構(gòu)相似度,進(jìn)而可以判斷兩個(gè)實(shí)體在本體中的地位是否相似。通過(guò)綜合使用這兩種方式可以有效地識(shí)別出待整合本體中相似的部分,提高了本體整合的準(zhǔn)確性。
6)知識(shí)的語(yǔ)義標(biāo)注 語(yǔ)義標(biāo)注就是利用領(lǐng)域本體對(duì)原始數(shù)據(jù)作標(biāo)記,使其具有語(yǔ)義信息,是使機(jī)器理解所處理數(shù)據(jù)的一種手段。語(yǔ)義標(biāo)注的過(guò)程就是創(chuàng)建機(jī)器可理解的知識(shí)的過(guò)程。知識(shí)提供了領(lǐng)域(如物流領(lǐng)域)內(nèi)部不同主體(人、機(jī)器、軟件系統(tǒng)等)之間進(jìn)行交流(對(duì)話、互操作、共享等)的一種語(yǔ)義基礎(chǔ)。在語(yǔ)義Web中,這種知識(shí)主要是面向機(jī)器理解的,以本體形式表達(dá)的。物流行業(yè)的知識(shí)庫(kù)大多是非結(jié)構(gòu)化和半結(jié)構(gòu)化的,非常不適用于查詢與復(fù)用。本文利用本體庫(kù)通過(guò)語(yǔ)義標(biāo)注工具[20]對(duì)物流行業(yè)成千上萬(wàn)的知識(shí)源進(jìn)行語(yǔ)義標(biāo)注,就是利用本體對(duì)那些結(jié)構(gòu)化和非結(jié)構(gòu)化的知識(shí)進(jìn)行本體實(shí)例化,從而為這些知識(shí)添加了語(yǔ)義信息,在一定程度上讓機(jī)器能理解知識(shí),為知識(shí)庫(kù)的復(fù)用創(chuàng)造更有利的條件。
根據(jù)不同的用途進(jìn)行語(yǔ)義標(biāo)注,需要明確要標(biāo)注的對(duì)象。從本體的角度來(lái)說(shuō),就是明確將本體中的哪些成分與現(xiàn)實(shí)世界建立聯(lián)系,即將哪些知識(shí)標(biāo)注為本體的實(shí)例,因此會(huì)涉及標(biāo)注的粒度問題。本體標(biāo)注的粒度可根據(jù)需要由粗到細(xì)分為:a)標(biāo)注概念,即建立概念和個(gè)體間的聯(lián)系,一個(gè)個(gè)體是本體中某個(gè)概念的實(shí)例,那么它就會(huì)繼承該概念的屬性。b)標(biāo)注屬性,即給出實(shí)例對(duì)應(yīng)的屬性值,這樣有利于進(jìn)行推理和查詢。c)標(biāo)注關(guān)系,即指出實(shí)例間的關(guān)系,本體建模時(shí)僅會(huì)指出關(guān)系的定義域和值域,在進(jìn)行關(guān)系標(biāo)注時(shí)需要根據(jù)相應(yīng)的規(guī)則和條件實(shí)例化這種關(guān)系。d)標(biāo)注實(shí)例,如一個(gè)實(shí)例可能會(huì)出現(xiàn)有不同的URI,這就需要通過(guò)語(yǔ)義標(biāo)注來(lái)標(biāo)志出不同的URI。
7)應(yīng)用接口 該層主要是為不同的使用者提供API、Web服務(wù)和控制接口等提供各種各樣的應(yīng)用接口,主要是采用WSDL將相應(yīng)的經(jīng)過(guò)標(biāo)注的知識(shí)庫(kù)包裝成Web service, 并將相應(yīng)的知識(shí)庫(kù)平臺(tái)的組件發(fā)布為可供調(diào)用的API;同時(shí)提供控制接口,為用戶提供個(gè)性化的服務(wù),方便不同的用戶查詢和應(yīng)用,從而更好地為不同的使用者服務(wù)。
4 結(jié)束語(yǔ)
物流行業(yè)知識(shí)庫(kù)可以大大提高物流知識(shí)的準(zhǔn)確程度和使用效率;盡可能地復(fù)用知識(shí),有利于行業(yè)信息化的推進(jìn)。而ontology形式表達(dá)了領(lǐng)域知識(shí)的基本概念、屬性、處理方法和內(nèi)在關(guān)系,在知識(shí)表示和推理方面很有優(yōu)勢(shì),是構(gòu)建知識(shí)庫(kù)的理想技術(shù)。本文在分析物流信息化的需求和現(xiàn)狀之后,指出了知識(shí)庫(kù)在物流行業(yè)中的作用和地位;在研究了知識(shí)庫(kù)與物流知識(shí)庫(kù)相關(guān)理論和技術(shù)的基礎(chǔ)上,建立了一種結(jié)合本體和SOA技術(shù)的物流知識(shí)庫(kù)模型,并實(shí)現(xiàn)了系統(tǒng)的關(guān)鍵功能。但是目前所做的工作還不徹底,有許多問題值得進(jìn)一步研究,進(jìn)一步對(duì)知識(shí)庫(kù)系統(tǒng)的完備性進(jìn)行驗(yàn)證,系統(tǒng)的細(xì)節(jié)還需進(jìn)一步的研究,也需要在實(shí)際應(yīng)用中得到更好的完善。
參考文獻(xiàn):
[1]國(guó)家發(fā)展改革委員會(huì),國(guó)家統(tǒng)計(jì)局,中國(guó)物流與采購(gòu)聯(lián)合會(huì).2006年全國(guó)物流運(yùn)行情況通報(bào)[EB/OL].(2007-0510).http://www.ndrc.gov.cn/zjgx/t20070315_121530.htm.
[2]WHITE C C III.A survey on the integration of decision analysis and expert systems for decision support[J].IEEE Trans on Systems, Man and Cybernetics,1990,20(2):358-364.
[3]RAPHAEL M J,DELOACH S A.A knowledge base for knowledgebased multiagent system construction[C]//Proc of IEEE National Aerospace and Electronics Conference.Dayton:IEEE,2000:383-390.
[4]GUO J,LUQI.A survey of software reuse repositories[C]//Proc of the 7th IEEE International Conference and Workshop on the Engineering of Computer Based Systems.Edinburgh: IEEE,2000:92100.
[5]DOCTOR G,RAMACHANDRAN S.enabling knowledge sharing with an institutional repository[C]// Proc of the 7th IEEE International Conference on Advanced Learning Technologies.Southampton:IEEE,2007:432-433.
[6]QI Xu.A framework for logistics strategy planning based on knowledge syntheses[C]//Proc of International Conference on Computational Intelligence and Security.Guangzhou:IEEE,2006:933-936.
[7]HSU Pangyen,MA Shaoping,SUN Fuchun,et al.I(xiàn)mplementation of a knowledgebased system for automatic part numbering in a logistics information system[C]//Proc of IEEE International Conference on Service Operations and Logistics, and Informatics.Shanghai:IEEE,2006:10241029.
[8]GIANNOTTI E,NEGRON R,ANTZOULIS T.An integrated information system approach for performance based logistics[C]//Proc of IEEE Systems Readiness Technology Conference. Anaheim:IEEE,2006:336-340.
[9]袁磊,張浩,陳靜,等.基于本體化知識(shí)模型的知識(shí)庫(kù)構(gòu)建模式研究[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(30):65-68,104.
[10]Description of OIL[EB/OL].[200711-22].http://www.ontoknowledge.org/oil/.
[11]OntoEdit[EB/OL].[200711-22].http://www.ontoknowledge.org/tools/ontoedit.shtml.[12]ZIGA G L.Ontology:Its transformation from philosophy to information systems[C]//Proc of the 2nd International Conference on Formal Ontology in Information Systems.New York:ACM Press,2000:187197
[13]LIU Xiaoli,WU Guoqing,YANG Min.Building knowledge base from semistructured data[C]//Proc of International Conference on Machine Learning and Cybernetics. Hong Kong:IEEE,2007:839-843.
[14]XU Binfeng,LUO Xiaogang,PENG Chenglin,et al.Based on ontology:construction and application of medical knowledge base[C]//Proc of IEEE/ICME International Conference on Complex Medical Engineering.Beijing:IEEE,2007:15861589.
[15]范黎林,王曉東,屈喜龍.基于Ontology知識(shí)庫(kù)系統(tǒng)建模[J].計(jì)算機(jī)應(yīng)用研究,2006,23(5):134136.
[16]何慶,湯庸,黃永釗.基于本體的法律知識(shí)庫(kù)的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué),2007,34(2):175177.
[17]NEWCOMER E,LOMOW G.Understanding SOA with Web services[M].[S.l.]:AddisonWesley Professional,2004.
[18]McINTOSH,ROGER L.Opensource tools for distributed device control within a serviceoriented architecture[J].Journal of the Association for Laboratory Automation,2004,9(6):404-410.
[19]KNIGHT,W.Security:builtin or boltedon to the SOA?[J].Infosecurity Today,2005,2(2):38-40.
[20]廖述梅.基于本體的語(yǔ)義標(biāo)注原型評(píng)述[J].計(jì)算機(jī)工程與科學(xué),2006,28(9):123125,128