(河海大學商學院,211100)
基于本體的防汛信息系統設計
祝 源
(河海大學商學院,211100)
近年來,伴隨著水利信息化的不斷推進,系統開發者和系統用戶之間溝通困難的問題開始涌現,嚴重阻礙了系統開發的進程。本文回顧了國外本體研究的進展,分析了國內基于本體的信息系統開發的實踐,通過使用本體能力問題幫助系統開發者獲取用戶需求,并研究了本體在數據庫中的存儲設計。
本體;信息系統;防汛
防汛工作往往由防汛指揮部牽頭,各個地方水利局或者水利站協同工作,這就牽涉到各地方防汛工作小組對于一些問題的共同理解。一方面,系統開發人員由于不是防汛專業人員,短時間內難以理解防汛業務使用的專用術語;另一方面,防汛人員由于對系統開發的過程、技術手段等缺乏了解,而且用戶可能并不確切知道自己的需求是什么,并將需求確切的表達出來,不知道該提供哪些資料幫助系統開發者了解系統需求。本體就是通過形式化地定義領域概念,使得不同的人能夠對這些概念和問題實現共享認識。現有的防汛信息系統在系統規劃之初就沒有考慮到這一問題,他們往往針對各個地區所特有的問題,各個地方水利單位自身的情況而進行單獨的需求分析,造成需求的重復獲取,不能有效地利用以往的開發經驗。因此通過構建一個防汛知識本體,生成能力問題庫,為未來的防汛信息系統的開發提供需求參考。
為了提高員工操作環境的安全性和提升企業在全球市場的競爭力,企業使用人工智能模擬(human simulation)對員工的工作環境進行仿真。然而,環境模型構建的需要大量的時間與精力投入,Seonhwa對基于本體的建模方法進行了驗證,節省了企業的建模成本。
當前的本體構建主要存在2種途徑:從基于數據庫的本體構建和自頂向下或自底向上的概念體系構建方法。Ra將兩者進行了結合,提出了一種混合構建方法(MOBM):首先基于數據庫構建本體核心,再通過概念體系法進行補充實現本體的構建,幫助企業更有效的進行知識表示。本體開發前期需要大量的準備工作,包括長時間的數據準備和結果解釋,昂貴的專家咨詢和共識建立過程。針對這一問題,d’Aquin提出對數據挖掘和本體工程的相互作用進行研究,實現一種半自動獲取數據資源的方式,進而實現知識獲取。
Adigun使用FOX方法構建了動態環境下的自適應協作構建了本體,實現了動態環境的知識共享。Nagata基于頂層本體Goi-Taikei,使用半自動方法構建了日本維基百科本體,產生了良好的分類系統。為了更好地回答用戶的提問,本體在信息檢索領域得到廣泛使用,然而隨著新概念以及概念關系不斷出現,有限的本體庫需要得到相應的更新。Mustapha提出了一個基于案例推理的本體學習框架,幫助本體庫進行更新。
盡管本體可以用于組織和系統之間的溝通,支持通用軟件系統的開發,但是使用本體進行知識建模的應用卻很少,原因在于每次開發的本體都是服務于某個特定的應用,不會考慮到本體的分享和再利用。各個研發團隊擁有自己的一套原則,他們遵循自己的一組開發原則開發本體,由于缺乏一個統一的本體開發的原則和開發方法,各開發團隊之間的無法進行有效的知識共享,已經開發出的本體不能被其他的本體開發項目重用。針對這一現狀,不同的研究者開始著手研究本體開發的方法論。另一方面Pinto等研究了本體融合的問題。一個學科是否成熟的標識在于是否存在廣泛接受的方法論,當前不同的研究小組使用各自的方法和流程開發本體,從這個角度講本體工程還處于發展階段。
當前,本體是由少部分專家或者研究人員開發,這和遠遠多于開發者的使用者形成對比,數量上的巨大差異產生一些問題:首先,本體使用者不能控制本體的發展;其次,本體使用者不能完全掌握一個概念的內涵。這些都是因為本體的開發和使用是分開的。
近年來隨著信息系統在各個行業的應用越來越廣,考慮到本體在信息組織和信息表示等方面的強大優勢,人們開始嘗試將本體和信息系統的開發進行結合。將信息系統和本體作為關鍵詞進行組合,對CNKI數據庫進行檢索,近7年來國內基于本體的信息系統構建與研究如表1所示,按照研究人員、年代、信息系統進行組織:

表1 基于本體的信息系統
基于本體的信息系統研究前提是所應用的領域信息化程度較高,不僅有信息化的標準,信息系統的發展也達到一定的階段,因此基于本體的信息系統研究應該是立足于成熟的信息系統開發之上的。雖然不同行業的信息系統隨著領域知識的變化而存在差異,但是將本體引入信息系統的開發存在以下幾個目的:
(1)建模工具:由于本體具有的共享特性使得同一個應用領域內,不同的業務人員在開發系統時可以共享本體概念模型;基于本體的系統建立之后,各個子系統可以共享這個本體,實現數據和信息的共享。另一方面,由于本體對領域內概念的定義、概念之間的關系有明確的形式化的定義,遇到新的現象、實例都可以納入已有的本體知識結構中,極大方便了未來系統的升級和擴展。
(2)互操作性:大大小小的“信息孤島”阻礙了系統之間的互操作性,通過共享統一的本體模型,不同的系統之間的互操作性將會大大增強,從系統層面加強了企業各個部門的協作;另一方面,使用本體幫助各個部門理解彼此系統的結構,提供一個溝通的平臺。
(3)數據集成:基于本體的信息系統大多具有分布范圍廣的特點,并且已經建成的各地信息系統較為成熟,推倒重新設計系統代價太大,因此通過本體進行數據集成,從而實現對信息資源統一管理的目的。本體不僅是用于業內人員的協作,也用于企業對外信息的發布。
針對防汛知識的無序組織現象,本文初步研究了工情知識和雨水情知識,構建相應的知識本體。借鑒了METHONTOLOGY和TOVE,設計了防汛知識本體構建流程,如圖1所示:

圖1 本體構建流程
3.1防汛本體構建目標和范圍確定
防汛知識往往和水利知識組織在一起,作為水利知識的一個分支而存在。當然防汛知識主要以專業書籍、行業文件、省市的水利網站、防汛工作手冊等形式存在。構建防汛知識的本體需要盡可能多地收集防汛資料,搭建一個領域核心知識體系,確定本體的相關領域范圍,從而使防汛領域本體的構建有明確的路線。
3.2防汛核心概念提取與分析
水利領域相關的概念非常多,但我們在描述核心知識體系時不需要將所有概念一一列舉,而是篩選出和防汛密切相關的概念,作為防汛本體中的核心概念。
3.3頂層本體構建
防汛知識本體構建過程中的選詞、概念之間的屬性關系確定及最終本體邏輯體系的形成都需要征詢防汛領域專家的意見。在本體初步邏輯體系形成過程中,邀請領域的專家一直協同工作。在屬性關系確定環節,邀請參與防汛工作的一線人員和水利專家參與討論,對制定的屬性關系進行評判,如果同意則進行下一步驟,不同意則針對主要的不足之處重新進行選詞,對于專家之間的不同意見進行溝通和協商,形成最后的統一意見,最終形成本體邏輯體系。
本體的存儲主要分為兩種途徑:文件存儲和數據庫存儲。數據庫存儲主要分為XML數據庫和關系數據庫。基于文件的本體存儲隨著本體規模的不斷擴大,后期維護成本越來越高,查詢效率也會降低;相比較基于文件的存儲方式,基于數據庫的本體存儲查詢效率高,并且有許多數據庫產品如Oracle、MYSQL、SQLSERVER等可供選擇。由于關系數據庫技術已經成熟,許多數據庫產品也已經投入商用,并且現有的防汛信息系統大多使用關系數據庫進行數據的管理,使用關系數據庫可以直接以知識查詢模塊的方式加入現有系統,因此本文選擇關系數據庫存儲防汛本體。
OWL本體之所較其他本體語言有更強的語義描述能力在于它有更多的描述概念與概念之間關系的機制。OWL本體元素主要包括概念、屬性和實例等,屬性分為對象屬性和數據屬性,通過對OWL語言和關系模式的比較分析,分別設計fClass、fInstance、fProperty三個表來存放本體中的概念、屬性和實例。OWL本體中概念之間的關系是通過對屬性的定義域和值域的設置來完成的,分別設計表定義域表fDomian和值域表fRange來存放本體中的屬性,其中Class為外鍵,與表fClass相聯系。概念之間有子類父類的關系,有等同關系,有不相交關系,分別設計表fSubClass 、fEquivalentClass、 fDisjointClass,都通過外鍵Class與fClass表相連。例如要想知道分洪區屬于防汛體系中的上層概念,可以在fSubClass表中檢索分洪區,得到它對應的上次概念是蓄滯洪區;另一方面,字段superclass的值為蓄滯洪區的所有記錄的class都是蓄滯洪區的子概念,可以得到蓄洪區、滯洪區等概念。本體存儲模式如下圖所示:

圖2 本體的關系存儲模式
由上圖可見,本體各個概念之間的關系在關系數據庫通過外鍵相聯系,本體如果發生變化只需要對各個關系表的記錄進行增加或刪減,而不需要修改數據模式,縮小了本體維護的代價。系統開發人員也可以依據上圖進行查詢語句的設計,開發基于本體的防汛知識系統。
傳統的信息系統的建模,概念的使用相對分散,各個地區,各個部門都有各自的系統建設標準,容易形成信息孤島。由于系統開發人員對防汛知識缺乏系統了解,系統需求獲取受到很大的限制。防汛本體的構建為專業系統開發人員和防汛工作人員架起了一座溝通的橋梁,開發的信息系統更能滿足防汛人員的需求;另一方面,基于本體的信息系統構建方法將本體建模引入到信息系統的建模過程中,為信息系統的建模提供了理論依據。本文在回顧國內外本體研究的基礎上對基于本體的信息系統開發過程中的需求獲取和本體的存儲進行了研究,下一步將進行系統的實施。
[1] Jeong S,Wegner D,Noh S.Validation of an ontologybased approach for enhancing human simulation in general assembly environments[J].Proceedings of the WCE,2010,3.
[2] Ra,Minyoung,et al."The Mixed Ontology Building Methodology Using Database Information." Proceedings of the International MultiConference of Engineers and Computer Scientists.Vol.1. 2012.
[3] d’Aquin,M.,G.Kronberger,and M.Suárez-Figueroa. "Combining data mining and ontology engineering to enrich ontologies and linked data." Workshop: Knowledge Discovery and Data Mining Meets Linked Open Data-Know@ LOD at Extended Semantic Web Conference,ESWC. 2012.
[4] Adigun,Adepeju A.,and Michael O.Kolawole. "Building Ontology for Adaptive Collaboration in a Dynamic Environment." International Journal of Computer Science 9 (2012).
[5] Malik,Sanjay Kumar,Nupur Prakash,and S.A.M. Rizvi."Developing an university ontology in education domain using protégé for semantic web." International Journal of Engineering Science and Technology 2.9 (2010):4673-4681.
[6] Jonquet,Clement,Mark A.Musen,and Nigam H.Shah. "Building a biomedical ontology recommender web service."Journal of biomedical semantics 1.suppl. 1 (2010):1.
[7] Nagata,Masaaki,Yumi Shibaki,and Kazuhide Yamamoto. "Using Goi-Taikei as an Upper Ontology to Build a Large-Scale Japanese Ontology from Wikipedia." 23rd International Conference on Computational Linguistics.2010.
Design of flood control information system based on Ontology
Zhu Yuan
(Business school of Hohai university,211100)
Currently,there is communication problems between the users and the system developers,which seriously hold back the development of flood systems.This paper analyzed the research and application of ontology,designed the management information system based on Ontology.Using competency questions to help system developer to acquire the users’needs,This paper make an attempt to store the Ontology in database systems.
ontology;information system;flood control