歷子謙 劉寶
摘 要:提出了一種基于本體的相似度評估的方法和案例檢索以及一種基于本體的案例自適應模型,這使得CBR(Case-based Reasoning)系統的開發能夠在語義層次上進行相似性評估和案例自適應,從而得出結果。可以更好地反映用戶的真實需求;并可以從中獲得CBR所需的領域知識。本體獲取極大地減少了傳統CBR系統中知識獲取的瓶頸。最后,提出了一種基于本體的CBR系統模型框架,從軟件復用的角度提高了CBR系統的開發效率。
關鍵詞:本體;案例推理;語義相似性;案例適配;模型;
1、CBR與本體的結合
1)本體作為CBR系統詞匯
針對案例的詞匯,一種直接的表達方式是使用領域本體以一種面向對象的方式來表達它,即概念上對應的類和個體對應的對象,而關系對應于描述對象的屬性(可以分為數據類型屬性和對象屬性)。案例結構可以通過本體中的類來定義,例如destination目的地概念,可以將其視為一個類,并且該類的實例可以是北京或上海等。類似地,對于查詢詞匯,本體也可以用于定義和表達更豐富的查詢,以便用戶可以更好地表達他們的需求。在相似性評估中,本體可以在語義級別上填補查詢詞和案列詞之間的空白。
2)基于本體的案例檢索
在案例檢索中,相似性評估是非常重要的推理環節,用于評估查詢和檢索到的案例之間的相似性。使用本體知識時,概念層次結構及其在本體中的關系將對相似性評估產生有益的影響。類層次結構包括對象之間的相似性知識。在本文中,我們定義并使用基于本體的案例相似性度量函數。一般而言,兩個結構化案例的相似性可以分為全局和局部兩個層次。局部相似性是簡單屬性之間的相似性,而全局相似性是簡單屬性的加權平均值,也稱為平均相似性,可以通過以下公式計算:
averageSimilarity=∑i=1nlocalSimi(i)×weightaverageSimilarity=∑i=1nlocalSimi(i)×weight(i)/∑i=1nweight(i)(i)/∑i=1nweight(i)
其中:n為簡單屬性的個數;localSimi (i) 表示案例間第i個簡單屬性間的相似度 (0~1的某個值) ;weight (i) 表示第i個屬性的權重。
局部相似性度量使用了基于本體的概念相似性度量標準。基于本體的相似性度量從不同的角度可有多種方法, 本文定義了如下兩種:
deep_Simi (ci, cj)
=max (depth (commonSuper(ci,cj)))/maxCi∈CN(depth(Ci)) ?cosine_Simi (ci, cj) =|super (ci, C) ∩super
其中:CS為本體中的概念集;super (c, C) 表示概念c的超概念集;commonSuper (ci, cj) 表示兩個體ci、cj共同的超概念集;depth (c) 表示概念c的深度。
3)基于本體的案例適配
本文利用描述邏輯的推理機制定義了基于本體的模型和基于替代的適配方案。替代的定義如下:若依賴關系Depends On(i1,i2 )成立,當i1被另外一個值i1″代替時,為了使關系Depends On()仍然成立,必須找到i2的代替物i2″。因此需要在知識庫中聲明i2″與i1″的關系應與i2與i1的關系相似。
2基于本體的案例推理模型框架(MONCBR)
從頭開發CBR應用程序將是一項艱巨的任務。但是,如果我們可以重用以前開發的某些組件和推理方法,則開發效率將大大提高。從這個角度出發,在以上關于本體和CBR結合的討論的基礎上,本文提出了一個開發CBR應用程序的模型框架。由于該框架可以集成以前的開發結果,并為將來的開發提供通用的開發過程和接口,因此在兩個方面都很好地支持了軟件工程中軟件重用的想法。
下面分別介紹各層的功能及其實現。
2.1持久層
持久層是指案例的持久化的存儲位置,其可以是數據庫,文本文件,或是描述邏輯本體的持久存儲位置。可以根據知識類型同時選擇幾種方法。有許多方式來表達的情況下,如最一般的(屬性值),結構化表示,基于框架的表示,面向對象的表示和語義網絡方法。
2.2連接器
連接器是一種接口并且是接口層的主要組件。它負責訪問和檢索持久層案例,并以統一的方式將案例返回給CBR系統。根據案例持久存儲的三種主要方式(關系數據庫,本體庫,文本文件),下面將描述相應的訪問方法和技術實現:
2.2.1關系數據庫連接器
由于該框架基于Java技術,因此可以充分利用Java Bean和J2EE的最新核心技術Hibernate。關系數據庫的情況也可以用Java Bean表示。Java Bean是Java類。每個公共屬性都有其自己的get和set方法。它的修改和管理可以通過稱為Introspection的Java技術自動實現。
2.2.本體連接器
本體連接器用于訪問存儲在本體中的知識。用于訪問存儲在本體中的知識。Jena是基于Java語言的語義Web開發工具,提供用于處理Modal類的RDF圖的API。使用這些API,用戶可以選擇將RDF圖存儲在內存或持久性存儲(文件或數據庫)中。新版本的jena2支持基于RDFS和owl的語義推理,并提供了相應的API工具包,因此該層的實現主要基于Jena工具包。
2.2.3文本連接器
由于許多經驗都以文本形式存在(例如網頁),因此訪問文本案例非常重要。該層的實現首先使用信息提取方法來獲取文本信息,然后使用結構化的方式來表達案例。這樣,可以使用常見的CBR方法(例如最近鄰算法)進行推理,因此文本信息的提取是該層的關鍵。
2.3案例的內存組織
通過將連接器對象連接到特定的案例持久性層,將案例加載到內存中,然后需要一個數據結構來組織案例。好的數據結構將大大提高效率。針對具體的案例結構案例庫的組織可選用線性表、k-d樹等。
2.4邏輯推理層
該層次是CBR推理過程中相關算法的具體實現,主要是相似性算法和自適應算法。根據應用需求,我們可以實現其特定的算法,例如基于數據庫的傳統案例檢索算法和ID3決策樹k-d樹。該層還實現了基于本體的相似性評估方法和基于本體的模型替換方法。
3結語
基于案例的推理(CBR)是快速發展的人工智能中的一個子領域,基于本體的知識表示是語義推理的前提和基礎。CBR和本體技術的結合是CBR發展的趨勢。本文主要闡述了本體在案例檢索和案例自適應中的明顯優勢。在此基礎上,提出了一種基于本體的基于案例的推理模型框架MONCBR,并分析了各個模塊的實現方法。該框架具有通用框架的優點,并從軟件重用的角度提高了開發效率。
參考文獻:
[1]曹勇. 基于案例推理的地震應急本體案例庫構建及案例檢索研究[D].中國地質大學(北京),2018.
[2]吳文曉. 基于本體的突發事件網絡輿情案例推理研究[D].西南科技大學,2017.
[3]李蘇豪. 基于點云的建筑表面損傷三維重建與信息集成研究[D].東南大學,2017.
作者簡介:
歷子謙,性別:男,出生年(1995-),籍貫(山東省日照市),民族(漢),學歷(在讀研究生),研究方向(案例推理系統)。