摘要:虛擬企業伙伴選擇首先必須要解決潛在伙伴企業信息的獲取和規范化處理的問題。為了解決這一問題,提出通過構建企業本體來規范企業資源信息描述和理解。在此基礎上建立了一種基于本體的虛擬企業伙伴選擇系統,并對企業本體庫的內容框架和結構設計方法作了詳細介紹。
關鍵詞:本體; 虛擬企業伙伴選擇; 信息檢索
中圖分類號:TP311.13文獻標志碼:A
文章編號:1001-3695(2008)02-0428-04
虛擬企業是21世紀最有競爭力的企業運作模式。在虛擬企業的組建過程中,能否選擇出敏捷#65380;有競爭力#65380;相容的合作伙伴,關系到虛擬企業運作的成敗。目前,虛擬企業伙伴選擇的研究主要集中在虛擬企業伙伴選擇的評價指標體系和虛擬企業合作伙伴選擇的優化算法等方面,而忽視了對潛在伙伴企業信息的獲取和處理方面的研究。文獻[1~3]對虛擬企業合作伙伴選擇的決策支持系統作了研究,但是也沒有解決潛在伙伴企業信息的獲取問題。互聯網為虛擬企業伙伴選擇提供了一個理想的信息資源平臺,但由于現階段互聯網上信息的無序化使得從這一平臺獲取有用的信息非常困難。潛在伙伴企業信息獲取屬于互聯網信息檢索的范疇。目前,本體論在信息檢索中的應用越來越受關注。本文將本體論引入虛擬企業伙伴選擇,提出了企業本體的構建方法并以此為基礎設計了一種基于本體的虛擬企業伙伴選擇系統。
1本體論在信息檢索中的應用
本體論是對共享概念的明確的形式化規范說明,它的目標在于捕獲相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并且給出這些詞匯和詞匯之間相互關系的明確定義,以實現軟件系統對這些概念的共享和重用[4]。近年來,越來越多的學者開始將本體論應用于信息檢索研究。文獻[5]提出了將本體論應用于信息檢索的構想,探討了利用本體論提高信息檢索性能的機理;文獻[6]提出了一個基于本體論的信息檢索模型,該模型能夠實現用戶查詢的導引和目標文檔的標注;文獻[7]提出了一種將本體應用于信息檢索的具體方法;文獻[8,9]研究了本體對查詢需求的作用,并且提出了一些基于本體的查詢策略和查詢方法。
使用本體論進行信息檢索本質在于利用本體詞匯來規范人和計算機對目標信息的描述和理解,從而提高信息檢索的查全率和查準率。
2基于本體的虛擬企業伙伴選擇系統
虛擬企業伙伴選擇包括兩個主要階段:第一階段,選擇潛在合作伙伴,搜集潛在合作伙伴的相關信息;第二階段,選擇企業評價方法和虛擬企業伙伴選擇方法,確定最終的合作企業。在網絡環境下,這兩個階段的工作是否有效關鍵取決于潛在合作伙伴信息的獲取與有效處理。圖1為基于本體的虛擬企業伙伴選擇系統結構圖。
該系統的突出特征在于引入本體論方法來解決潛在伙伴企業信息獲取和信息規范化處理的問題。
企業本體庫是該系統的核心。企業本體庫里的本體詞匯及其間關系規范了企業資源描述信息的語法和語義,通過它不同的企業可以以同樣的方式描述企業資源,對于同一資源描述對象又能夠保證不同的企業會產生一致的理解。企業本體管理子系統為系統管理員提供管理企業本體庫的功能,具體包括查詢本體詞匯#65380;結構化本體詞匯瀏覽#65380;本體詞匯更新#65380;本體詞匯沖突校驗。
伙伴選擇方法庫主要用來存儲各種虛擬企業伙伴選擇的方法。用戶可以根據具體的需要靈活地從方法庫中選擇所需的伙伴選擇方法。對每一種伙伴選擇方法需存儲的信息條目包括方法編號#65380;方法名稱#65380;方法特征描述#65380;方法輸入信息接口和方法程序模塊。方法庫管理子系統為系統管理員提供了管理方法庫的功能界面,該子系統的具體功能包括伙伴選擇方法查詢#65380;伙伴選擇方法瀏覽#65380;伙伴選擇方法更新#65380;伙伴選擇方法編程環境和伙伴選擇方法測試環境。
企業資源庫用來存儲企業資源信息,它是用來進行虛擬企業伙伴選擇的信息源。企業資源信息的數據結構完全是按照企業本體庫來設計的,所以數據結構非常復雜。該類信息的產生有兩條途徑:a)用戶通過企業資源描述子系統按照企業資源描述模板所生成的規范化企業資源信息;b)系統通過網絡蜘蛛從互聯網上抓取的企業網頁經過信息抽取與過濾自動生成的規范化企業資源信息。企業資源庫管理子系統為系統管理員提供了管理企業資源信息的功能,具體包括信息查詢#65380;瀏覽和刪除。
用戶服務子系統為用戶提供各種服務,主要包括企業資源描述#65380;潛在伙伴搜索和合作伙伴選擇服務。用戶服務子系統是以網站的形式出現,采用B/S結構設計,企業用戶可以利用瀏覽器通過互聯網來獲取這些服務。
企業資源描述模塊主要為用戶提供描述企業資源的模板,它是按照企業本體庫中的本體詞匯以及本體詞匯之間的關系來設計的。用戶按照企業資源描述模板所描述的企業資源信息是規范了的企業資源信息。
潛在伙伴搜索模塊幫助用戶根據自己的需求搜索潛在的合作伙伴,它為用戶提供各種工具來按照企業本體庫中的本體詞匯規范查詢需求的描述。同時,企業資源庫中的信息都是規范的企業信息,該子系統還可以按照各種分類標準對企業進行分類,提供準確的分類目錄導航功能。
合作伙伴選擇模塊為用戶進行潛在合作伙伴的評價和選擇提供支持,其功能包括企業對比分析#65380;評價方法分析與選擇#65380;企業信息預處理#65380;合作伙伴選擇。
為了增加本系統的企業信息的規模,除了注冊用戶生成的企業資源信息外,本系統還采用網絡蜘蛛從互聯網上抓取企業網頁,然后按照企業本體庫對這些網頁進行信息抽取和過濾,生成符合規范的企業資源信息。
3企業本體庫構建
基于本體的虛擬企業伙伴選擇系統與現有的各類企業信息門戶網站最大的不同在于其利用企業本體庫來規范企業資源信息的描述以及對這些資源的理解,并在此基礎上提供高附加值的企業評價和合作伙伴選擇服務。所以,構建企業本體庫就成為本系統實現的關鍵工作。
3.1企業本體庫的內容框架
為了充分發揮企業本體庫的功效,企業本體庫內容的完備性是首先要考慮的問題。建立企業本體詞匯必須從兩個方面著手,即企業呈現給外部企業的特征以及伙伴選擇活動的機理。通過對這兩方面的分析,本文建立了如圖2所示的企業本體內容框架信息模型,該圖采用UML的類圖來表述,它不僅表達了企業本體內容的構成要素,而且描述了這些要素之間的關系,這些關系是在企業本體庫結構設計時必須考慮的問題。
企業本體詞匯主要包含對象詞匯和屬性詞匯兩大類。對象詞匯是指用來命名企業相關要素概念的標準化名詞,如電機#65380;公司#65380;經理等;屬性詞匯是指用來描述企業相關要素概念特征#65380;性質以及需求的標準化名詞,如重量#65380;經濟效益#65380;利潤等。對象擁有屬性,它可以獨立存在。屬性修飾對象,它不能獨立存在,而必須依賴于某一對象。對象詞匯與屬性詞匯之間存在著復雜的關聯關系,如有的屬性詞匯可以修飾很多對象詞匯,有的屬性詞匯卻僅僅限定于某一對象詞匯。不匹配的對象詞匯與屬性詞匯的組合沒有任何明確的語義。圖2中,對象詞匯與屬性詞匯間的關聯類——對象與屬性之間關系限制了對象詞匯與屬性詞匯之間的對應關系。
對象詞匯與對象詞匯之間也存在著復雜的關系,如有的對象可以分解為許多其他對象,有的對象可以包含其他對象,有的對象可以擁有其他對象等。這些“分解”“包含”“擁有”都代表了不同對象詞匯間的關系。同樣地,屬性詞匯之間也存在著類似的關系。為了表達這樣一些關系,本文建立了兩個關聯類,即對象間關系和屬性間關系。這兩個關聯類表征的含義在伙伴選擇過程中發揮著非常重要的作用。因為隨著企業協作關系的深入,企業在尋找合作伙伴時對伙伴的需求越來越細致,這種細致性直接表現為對象詞匯與屬性詞匯的復雜組合。為了提高各類復雜組合的效率和正確性,建立這兩類詞匯間及其自身之間的關系是至關重要的。
從企業呈現給外部企業的特征來看,對象詞匯可以進一步分解為企業標志詞匯#65380;企業能力詞匯和企業評價詞匯。
1)企業標志用于說明企業的概況,如企業名稱#65380;聯絡方式#65380;地址等。合作伙伴搜索的直接目的就是尋找潛在合作對象此方面的信息,然后由此獲得進一步協商和溝通所必需的更為詳細的信息。
2)企業能力它是對企業核心資源和核心能力的簡潔描述。在合作伙伴搜索過程中主要是依據此類信息來搜索潛在合作伙伴的企業標志信息。企業能力包括產品和服務兩大類,產品是一種有形的商業價值,而服務可視為一種無形的商業價值,它們是依賴于行業特征的。一般合作伙伴搜索活動都是跨行業的,所以企業本體庫應該提供覆蓋不同行業的本體詞匯。
3)企業評價在合作伙伴搜索過程中,通過企業能力信息發現了潛在伙伴的企業標志信息,還需要利用企業評價信息在這些潛在伙伴中比較#65380;篩選出最終的企業合作伙伴。企業評價一般作為合作伙伴評價與選擇過程中使用的約束條件,最常用的有企業產品#65380;企業規模#65380;企業信譽#65380;產品品牌#65380;經營范圍#65380;生產類型#65380;人力技術資源#65380;銷售渠道#65380;管理能力#65380;企業硬件資源#65380;企業資質#65380;市場占有率#65380;企業財務狀況#65380;質量保證體系等。此外,不同的行業會涉及到一些特殊的企業評價指標,所以有關企業評價的本體詞匯也應以行業特征作為基礎。
從伙伴選擇活動的機理來看,企業本體詞匯還必須解決兩個主要問題:
首先,屬性詞匯必須有明確的說明,比如,企業資質級別是優良這一語句中優良就是企業資質級別這一屬性的限定詞。關于屬性的說明包含三個方面:a)屬性值類表明了屬性的取值類型,常見的類型有枚舉類型#65380;整數類型#65380;字符類型等,它保證了屬性說明的語法正確性;b)約束表明了屬性的取值范圍,常見的約束有大于某值#65380;居于兩值之間#65380;先于某時等,它保證了屬性說明的語義合理性;c)度量表明了屬性值的度量方法,不同的度量方法會導致不同的屬性值表述,同時還會用到不同的計量單位。屬性約束是依賴于屬性度量的,度量保證了屬性說明的精確性。
其次,伙伴選擇活動具有很強的不確定性,對于同一目標可以有多種選擇路徑。為了提高伙伴選擇的成功概率,在企業本體庫內容設計時應該遵循全面和多角度原則。全面原則要求所有可能用于伙伴選擇的對象都要被標準化;多角度要求用于說明某一對象的屬性應盡可能豐富。這兩個原則主要用于企業能力詞匯的設計上,作為伙伴選擇的必要條件,企業能力必須被逐層分解至最底層,對于每一層對象都必須建立足夠的修飾性詞匯。在圖2中,服務和產品均由部分聚合而成,而部分又可由部分聚合而成,它表達了企業能力詞匯設計全面性原則的需求語義。此外,部分是對象的間接子類,它繼承了對象與屬性之間的關聯關系,這表明每一級別的部分分解都必須考慮該級別對象的屬性,它很好地表達了企業能力詞匯設計多角度原則的需求語義。
3.2企業本體庫的結構設計
功能強大的企業本體庫包含豐富的本體詞匯,如何組織這些詞匯以使它們能夠被正確地理解#65380;高效率地應用和統一地管理是企業本體庫結構設計所必須要解決的問題。筆者在總結現有工作[10~12]的基礎上建立了如圖3所示的企業本體庫結構信息模型,它采用UML的類圖來表達,可以用來指導企業本體庫的數據模式設計。
企業本體庫中除了可直接應用的詞匯信息之外還包含大量用于輔助管理的信息。圖3中的根對象類是所有企業本體庫信息的抽象,它包含了最通用的信息描述屬性。根對象類包含兩大類屬性,即基本信息屬性和管理信息屬性。基本信息屬性用來描述企業本體庫中每一詞匯條目的名稱#65380;定義#65380;使用規則和外部資源參考,它主要保證每一詞匯條目被正確地理解和使用。名稱是對詞匯條目的簡潔明確的命名,它應該做到望名知義;定義是對該條目的正式的規范化解釋,它用來保證條目名稱不會引起歧義;使用規則用來輔助應用者正確地使用該條目,它可以包含使用該條目的環境#65380;約束等信息。企業本體庫的設計非常復雜,有時需要不同協作者的共同努力,對于某一條目可能是借用其他協作者的成果,對該條目的最終解釋還必須依賴于該條目的創建者,所以設立了外部資源參考屬性。通過該條目的外部資源標志值可以導航到描述該外部資源具體信息的外部資源類,以獲得有關該條目的最權威的解釋。管理信息屬性用來描述企業本體庫中每一詞匯條目全生命周期過程中的狀態信息和相關的管理信息。企業本體庫的設計是一個不斷發展完善的過程,許多存儲條目在使用過中會更改#65380;刪除#65380;合并等,所以必須建立統一的存儲條目管理機制以保證每一條目的正確使用。主要的條目管理信息包括版本控制信息#65380;改變歷史信息和相關權限信息,它們是企業本體管理子系統開發的基礎。
通用對象類繼承了根對象類的屬性,并且增加了用于詞匯搜索的信息屬性,這些屬性是為了有效地在本體庫中發現所需的詞匯。分類標志屬性可以將該詞匯導航到它所屬的分類目錄之中,它為本體詞匯的目錄導航方式搜索提供了技術支撐。為了提高詞匯導航目錄搜索的靈活性,各種分類#65380;分類模式以及分類節點均以存儲條目的形式存于本體庫中,采用這種方法一是可以靈活地設計各種本體詞匯的分類模式;二是可以便捷地將每一本體詞匯與各種分類模式相關聯。圖3中分類類#65380;分類模式類和分類節點類的屬性構成以及它們之間的關系表達了各種分類方法的實現細節。關鍵詞標志屬性將該本體詞匯與相關的搜索關鍵詞關聯起來,它為利用關鍵詞方法搜索本體庫提供了技術支撐。企業本體庫中存儲的關鍵詞是經過精心設計的,主要用于各類本體詞匯的搜索,它也可以導航到各種分類模式,這樣就可以先按目錄方式查找相關關鍵詞,再以關鍵詞搜索所需本體詞匯,這種方式極大地提高了按關鍵詞搜索的成功率。同義詞屬性枚舉了與該詞匯條目含義一致的同義詞,可以通過任一同義詞獲得其相應的本體條目,這在企業本體的實際使用過程中會極大地便利本體詞匯的發現。表述標志屬性為采用不同的數據表述技術來規范化企業資源描述奠定了基礎,它主要用于多個企業本體庫協作的場合。
通用對象類與其自身之間的關聯關系表達了各種本體詞匯之間的復雜關系,通過關聯類—關聯關系可以表達詞匯間關系的類型和關系實例。由于詞匯間關系是多對多的,通過該關聯類的對應關系標志可以導航到各種具體的關系實例表。關系實例表的結構可從對應關系類的屬性中看出。這些存儲于企業本體庫中的詞匯間關系主要用于企業資源描述時的有效性評估,它保證了各種本體詞匯組合表達了正確的且合理的語義。
通用對象類包含四個子類,即對象#65380;屬性#65380;對象集和屬性集,它們代表直接可用的本體詞匯。對象類是單一對象詞匯的抽象,它除了繼承根對象類和通用對象類的所有屬性之外,還擁有對象標志屬性,它是該對象詞匯在企業本體庫中的惟一性標志。屬性類是單一屬性詞匯的抽象,它除了繼承根對象類和通用對象類的所有屬性之外,還擁有屬性標志#65380;屬性值#65380;約束#65380;度量和單位四個屬性,它們是對該屬性詞匯的完全說明。對象集類是一系列對象所組集合的抽象,這些對象集合能夠被應用于某一具體場合,并且以一定的次序組合同時出現,可以將它們作為一個單一的對象詞匯來使用。屬性集類是一系列屬性所組集合的抽象,它們能被用于修飾某一對象,并且以一定的次序組合同時出現,可以將它們看做是單一的屬性詞匯來使用。對象集類和屬性集類均含有構成約束屬性,用它來描述組成該集合的原因和使用環境約束。屬性集和對象集的設計是為了使用便利,將經常同時出現的對象或屬性組裝成一類并賦予其豐富的描述和管理信息,就可以直接發現和使用這些對象和屬性的集合,避免了重復工作。
4原型系統實現
原型系統的開發采用J2EE平臺,部署采用Weblogic7.0服務器,后臺數據庫采用Oracle數據庫。采用J2EE平臺主要有如下兩個原因:首先,采用J2EE平臺可以按照三層軟件體系架構來開發系統,系統的靈活性和可擴充性較好;其次,采用EJB組件技術開發伙伴選擇程序,可以實現真正的即插即用,這是合作伙伴選擇模塊必須解決的問題。
該原型系統目前只是作為企業應用協同系統EAC 2.0的一個子系統。企業應用協同系統EAC是一套商品化的教學軟件,目前已有了多個高校用戶。
5結束語
傳統的虛擬企業伙伴選擇研究過多地關注于各種指標評價體系和優化算法的研究,而忽視了對伙伴選擇所需信息的獲取與處理方面的研究。如果伙伴選擇缺乏信息源,那么方法再好,指標再全面,也只是紙上談兵。本文提出通過建立企業本體來規范企業資源信息的描述和理解,為伙伴選擇信息源的建立提供了一種新的思路。基于本體的虛擬企業伙伴選擇系統的核心是構建企業本體庫,本文建立的本體庫內容框架和本體庫結構模型為本體庫的設計提供了有價值的參考。
參考文獻:
[1]代春艷,代曉紅.基于Web的虛擬企業伙伴選擇決策支持系統[J].重慶工商大學學報:自然科學版,2005,22(6):564-567.
[2]李賀,周敬.虛擬企業伙伴選擇評價信息系統的構建研究[J].現代圖書情報技術,2006(5):65-68.
[3]鄭紅星,尹朝萬.分布式制造伙伴選擇系統的研究與實現[J].小型微型計算機系統,2005,26(8):1427-1432.
[4]GUARINO N. Formal ontology in information systems[DB/OL].[2006-05].http://scholar.google.com/.
[5]徐麗.本體論導引下的信息檢索[J].情報檢索,2005,1:121-124.
[6]郭祥文,劉惟一,錢民,等.基于本體論的信息檢索[J].云南大學學報:自然科學版,2003,25(4):324-327.
[7]宋峻峰,張維明,肖衛東,等.基于本體的信息檢索模型研究[J].南京大學學報:自然科學版,2005,41(2):189-197.
[8]MANDALA R, TAKENOBU T, HOZUMI T. The use of wordnet in information retrieval[DB/OL].[2006-05].http://scholar.google.com/.
[9]STOJANOVIC N, STUDER R, STOJANOVIC L. An approach for step-by-step query refinement in the ontology-based information retrieval[C]//Proc of IEEE/WIC/ACM International Conference on Web Intelligence. 2004:36-43.
[10]ECCMA. EOTD architecture and naming conventions[EB/OL].[2003-04-23].http://www.eccma.org/.
[11]BHMS M, BONSMA P, TOLMAN F, et al. Final edition of the bcXML specification[EB/OL].[2003-01-24].http://www.econstruct.org/6-Public/bcXML_CD/ PublicDeliverables/pfr_v3b.pdf.
[12]UN/CEFACT. EbXML core components technical specification version 1.90[EB/OL].[2002-12-11].http://www.unece.org/cefact/ebxml/ebXML_CCTS_Part1_V1-8.pdf.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”