999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識樹的領域知識組織和應用

2008-12-31 00:00:00于海濤高一波楊一平
計算機應用研究 2008年11期

(中國科學院 自動化研究所 綜合信息系統研究中心, 北京 100190)

摘要:在分析已有知識表示方法優缺點的基礎上,提出一種高效的知識表達模型——概念知識樹。概念知識樹模型不僅結構性好、表達能力強,而且在應用中具有良好的適應性和延展性,現主要應用于信息檢索和自然語言理解領域。以旅游領域為背景,用概念知識樹作為表達模型建立相應的領域知識體系,并在此基礎之上實現了一個旅游智能分析系統。該系統可在對用戶需求(自然語言)進行一定程度語義理解的基礎上,根據所建立的知識體系自動進行語義匹配,最終返回滿足用戶需要以及相關的旅游路線信息。

關鍵詞:知識表示; 領域知識; 概念; 概念知識樹; 語義理解

中圖分類號:TP391文獻標志碼:A

文章編號:1001-3695(2008)11-3246-03

Construction and application of domain knowledge based on knowledge tree

YU Hai-tao, GAO Yi-bo, YANG Yi-ping

(Integrated Information System Research Center, Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China)

Abstract:After analyzing the advantages and disadvantages of the traditional knowledge representation methods, this paper presented an effective knowledge representation model-concept-based knowledge tree. Compared with other methods, it has not only good structural performance and high representative ability, but also good flexibility and extensity in practice. It widely used in information retrieval and natural language understanding. Builtknowledge architecture on the knowledge tree model in tourism field, and further developed an intelligent retrieval system. The system performed semantic matching automatically according to the knowledge architecture, which was based on understanding the semantic meaning of the users’ requirement (natural language) to some extent, and finally returned the appropriate and related information about tourism routes.

Key words:knowledge representation; domain knowledge; concept; concept-based knowledge tree; semantic understanding



表示是為描述世界所作的一組約定,是知識的符號化過程。知識表示是用計算機能夠接受并進行處理的符號和方式來表示人類的知識并將知識形式化的過程。一種好的知識表示方法首先要符合人腦的認知結構,其次要具有簡明的表示形式,此外在應用中要有較好的適應性和延展性。傳統的知識表示方法主要包括邏輯、產生式、語義網絡、框架等[1]。但這些表示方式在理論和實際應用中都有自身的缺陷:邏輯表示法的表達能力有限,特別是對具有歸納結構和多層次的知識;產生式表示法具有良好的推理模擬能力,但由其組成的知識體系的完備性難以保證,此外其在應用過程中的靈活性較差,而且無法對世界進行本體化的描述;語義網絡用于表示一個事物與其各個部分間的分類知識,但其表達能力有限(與一階邏輯表達能力相同);框架是一種適應性強、結構化良好、推理方式靈活的知識表示模型,但深入的研究不夠。

為了有效地反映人腦的思維過程以及解決問題過程中知識的運用過程,本文提出一種高效的知識表示模型——概念知識樹。這是一種結構良好、推理方式靈活,并能將陳述性知識與過程性知識進行統一描述的知識表示方法。

1概念的基本定義

概念知識樹是中國科學院自動化研究所綜合信息中心在理論和實踐的基礎上對人工智能研究的一種探索,是面向多領域的以解決人工智能基礎問題為目標的知識表示框架體系。它從認知心理學的角度解釋了思維活動的基礎結構,提出了思維活動的心理模型假說。這里所謂的概念是描述世界的本體,是現實世界中的對象在人類思維世界中的內部映像,它以字、詞和短語作為其語言載體。

概念作為知識語義的基本單元,使用屬性、關系和行為三個要素來表達概念的內涵,即概念={屬性,關系,行為}[2]。其中,屬性是概念的基本特征,對概念起表示和區分的作用;關系是概念間的相互聯系,概念的屬性和行為因關系的存在得以繼承和發展;行為是概念間的相互作用,體現了事物的運動特性,是概念發展變化的源動力。

概念是以詞語的形式來表達語義的單元。概念與詞語之間是多對多的關系,一個概念可以用不同的詞語進行表達,而一個詞語在不同的領域中也可以表達不同的概念。例如詞匯“蘋果”在食品領域對應著一種水果,但是在信息領域則對應一個IT品牌。

概念是在一定領域背景下的語義知識描述單元,其產生和使用必然受到特定領域背景的影響。當概念形成后,這些領域背景的知識則固化于概念之中(滲透在概念的三要素之中)。

2概念知識樹模型

概念知識樹是針對某一領域按照特定分類標準,將概念作為意義表達的基本結構,依靠概念的行為和概念之間的各種關系形成意義主體相互作用的知識層次化表示,其模型如圖1所示。從圖1可以看出,概念是整個知識樹體系的基礎。同一個概念可以出現在不同的知識樹中,也就是說,可以從不同的側面和角度來描述同一概念。

21知識節點

作為概念知識樹的重要組成部分,知識節點是對該領域某一方面分類知識的表達。

1)知識節點的結構概念知識樹由知識節點按照一定的相互關系組成。與概念類似,知識節點也包含屬性、關系、行為三部分組成。

2)知識節點的語義它可能是概念也可能是概念的三種語義復合結構。利用這三種復合結構可以將獨立概念按照一定的關系組成新的復合概念。復合概念在形成過程中內涵增加,外延縮小。例如,將獨立概念“花”“紅”根據語義約束關系組成復合概念“紅花”。“紅花”屬于“花”,且其顏色屬性上又被概念“紅”所約束。

之所以提出概念知識樹模型是因為知識節點的語義一方面可以從相應概念或語義復合結構中獲得,另一方面可從概念知識樹(與上下位節點或者與其他相關知識點的相互關系)中獲得。前者的語義是對知識點一般性的描述,后者的語義是建立在前者語義的基礎上,是在某個特定應用背景下對前者語義的擴充。這里語義的擴充可能包含平移、補充兩種情況。

如果知識節點對應的語義是概念,則語義的平移表示知識點的語義直接可以從相應概念中獲得,兩者保持一致,即在分析其語義時從相應概念中獲得語義;補充是指知識點在特定應用背景中所特有的語義,這種深入的描述體現在相關概念三要素的擴充。

22概念知識樹體系結構及特點

概念知識樹從上到下,知識節點逐步細化,內涵增加,外延縮小。這種知識的組成關系符合現實世界中人們理解事物的過程(從粗到精,從繁到簡)[3]。

以概念知識樹作為表達模型構建的知識體系包含知識樹體系和概念庫兩個部分,這兩部分相互關聯,相互制約。概念知識樹體系是對概念高層的語義分類描述,而概念庫是概念屬性、關系、行為的具體刻畫。例如在通信產品樹上包含“手機”這個知識節點,該節點包含對手機的功能描述;與之相對,在概念庫中有“諾基亞手機3510”這一概念,它包含該款手機具體的性能參數等信息。

與已有的知識表示方法相比,概念知識樹模型具有以下特點:

a)較強的表達能力

(a)可對描述性知識和過程性知識進行統一描述。根據概念知識樹層次結構的特點,能對那些靜態描述性知識進行很好的層次化結構描述,尤其是對那些具有歸納結構和多層次的知識;此外,利用概念知識樹之間的相互聯系以及與概念庫之間的相互映射,可以通過建立相應的任務會話來完成對于過程性知識的描述。這一任務會話同樣以概念知識樹作為表達框架,描述整個業務的流程以及各部分與描述性知識的交互。

(b)可反映概念之間的多種聯系(繼承關系、組成關系、語義場關系[4])。通過知識節點間的繼承關系和組成關系,可以建立起不同粒度知識點間的相互映射,為實現在不同層次的知識間進行推理提供了條件。知識節點間的語義場是各個概念知識樹相互聯系的紐帶,可以利用這種關系從不同的側面來描述相應的概念。

b)利于語義匹配

語義匹配方法的優劣直接決定語義搜索結果的好壞。概念知識樹體系是建立在概念語義的基礎上,每一個知識節點都有相應的語義,而概念知識樹中上下位、繼承關系以及語義場關系是對這種語義的補充,這就為語義信息的匹配提供了更加靈活的方式。

例如以中國的行政區域為分類標準構建中國地名樹。當搜索“保定市”時,在概念知識樹中可以定位到保定市這個知識點。通過該知識點的屬性,可以獲得該地區的位置、面積、人口等信息。此外,利用概念知識樹的上下位關系可以獲知保定市屬于河北省,因此還可以獲得河北省內與保定市鄰近的其他一些地區的相關信息,這些地區與保定市有著更加相似的特征,如風俗、方言等。

在這里可以將語義匹配歸結為概念的匹配。而概念間的差異主要體現在概念各個屬性的取值差異,因此可以定義如下概念匹配的計算方法。對于一棵概念知識樹T上的兩個互異知識點K1、K2,可以通過式(1)來刻畫其間的匹配程度:

sim(T,K1,K2)=1-(D1+D2)/(N-1)(1)

其中:N表示該概念知識樹所包含知識點的個數;D1、D2分別表示知識點K1和K2與其公共父節點的層差。如果知識點K1、K2相同則令sim(K1,K2)=1。

在此基礎上,可通過式(2)構建概念間的匹配程度:

S(C1,C2)=∑ni=1Wi×sim (Ti,K(C1i),K(C2i))(2)

其中:n表示概念屬性的個數;Wi表示第i個屬性的重要程度;Ti表示與第i個屬性對應的概念知識樹;K(C1i)、K(C2i)分別表示概念C1、C2第i個屬性的屬性值在概念知識樹Ti中所對應的知識節點。

c)推理靈活性加強

利用知識樹體系、概念庫以及它們之間的相互聯系,可以方便地在知識樹體系以及概念庫之間進行推理。

在知識樹體系中,既可依據知識點的上下位以及組成關系在不同粒度知識點間進行推理,也可以在同層相同粒度的近鄰節點間進行推理。而在不同概念知識樹中,利用知識點間的語義場關系來完成跨領域的推理。知識樹體系與概念庫之間的推理則反映了高層語義與具體概念的相互映射。因此,在利用概念知識樹進行推理時可以從概念知識樹體系到概念庫;反之亦可,這樣就大大加強了推理的靈活性。

23概念知識樹的構建原則

基于概念知識樹模型現主要應用于信息的檢索和自然語言處理。這種知識體系所包含的內容是遵循一類劃分標準的分類知識。隨著概念知識樹層次的加深,知識節點的內涵增加,外延減少。概念知識樹的層次結構是信息檢索搜索的路徑和參考的標準,因此概念知識樹構建的優劣直接影響著信息檢索和分類的準確性及效率。

為了保證知識結構的合理性以及應用中使用的方便性,概念知識樹在構建過程通常需要遵循以下幾個原則:

a)分類標準保持惟一。一棵概念知識樹在逐層細化的過程中其分類標準要自始至終保持惟一。這樣做的目的是盡可能保證概念知識樹中的知識節點沒有重復,同時保證了不同知識點的子知識點之間沒有交叉。如在組織古代建筑知識樹時,既可以按照年代進行劃分,也可以按照建筑風格進行劃分。若在建立的過程中采用兩種或兩種以上的分類標準就會出現如下的情況:相同年代下的建筑可以被劃分為不同的建筑風格,而相同建筑風格的建筑又可以被劃分為不同的年代。這樣,整個知識體系的關系復雜,在具體應用時會出現循環作用的情形。

b)分類標準的選擇。由于概念知識樹是對特定領域某一側面知識的層次化表達,概念知識樹分類標準既要符合特定領域公認的標準也要考慮到具體應用的方便性。這樣做不僅使得分類樹中知識節點的語義具有良好的可理解性,也增強了該知識體系的可移植性和通用性。

c)概念知識樹葉子節點的分類。概念知識樹葉子節點既可以代表類別概念也可以代表實體概念。類別概念可以包含若干實體概念。例如,概念“清代建筑”屬于類別概念,而概念“故宮”屬于實體概念。若該領域實體概念的數量很少或者每一實體概念只與概念知識樹上惟一的知識節點相關,則可以把該實體概念作為相應的葉子節點;否則,從搜索和存儲方面考慮,概念知識樹葉子節點代表類別信息,將具體的概念存儲在概念庫中并與相應概念知識樹葉子節點建立關聯。

d)知識節點的粒度問題。概念知識樹是表達知識的層次結構,在每一層中,知識節點與其相鄰節點在粒度上保持一致。層次越高,粒度越大;層次越低,粒度越小。

3基于概念知識樹體系的語義搜索算法

在分析特定領域相關知識的基礎上,可以按照概念知識樹構建原則組織概念知識樹體系并在其上進行基于語義的搜索。

基于概念知識樹的語義搜索算法包含分詞、分類和評分、語義理解、語義匹配搜索四個階段。其具體的算法如下:

a)輸入。查詢需求(自然語言);

b)分詞。將用戶的輸入進行切分,切分結果是一個短語集合;

c)分類和評分。根據所建立的知識體系,將分詞獲得短語與概念知識樹上節點進行匹配,每匹配一個知識點將該知識點的分值加1,并記錄相應短語與該知識點的映射關系。

d)語義理解。統計每一個短語與之相對的知識點的分值,選取分值最大的知識點作為該短語語義分析的結果。

e)語義搜索。根據語義理解的結果,在概念庫中進行語義匹配。這里的語義匹配主要是根據2.2節中定義的方法進行計算。

f)輸出。將概念庫中的概念按照匹配程度由高到低的順序返回給用戶。

4實驗與結果

為了驗證概念知識樹體系的有效性以及構造原則的合理性,以旅游作為限定領域,構建其領域知識體系,并在此基礎上實現一個智能的旅游搜索引擎。該搜索引擎的目的是為用戶提供個性化的旅游路線的定制。與其他旅游搜索引擎相比,該搜索引擎具有以下特點:a)擁有一套較完整的關于旅游路線的知識體系;b)對于用戶旅行需求(自然語言)可進行一定程度的語義理解;c)提供兩種方式的查詢,即標準查詢和擴展查詢。

41旅游線路知識體系的建立

首先,建立旅游線路概念Ctour-route,其屬性包括{所屬旅行社,旅游線路編號,出發地,參觀的景點,發團時間,旅行期限,規模,交通工具,住宿條件,花費,有效期限}。此外,以概念知識樹作為知識表示模型,建立包含旅游景點、旅游景觀、旅游交通方式、住宿條件以及旅游時間五個方面的知識樹體系。

根據構建概念知識樹的標準,需要為每一棵知識樹選取惟一的劃分標準。在這里,以地域來劃分具體的旅游景點,根據往返乘坐的交通工具來組織旅游交通方式樹,根據住宿的等級來刻畫住宿條件,按旅行時間的長短來組織旅游時間樹,按照景觀的特點來組織景觀樹。根據上述標準,建立如圖2所示的知識樹體系。

此外,為了體現查詢的實用性和智能性,將旅游景點樹和旅游景觀樹建立一個語義場,即一個旅游景點可以對應多個旅游景觀樹上的節點,而一個旅游景觀可以映射到多個旅游景點樹上的節點。

42查詢方式

該搜索引擎中提供兩種查詢方式:標準查詢和擴展查詢。其中,標準查詢是指完全按照用戶的輸入需求進行旅游路線檢索;擴展查詢主要是根據知識體系中不同概念知識樹的相互關系為用戶提供可能需要的相關旅游路線信息。

在這里主要利用了知識樹體系中旅游景點樹和旅游景觀樹之間的相互關系。例如桂林是以山水為特點的旅游景點,那么如果用戶輸入桂林作為目的地,可以推斷出用戶所希望觀光的景點類型可能為山水類型,因此在擴展查詢中給出滿足除旅游景點外其他需求并且景觀類型包括山水的旅游線路。

43實驗結果

在輸入框中輸入:“我想坐火車去桂林玩幾日,住在一般的旅館就行,請問有什么樣的旅游路線?”搜索引擎首先對上述用戶的需求進行分詞并進行語義分析,分析的結果如圖3所示。

根據語義分析的結果,在概念庫中匹配出相應的旅游路線信息,如圖4中常規查詢結果所示。此外,由于旅游景點樹中桂林知識點與旅游景觀樹上的山水風光知識點相對應,搜索引擎還將旅游景觀包含山水風光并且同時滿足用戶其他條件的旅游路線展現給用戶,如圖4中擴展查詢結果所示。

5結束語

本文以概念為出發點,較詳細地介紹了概念知識樹模型并提出若干概念知識樹的構建原則,最后以旅游領域為例具體說明了概念知識樹的構建和應用,驗證了該知識表示體系的有效性。但概念知識樹還處于實踐應用的探索階段,因此如何將其應用于其他領域是接下來研究的重點。

參考文獻:

[1]石純一,黃昌寧,王家廞.人工智能原理[M].北京:清華大學出版社,1995.

[2]高一波.一種基于概念的知識表達體系[J].微電子學與計算機, 2004,21(9):71-74.

[3]張鈴,張鈸.問題求解理論及應用[M].北京:清華大學出版社, 2007.

[4]吳蔚天.漢語計算語義學:關系、關系語義和形式分析[M].北京:電子工業出版社,1999.

主站蜘蛛池模板: 国产精品林美惠子在线播放| 国产精品人莉莉成在线播放| 国产麻豆永久视频| 欧美人与动牲交a欧美精品| 久久夜色撩人精品国产| 欧美啪啪网| 在线观看国产精品第一区免费| 久久a毛片| 国产精品女人呻吟在线观看| 欧美怡红院视频一区二区三区| 久久精品亚洲专区| 国产一区二区精品高清在线观看| 伊人精品视频免费在线| 中文字幕在线播放不卡| 成人夜夜嗨| 99热线精品大全在线观看| 国产精品久久久久久久伊一| 亚洲精品在线91| 一级毛片免费播放视频| 青青热久免费精品视频6| 免费毛片全部不收费的| 中文字幕乱妇无码AV在线| 国产在线一二三区| 亚洲男人天堂2018| 手机在线国产精品| 免费高清毛片| 国产精品13页| 亚洲国产成人在线| 欧美精品色视频| 国产国拍精品视频免费看| 中文无码伦av中文字幕| 国产成人a毛片在线| 欧美不卡视频一区发布| 国产丝袜丝视频在线观看| 久久这里只有精品国产99| 国产精品片在线观看手机版| 午夜精品久久久久久久无码软件| 国产精品福利导航| 久久77777| 国产精品3p视频| 一本大道无码日韩精品影视| 精品国产网站| 亚洲精品波多野结衣| 国产美女叼嘿视频免费看| 日韩欧美国产综合| 一区二区欧美日韩高清免费| 中文字幕第4页| 国产精品手机视频| 在线观看91香蕉国产免费| 久久黄色视频影| 波多野结衣久久精品| 久久黄色视频影| 中文无码日韩精品| 日韩视频福利| 亚洲欧美精品在线| 国产天天色| 国产第八页| 夜夜高潮夜夜爽国产伦精品| 国产欧美精品专区一区二区| 久久久久国产精品嫩草影院| 国产国产人成免费视频77777 | 伊人久久久大香线蕉综合直播| 久久亚洲国产最新网站| 国产亚洲精品无码专| 美女无遮挡免费网站| 亚洲成网站| 亚洲中文制服丝袜欧美精品| 蜜臀AVWWW国产天堂| 国产成人91精品| 国产成人精品一区二区不卡| 九九视频在线免费观看| 丝袜国产一区| 亚洲欧美激情另类| 国产欧美视频综合二区| 亚洲av无码片一区二区三区| 中文字幕人妻av一区二区| 亚洲伊人电影| 国产精品视频系列专区| 一区二区欧美日韩高清免费| 欧美成人精品在线| 一本大道无码高清| 99久久精品久久久久久婷婷|