劉紀(jì)平,栗 斌,2,石麗紅,王振峰,陶坤旺
1.中國(guó)測(cè)繪科學(xué)研究院政府GIS研究中心,北京100830;2.武漢大學(xué)資源與環(huán)境學(xué)院,湖北武漢430079;3.溫州醫(yī)學(xué)院環(huán)境與公共衛(wèi)生學(xué)院,浙江溫州325035
據(jù)統(tǒng)計(jì),重大突發(fā)事件中,97%與空間位置直接或間接相關(guān)[1]。對(duì)這些事件檢索時(shí),傳統(tǒng)地理信息檢索方法遵循以關(guān)鍵詞詞形匹配方式實(shí)現(xiàn)地理信息檢索,忽略關(guān)鍵詞的語(yǔ)義信息,導(dǎo)致檢索系統(tǒng)難以正確理解用戶查詢需求。不同類型地理信息難以按地理空間事件組織,無(wú)法為用戶主動(dòng)提供與事件處理相關(guān)的地理信息,信息獲取過(guò)程繁瑣,檢索效率低,個(gè)性化支持能力弱,查準(zhǔn)率不高。因此,研究地理信息的自動(dòng)檢索技術(shù),從海量地理信息數(shù)據(jù)庫(kù)中智能提取與地理空間事件相關(guān)的信息,變被動(dòng)檢索為按事件主動(dòng)服務(wù)[1],不僅是當(dāng)前地理信息服務(wù)的前沿和熱點(diǎn),更可廣泛應(yīng)用于政府應(yīng)急管理、地理信息搜索服務(wù)等多個(gè)領(lǐng)域。
為克服傳統(tǒng)地理信息檢索方法由于關(guān)鍵詞詞形匹配帶來(lái)的缺陷,引入本體的概念,即“本體是共享概念模型的明確的形式化規(guī)范說(shuō)明”[2]。由于本體可以對(duì)知識(shí)的概念和相互間的關(guān)系進(jìn)行較為精確的定義,具有良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,能在不同的建模方法、范式、語(yǔ)言和軟件之間進(jìn)行翻譯和映射,以實(shí)現(xiàn)不同系統(tǒng)之間的互操作和繼承[1,3]。因此,在信息檢索特別是基于知識(shí)的智能檢索中可以充分發(fā)揮其優(yōu)勢(shì),有效提高檢索效率[4]。
本體在地理信息領(lǐng)域的延伸和應(yīng)用形成地理空間事件本體,它是地理本體的一種類型,是把與地理空間事件相關(guān)的知識(shí)、信息和數(shù)據(jù)抽象成若干個(gè)具有共識(shí)的地理對(duì)象,并按照一定的邏輯關(guān)系組成體系,同時(shí)進(jìn)行概念化處理和明確的定義,以形式化的方式進(jìn)行表達(dá),最終服務(wù)于地理信息智能檢索。這里,地理空間事件指發(fā)生在地表空間的各種自然和社會(huì)現(xiàn)象,由時(shí)間、位置和事件現(xiàn)象等部分組成。地理空間事件本體以地理空間事件相關(guān)信息組織為核心[1],基于本體的檢索既可以有效地解決傳統(tǒng)檢索方式中處理地理空間事件空間位置時(shí)的不明確性,又可以實(shí)現(xiàn)地理空間事件相關(guān)信息的自動(dòng)組織以及針對(duì)不同用戶的個(gè)性化服務(wù)。
目前,本體用于智能信息檢索的前沿研究主要包括:
(1)Ontobroker[5]:用來(lái)處理HTML、XML和RDF格式的信息源和語(yǔ)義描述的系統(tǒng),提供信息檢索、查詢和維護(hù)支持服務(wù)。核心是用形式化本體描述背景知識(shí),并明確化Web文檔的語(yǔ)義,以便綜合利用本體論的表達(dá)能力和推理機(jī)制。
(2)OntoSeek[5]:基于內(nèi)容從在線黃頁(yè)和產(chǎn)品目錄中進(jìn)行檢索的系統(tǒng)。把本體用作有語(yǔ)義信息的領(lǐng)域詞匯表,將本體驅(qū)動(dòng)的內(nèi)容匹配機(jī)制與一個(gè)表示形式化的系統(tǒng)相結(jié)合,試圖將本體論和大詞典庫(kù)相互集成,以便提供一個(gè)可以用領(lǐng)域內(nèi)任意詞匯進(jìn)行交互式語(yǔ)義查詢的系統(tǒng)[6]。
本文區(qū)別于傳統(tǒng)的地理信息檢索僅利用關(guān)鍵詞進(jìn)行匹配和查詢的機(jī)制,以地理空間事件(任務(wù))為紐帶,通過(guò)研究地理空間事件相關(guān)本體的創(chuàng)建方法,利用本體構(gòu)建領(lǐng)域概念模型,對(duì)與地理空間事件相關(guān)的語(yǔ)義、空間等信息進(jìn)行關(guān)聯(lián)分析和推理,從語(yǔ)義層次理解用戶需求[7],按照特定地理空間事件特征,組織查詢?nèi)蝿?wù),創(chuàng)建事件驅(qū)動(dòng)的智能化地理信息檢索方法,實(shí)現(xiàn)用戶僅需要了解事件發(fā)生的基本信息(如名稱、地點(diǎn)、類型等)就可以從海量地理信息庫(kù)中智能提取與事件相關(guān)的信息,并提供檢索的個(gè)性化支持,簡(jiǎn)化檢索過(guò)程,最終提高檢索效率。
本體驅(qū)動(dòng)的地理空間事件相關(guān)信息檢索成功的前提是要構(gòu)建一個(gè)地理空間事件本體,該本體包含地理空間事件的基本概念及概念間語(yǔ)義關(guān)系的明確定義。
面向用戶檢索,地理空間事件本體可以劃分為地理對(duì)象本體、自然災(zāi)害本體及基于用戶個(gè)性化需求的用戶本體等子類型,不同本體間的邏輯關(guān)系如下圖1所示。

圖1 本體間邏輯關(guān)系圖Fig.1 Logic diagram among ontologies
其中,地理對(duì)象本體和自然災(zāi)害本體構(gòu)成地理空間事件本體的主要部分,描述地理空間事件相關(guān)信息。前者用于描述地理空間事件的位置、空間關(guān)系、時(shí)間等信息[1];后者用于說(shuō)明地理空間事件的名稱、類型、屬性、組織方式等信息[5]。這兩種本體可以相互引用。用戶本體則面對(duì)終端用戶建模,包括用戶喜好、檢索方式、興趣、級(jí)別、業(yè)務(wù)等屬性,以便檢索出感興趣的信息,過(guò)濾掉不相關(guān)的信息,體現(xiàn)用戶個(gè)性化需求。
(1)地理對(duì)象本體由六元組構(gòu)成,即地理概念、關(guān)系、函數(shù)、屬性、公理、實(shí)例等,用于表示地理空間領(lǐng)域中的各種不同地理對(duì)象或?qū)嶓w,這些具有相同屬性的地理實(shí)體的集合被表示為“地理概念”或“類”,一個(gè)本體概念(類)由一系列性質(zhì)和行為相同的地理對(duì)象組成。本體的概念構(gòu)成層次結(jié)構(gòu),后者來(lái)源于地理領(lǐng)域已有的概念分類體系,本體的概念由屬性描述[8]。關(guān)系指地理領(lǐng)域中不同的概念之間某種性質(zhì)的聯(lián)系,包括語(yǔ)義、空間關(guān)系。函數(shù)是一類特殊的關(guān)系。屬性與類相對(duì)應(yīng),包括對(duì)象屬性、數(shù)據(jù)屬性。確定概念的屬性和識(shí)別領(lǐng)域概念的過(guò)程是相互交叉的,通常都是在識(shí)別概念的同時(shí),確定其屬性及與其他概念的關(guān)系。公理指地理學(xué)領(lǐng)域中公認(rèn)的規(guī)律、知識(shí)及施加于概念之上的一些規(guī)則或約束條件,以便推理,并保證本體的一致性和完整性[1-2]。實(shí)例是指地理對(duì)象本體中概念或類的具體例子,也稱為個(gè)體。
(2)災(zāi)害事件本體的構(gòu)成與地理對(duì)象本體類似,但在結(jié)構(gòu)上比后者要簡(jiǎn)化,由四元組構(gòu)成,即災(zāi)害概念、關(guān)系、屬性、實(shí)例等。兩個(gè)概念之間通常存在一定的關(guān)系。
(3)構(gòu)建用戶本體的目的是用于實(shí)現(xiàn)個(gè)性化信息內(nèi)容定制[1,5]。通過(guò)對(duì)用戶使用習(xí)慣、知識(shí)背景的處理及對(duì)用戶查詢計(jì)劃、意圖、興趣方向的推理和預(yù)測(cè),完成信息過(guò)濾,提取用戶需要的信息。以電子政務(wù)用戶為例,其結(jié)構(gòu)為一個(gè)四元組,表示為O=〈C,Ac,R,I〉,其中C表示概念的集合;Ac表示多個(gè)屬性集合組成的集合;R代表關(guān)系,表示用戶領(lǐng)域中各用戶概念之間的關(guān)系;I表示實(shí)例。
當(dāng)前國(guó)內(nèi)外對(duì)地理本體的研究主要有:美國(guó)國(guó)家地理信息和分析中心對(duì)地理信息的認(rèn)知類型和地理目標(biāo)的本體特征的研究[9];美國(guó)西北大學(xué)對(duì)地理尺度和不確定性本體論的研究;希臘雅典國(guó)家技術(shù)大學(xué)開(kāi)展“地理本體研究組ONTOGEO”項(xiàng)目研究[5];中科院計(jì)算所在重點(diǎn)項(xiàng)目“國(guó)家知識(shí)基礎(chǔ)設(shè)施”中對(duì)知識(shí)的形式化本體理論研究;武漢大學(xué)對(duì)地理本體的構(gòu)建及其在異構(gòu)系統(tǒng)的信息共享中的應(yīng)用進(jìn)行的研究。以上這些研究提出相應(yīng)的本體構(gòu)建方法,但基本是傳統(tǒng)的方式,在信息檢索時(shí)對(duì)地理空間事件的空間位置和個(gè)性化處理較弱。
構(gòu)建本體的方法是將確定的領(lǐng)域知識(shí)轉(zhuǎn)換成本體模型。領(lǐng)域知識(shí)既可直接來(lái)自領(lǐng)域?qū)<遥部蓙?lái)自領(lǐng)域資料或具體數(shù)據(jù)庫(kù)模型[10]。但由于領(lǐng)域知識(shí)與本體模型之間存在極大差異,完成這個(gè)轉(zhuǎn)換過(guò)程仍需要許多額外的工作。一般,本體構(gòu)建需要經(jīng)過(guò)以下幾個(gè)步驟:① 從領(lǐng)域知識(shí)中提取關(guān)鍵領(lǐng)域概念、關(guān)系及公理;② 利用提取的關(guān)鍵領(lǐng)域概念、關(guān)系及公理創(chuàng)建領(lǐng)域概念模型;③ 根據(jù)領(lǐng)域概念模型編輯本體模型;④ 根據(jù)領(lǐng)域知識(shí)更新的需要重復(fù)上述步驟以更新本體模型。其中,從領(lǐng)域知識(shí)中提取領(lǐng)域概念、關(guān)系、公理的過(guò)程最難以實(shí)施。因?yàn)轭I(lǐng)域知識(shí)是開(kāi)放性的,在沒(méi)有明確的任務(wù)之前,無(wú)法確定哪些概念、關(guān)系和公理需要提取[1,5]。
鑒于從領(lǐng)域知識(shí)直接構(gòu)建本體的缺點(diǎn),本文參考現(xiàn)有本體構(gòu)建方法,提出以任務(wù)為中心的本體構(gòu)建方法(圖2),通過(guò)任務(wù)來(lái)約束本體構(gòu)建的整個(gè)過(guò)程,此處的任務(wù)是指構(gòu)建本體的目的。任務(wù)中待處理的數(shù)據(jù)本身是要構(gòu)建本體的概念模型具體化的一部分,因此任務(wù)參與本體構(gòu)建的整個(gè)過(guò)程。以任務(wù)為中心的本體構(gòu)建方法仍從領(lǐng)域知識(shí)構(gòu)建地理空間事件本體,但將本體所應(yīng)用的數(shù)據(jù)庫(kù)作為約束[11],通過(guò)數(shù)據(jù)庫(kù)內(nèi)容確定地理空間事件本體的領(lǐng)域界限。此時(shí)本體中的主要內(nèi)容來(lái)自數(shù)據(jù)庫(kù),而數(shù)據(jù)庫(kù)中存在的數(shù)據(jù)是固定的,即數(shù)據(jù)庫(kù)所表示的語(yǔ)義信息存在領(lǐng)域界限[12]。所以,將數(shù)據(jù)庫(kù)模型轉(zhuǎn)換成本體模型基本無(wú)需考慮領(lǐng)域界限問(wèn)題。這種方法的優(yōu)點(diǎn)是在從領(lǐng)域知識(shí)構(gòu)建本體的過(guò)程中可以快速確定本體的領(lǐng)域界限。此外,在確定領(lǐng)域界限進(jìn)行地理空間事件相關(guān)信息檢索時(shí)無(wú)需檢索多個(gè)數(shù)據(jù)庫(kù)。試驗(yàn)所用的數(shù)據(jù)庫(kù)是一個(gè)整合了空間數(shù)據(jù)、屬性數(shù)據(jù)和專題數(shù)據(jù)于一體的數(shù)據(jù)庫(kù),相關(guān)數(shù)據(jù)表建立了映射關(guān)系,可以保障信息檢索的完備性。

圖2 以任務(wù)為中心的本體構(gòu)建方法Fig.2 Ontology construction method centered by the task
本體信息檢索一般有兩種用戶輸入方式:一是在用戶輸入查詢語(yǔ)句前讓用戶從已建本體中選擇合適的概念作為查詢關(guān)鍵詞,再利用這些關(guān)鍵詞進(jìn)行檢索;二是用戶輸入查詢語(yǔ)句后對(duì)其進(jìn)行自動(dòng)概念匹配,以查找其在本體中對(duì)應(yīng)的概念,再利用此概念作為條件實(shí)施查詢[5]。這兩種方法都存在缺點(diǎn),結(jié)合這兩種方法,在用戶輸入查詢條件后首先對(duì)其進(jìn)行自動(dòng)匹配,以獲得與條件相似的本體概念;再將這些概念作為概念匹配的候選項(xiàng)供用戶選擇。由于縮小了匹配概念的范圍,用戶更容易選擇滿足其查詢意圖的概念,將其作為最終的語(yǔ)義查詢條件。基于地理空間事件本體的檢索流程如下:
(1)用戶輸入查詢關(guān)鍵詞后,將其與本體中概念進(jìn)行匹配以確定關(guān)鍵詞的語(yǔ)義信息。這里概念為本體中的類和實(shí)例。匹配結(jié)果有三種情況,即精確匹配、無(wú)結(jié)果、相似匹配。無(wú)論哪種情況,都必須由用戶最終確定匹配結(jié)果。
(2)一旦用戶選擇了確切的本體概念,則這些概念作為最終查詢條件與目標(biāo)本體進(jìn)行匹配。
(3)如果不存在符合條件的本體信息,則需要對(duì)查詢條件進(jìn)行擴(kuò)展。擴(kuò)展的結(jié)果可能是通過(guò)本體推理獲得的相等概念或上位概念等。擴(kuò)展查詢可能需要重復(fù)進(jìn)行,直到獲取本體信息或無(wú)法擴(kuò)展為止。
(4)獲取本體中資源信息后,根據(jù)數(shù)據(jù)庫(kù)與本體的映射情況或用戶查詢要求,可以提取相應(yīng)的空間或?qū)n}數(shù)據(jù)。
(5)將最終查詢結(jié)果顯示給用戶。
本體概念匹配是為了將用戶輸入條件轉(zhuǎn)換成本體中已定義的標(biāo)準(zhǔn)概念,使得查詢條件具有語(yǔ)義信息[1,5]。在此基礎(chǔ)上系統(tǒng)才能執(zhí)行準(zhǔn)確的語(yǔ)義信息查詢。概念匹配的原理如下:假設(shè)用戶輸入關(guān)鍵詞為K,在本體中定義的概念集合為CO={Ci|i∈N};函數(shù)M(x)為某個(gè)詞匯x所表達(dá)的語(yǔ)義信息;對(duì)于Ci(i∈N),如果M(K)?M(Ci),那么概念Ci與關(guān)鍵詞K匹配;對(duì)于與關(guān)鍵詞K匹配的概念集合CM={Ck|k∈N}(CM?CO),如果存在min(M(C))(C∈CM),那么概念C為關(guān)鍵詞K的最終匹配。
在概念匹配中,難以確定的是某個(gè)關(guān)鍵詞所表達(dá)的語(yǔ)義信息,即函數(shù)M(x)。但無(wú)論采取哪種方法,仍需要由人來(lái)做最終評(píng)價(jià)[5]。因此,采取以用戶為中心的概念匹配方式。當(dāng)用戶輸入關(guān)鍵詞后,首先以詞形匹配方式從本體概念中提取相關(guān)概念供用戶選擇;用戶查看相應(yīng)概念的描述信息后決定哪個(gè)概念最符合其輸入關(guān)鍵詞所表達(dá)的語(yǔ)義信息,從而完成概念匹配過(guò)程。
在此模式下,不再使用已構(gòu)建的本體概念對(duì)目標(biāo)信息進(jìn)行語(yǔ)義標(biāo)注[13],而是將目標(biāo)信息創(chuàng)建為本體實(shí)例,也稱實(shí)例檢索。當(dāng)用戶使用關(guān)鍵詞檢索信息時(shí),先用本體中相應(yīng)的概念替換輸入條件,再通過(guò)替換后形成的概念條件與使用本體概念標(biāo)注過(guò)的目標(biāo)信息進(jìn)行匹配,即可完成語(yǔ)義層次的信息匹配。其中,使用本體概念替換輸入條件即為檢索系統(tǒng)理解用戶輸入語(yǔ)義信息的過(guò)程,將目標(biāo)信息創(chuàng)建成本體實(shí)例則為檢索系統(tǒng)理解目標(biāo)信息的語(yǔ)義信息的過(guò)程,如圖3所示。

圖3 本體信息檢索方法Fig.3 Retrieval method of ontology information
相對(duì)本體常規(guī)檢索,本體擴(kuò)展檢索(推理)可認(rèn)為是對(duì)前者的擴(kuò)展,即按照推理規(guī)則對(duì)查詢條件進(jìn)行擴(kuò)展,以獲得隱含信息。該功能常應(yīng)用于本體的語(yǔ)義查詢、一致性檢查、概念自動(dòng)分類等方面。這些應(yīng)用的一個(gè)共同特點(diǎn)是需要利用本體推理捕獲隱含信息,即在部分已知信息的前提下得出其所隱含的部分信息。本體的推理功能視其所描述的領(lǐng)域知識(shí)而定,如果本體中描述了空間關(guān)系及規(guī)則,那么就可以實(shí)施空間推理;否則,無(wú)法進(jìn)行空間推理[5,14]。
在擴(kuò)展查詢方式下,主要是對(duì)概念在某個(gè)或多個(gè)關(guān)系上進(jìn)行擴(kuò)展,以得到其擴(kuò)展概念。再以由該概念和擴(kuò)展概念形成的概念集合代替該概念作為檢索條件進(jìn)行檢索。最終得到的即為擴(kuò)展查詢的結(jié)果,即推理結(jié)果。原理如下:
假設(shè),用戶輸入關(guān)鍵詞對(duì)應(yīng)的本體概念集合C={Ci|i∈N}作為檢索條件,關(guān)系Rm(m∈N)是概念Ci與其他概念之間的某種關(guān)系,則條件概念Ci的檢索結(jié)果為Q(Ci)={X|Rm(X,Ci)或Rm(Ci,X),i∈N,j∈N};假設(shè),關(guān)系Rk(k∈N)是概念Ci與其他概念之間的某種可擴(kuò)展關(guān)系,概念Ci沿關(guān)系Rk擴(kuò)展后得到的擴(kuò)展概念為Cik,則概念Ci的擴(kuò)展查詢結(jié)果為QE(Ci)=(∪Q(Cik)),其中i∈N,k∈N,檢索條件C經(jīng)過(guò)擴(kuò)展后得到檢索結(jié)果為QE(C)=(∩QE(Ci)),其中i∈N。
信息檢索中最常用的概念關(guān)系有三種:概念間的層次關(guān)系,具體與一般的關(guān)系,整體與部分的關(guān)系[3,5]。這三種關(guān)系可以覆蓋信息檢索中的大部分情況,目前本體查詢擴(kuò)展主要也是考慮這三種關(guān)系。而在特定的地理信息檢索領(lǐng)域,空間關(guān)系則成為一種需要考慮的主要關(guān)系[15]。
在上文檢索方法指引下,進(jìn)行相應(yīng)的試驗(yàn),主要面向政府應(yīng)急管理部門,為其提供自然災(zāi)害事件相關(guān)信息的檢索工具。以地震災(zāi)害為例,當(dāng)用戶檢索災(zāi)害事件信息(主要以時(shí)間、地點(diǎn)和事件類型為檢索條件)時(shí),可以自動(dòng)提取其關(guān)心的信息,并進(jìn)行個(gè)性化展示。本文分別通過(guò)常規(guī)本體信息檢索和擴(kuò)展(推理)信息檢索兩種方式列舉實(shí)例說(shuō)明并進(jìn)行對(duì)比分析。
用戶輸入查詢關(guān)鍵詞后,即可執(zhí)行檢索操作,獲得檢索結(jié)果。圖4表示對(duì)新疆烏什縣發(fā)生的地震信息進(jìn)行檢索獲得的結(jié)果,用戶可查看與檢索條目相關(guān)的所有信息。圖5顯示與該地震相關(guān)的烏什地區(qū)經(jīng)濟(jì)統(tǒng)計(jì)信息。

圖4 發(fā)生在烏什地區(qū)的地震事件信息檢索結(jié)果Fig.4 Retrieval result of earthquake event happened in Wushi zone

圖5 與烏什地震相關(guān)的地區(qū)人口經(jīng)濟(jì)統(tǒng)計(jì)信息Fig.5 Statistical information of population and economy correlative to Wushi earthquake
由于地理空間事件本體中存在的地震事件概念與用戶查詢意圖完全相同,因此可以直接得到以上查詢結(jié)果。而當(dāng)本體中的地震事件概念與用戶的查詢意圖不完全相同時(shí),通過(guò)常規(guī)檢索方式則有可能得不到任何結(jié)果。例如,用戶輸入“自然災(zāi)害”作關(guān)鍵詞檢索時(shí),得不到相應(yīng)的結(jié)果。出現(xiàn)這種情況的主要原因在于構(gòu)建本體實(shí)例時(shí)只對(duì)其及其直接所屬類之間的關(guān)系進(jìn)行了聲明,卻未直接聲明其與該類的所有父類之間的關(guān)系。而類的層次關(guān)系恰恰隱含了這些實(shí)例同屬于其所有父類的這一事實(shí)。即“地震”實(shí)例同樣是“自然災(zāi)害”的實(shí)例。因此,當(dāng)用戶查詢自然災(zāi)害事件時(shí),地震事件應(yīng)該符合其查詢要求。
為解決上述問(wèn)題,可采用擴(kuò)展(推理)檢索方式,獲得符合要求的隱含信息[16]。當(dāng)用戶選擇“推理”檢索方式后,首先調(diào)用本體推理方法對(duì)本體模型實(shí)施一次全局推理,以明確聲明子類實(shí)例與該類所有父類之間的關(guān)系,此時(shí)可完全解決上述第一個(gè)問(wèn)題。當(dāng)用戶再次檢索發(fā)生在烏什的自然災(zāi)害事件信息,可得到如圖6所示結(jié)果,即可以得到烏什縣發(fā)生的地震信息,因?yàn)榈卣饘儆谧匀粸?zāi)害,而且對(duì)地點(diǎn)條件按照空間關(guān)系屬性進(jìn)行擴(kuò)展。此外,在推理檢索方式下,對(duì)用戶輸入“烏什”地點(diǎn)條件后,按空間關(guān)系“包括”進(jìn)行擴(kuò)展,可得到發(fā)生在整個(gè)阿克蘇地區(qū)內(nèi)的所有地震事件信息,以及與烏什縣鄰接的所有縣的自然災(zāi)害事件信息,如圖7所示。通過(guò)推理引擎,還可以提取所有與地震相關(guān)的人口經(jīng)濟(jì)數(shù)據(jù),生成一系列專題信息供用戶瀏覽。

圖6 推理檢索方式下可檢索到發(fā)生在烏什地區(qū)的自然災(zāi)害事件信息Fig.6 Retrieval result of disaster event happened in Wushi zone in a rational manner

圖7 推理檢索方式下可檢索到發(fā)生在新疆區(qū)域內(nèi)的所有地震事件信息Fig.7 All the retrieval result of earthquake event happened in Xinjiang zone in a rational manner
鑒于地理信息的海量容量和復(fù)雜特征,通過(guò)使用本文描述的地理信息檢索方法,從海量地理信息數(shù)據(jù)庫(kù)中智能提取與地理空間事件相關(guān)的信息,支持個(gè)性化的地理信息服務(wù),變被動(dòng)檢索為按事件主動(dòng)服務(wù)[1],可以有效提高政府部門辦公自動(dòng)化和輔助決策效率。
與傳統(tǒng)的檢索方法相比,本文提供的地理信息檢索方法具有以下優(yōu)點(diǎn):
(1)有效減少用戶操作次數(shù),可以使用戶的檢索效率提高2倍以上。
(2)地理空間事件相關(guān)信息的查全率、查準(zhǔn)率達(dá)80%以上。
(3)地理空間事件關(guān)聯(lián)信息類型全面,支持矢量、影像、視頻、文本、圖片等信息的處理與可視化。
由于地理對(duì)象存在復(fù)雜的拓?fù)潢P(guān)系、方位關(guān)系、層次關(guān)系等,地理信息檢索中常包含多種空間關(guān)系[2]。當(dāng)同時(shí)需要對(duì)多個(gè)空間關(guān)系實(shí)施查詢擴(kuò)展時(shí),問(wèn)題將會(huì)變得比較復(fù)雜,利用本體檢索技術(shù)為突發(fā)自然災(zāi)害、社會(huì)事件等輔助決策服務(wù)提供檢索功能還需要向深層次發(fā)展。
[1] LI B,LIU J P,SHI L H.Research on Geo-ontology Construction Based on Spatial Affairs[C]∥Proceedings of International Conference on Earth Observation Data Processing and Analysis.Wuhan:SPIE,2008:1-7.
[2] SUN Min.Geographical Information Ontology[J].Geography and Geographical Information Science,2004,20(3):6-11.(孫敏.地理信息本體論[J].地理與地理信息科學(xué),2004,20(3):6-11.)
[3] HUANG Maojun.Study on Key Issues and Application of Geo-ontology[M].Anhui:China Science and Technology University Press,2006:83-109.(黃茂軍.地理本體的關(guān)鍵問(wèn)題和應(yīng)用研究[M].安徽:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2006:83-109.)
[4] ABDELMOTY A I,SMART P D,JONES C B,et al.A Critical Evaluation of Ontology Languages for Geographic Information Retrieval on the Internet[J].Journal of Visual Languages and Computing,2005,16(4):331-358.
[5] WANG Zhenfeng.Geographical Event Retrieval Based on Ontology[D].Wuhan:Wuhan University,2009.(王振峰.基于本體的地理事件信息檢索[D].武漢:武漢大學(xué),2009.)
[6] MAEDCHE A,STAAB S.Ontology Learning for the Semantic Web[J].IEEE Intelligent Systems,Special Issue on Semantic Web,2001,16(2):72-79.
[7] LI Lin.Fundamental Geographical Information Semantic Analysis Based on Formal Ontology[J].Acta Geodaetica et Cartographica Sinica,2005,37(2):230-235.(李霖.基于形式本體的基礎(chǔ)地理信息語(yǔ)義分析[J].測(cè)繪學(xué)報(bào),2005,37(2):230-235.)
[8] AN Yang.Geo-ontology Construction and Compare in GIS[J].Geomatics and Information Science of Wuhan University,2006,31(12):1108-1111.(安楊.GIS中地理本體的建立與比較[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2006,31(12):1108-1111.)
[9] JONES C B,PURVES R S.Geographical Information Retrieval[J].International Journal of Geographical Information Science,2008,22(3):219-228.
[10] WEIKHM G.The Web in 2010:Challenges and Opportunities for Database Research.[M].Heidelberg:Springer-Verlag,2001:1-23.
[11] TRINKUNAS J,VASILECAS O.Building Ontologies from Relational Databases Using Reverse[C]∥Proceedings of the 2007International Conference on Computer Systems and Technologies.Bulgaria:IEEE,2007: 14-15.
[12] ?ELENG M,LACKLAVIK M,BALOGH Z,et al.RDB2Onto:Approach for Creating Semantic Metadata from Relational Database Data[C]∥Proceedings of the Ninth International Conference on Informatics.Bratislava:IEEE,2007:113-116.
[13] KIRYAKOV A,POPOV B,OGNYANOFF D,et al.Semantic Annotation,Indexing,and Retrieval[C]∥Proceedings of Web Semantics Science:Services and Agents on the World Wide Web.Florida:Springer,2004:49-79.
[14] MIRON A D,GENSEL J,VILLANOVA M O,et al.Towards the Geo-spatial Querying of the Semantic Web with ONTOAST[C]∥Proceedings of Web and Wireless Geographical Information Systems.Berlin:Springer,2007:121-136.
[15] W3C.OWL 2Web Ontology Language[EB/OL].[2009- 10-27].http:∥www.w3.org/TR/owl2-primer.
[16] LI B,LIU J P,SHI L H,et al.A Method of Constructing Geo-object ontology in Disaster System for Prevention and Decrease[C]∥Proceedings of International Symposium on Spatial Analysis,Spatial-temporal Data Modeling and Data Mining.Wuhan:SPIE,2009:1-9.