999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

不確定圖間α-β子圖同構(gòu)匹配算法

2011-01-01 00:00:00張一楠,鄒兆年,李建中
智能計算機(jī)與應(yīng)用 2011年5期

摘 要: 子圖查詢返回圖數(shù)據(jù)集合中所有包含查詢圖的數(shù)據(jù)圖。在查詢圖和數(shù)據(jù)圖同時為不確定性圖的前提下,提出了不確定圖間的期望子圖同構(gòu)定義和α-β子圖同構(gòu)匹配定義。不確定圖間的期望子圖同構(gòu)是確定圖上子圖同構(gòu)在概率圖模型上的直接推廣,不確定圖間α-β子圖同構(gòu)利用兩個限制閾值來衡量查詢圖和數(shù)據(jù)圖間的匹配質(zhì)量。文章詳細(xì)闡述了α-β子圖同構(gòu)匹配的語義特點(diǎn),分析了其和期望子圖同構(gòu)的聯(lián)系和差別,設(shè)計實(shí)現(xiàn)α-β子圖同構(gòu)匹配判定算法。

關(guān)鍵詞:

中圖分類號: TP393.1 文獻(xiàn)標(biāo)識碼: A 文章編號:2095-2163(2011)03-0001-04

Algorithm for α-β Subgraph Isomorphism Problem on Uncertain Graph

ZHANG Yinan, ZOU Zhaonian, LI Jianzhong

Abstract:Subgraph query in graph set returns data graph containing query graph. When the query graph and data graph both are uncertain, this paper proposes a definition of subgraph isomorphism between uncertain graphs and a definition of α-β subgraph isomorphism matching. Expectation subgraph isomorphism between uncertain graphs is a direct extension of subgraph isomorphism between deterministic graphs on probability graph model. There are two parameters α and β which are the thresholds to restrict quality of matching between query graph and data graph. This paper elaborates features of α-β subgraph isomorphism matching in detail, analyzes the differences between it and expectation subgraph isomorphism, meanwhile proposes α-β subgraph isomorphism matching decision algorithm.

Key words:Uncertain Graph; Expectation Subgraph Isomorphism; α-β Subgraph Isomorphism Matching

0 引言

確定圖數(shù)據(jù)挖掘和查詢處理等問題是圖數(shù)據(jù)研究領(lǐng)域熱點(diǎn)之一。子圖查詢返回圖數(shù)據(jù)集合中所有包含查詢圖的數(shù)據(jù)圖,這是圖數(shù)據(jù)集合上的一種基本操作。研究不確定圖數(shù)據(jù)上的子圖查詢具有重要意義。

針對不確定圖數(shù)據(jù),研究者已經(jīng)提出了許多相關(guān)算法[1-6]。例如,文獻(xiàn)[1]討論了不確定圖上關(guān)系查詢,文獻(xiàn)[2]定義不確定圖上top-k最大團(tuán)查詢。文獻(xiàn)[3]提出top-k子圖匹配查詢,該查詢的主要目標(biāo)是返回不確定圖數(shù)據(jù)集中最有可能包含指定查詢圖的k個不確定圖。

本文提出了不確定圖數(shù)據(jù)間子圖同構(gòu)匹配的兩種定義。期望子圖同構(gòu)是確定圖子圖同構(gòu)定義在概率模型下的直接擴(kuò)展。期望子圖同構(gòu)通過比較φ的概率期望值是否超過指定閾值進(jìn)行同構(gòu)判定。期望子圖同構(gòu)的概率意義十分直觀,但存在計算代價巨大和匹配結(jié)果描述復(fù)雜兩點(diǎn)不足。為此本文進(jìn)一步提出α-β子圖同構(gòu)定義和判定算法。不確定圖間α-β子圖同構(gòu)判定利用兩個限制閾值來替代期望子圖同構(gòu)判定中的單一限定閾值。

1 不確定圖數(shù)據(jù)模型

定義1:不確定圖G為五元組(V,E,∑,l,P)。V是G的頂點(diǎn)集; E是G的全部邊的集合,G中任意兩頂點(diǎn)u和v間至多存在一條邊,表示為uv或vu;∑為頂點(diǎn)標(biāo)號集; l:V→∑是標(biāo)號函數(shù),該函數(shù)計算圖G各頂點(diǎn)的標(biāo)號,對頂點(diǎn)集V中任意頂點(diǎn)v,其標(biāo)號為lv=l(v);P:E→(0,1]是邊存在可能性函數(shù),對E中任意邊e,P(e)是e實(shí)際存在的概率。不確定圖G蘊(yùn)含一組確定圖。

根據(jù)P(e)值是否為1,可劃分邊集E為彼此不相交的子集Ec={e∈E|P(e)=1}和Euc={e∈E|0<P(e)<1}。集Ec稱為G的確定邊集,集Euc稱為G的不確定邊集, 二集合滿足Ec∩Euc=且E=Ec∪Euc。冪集2是Euc所有子集的集族。對應(yīng)每個E'∈2,不確定圖G=(V,E,∑,l,P)蘊(yùn)含確定圖I=(VI,EI,∑I,lI),其中VI=V,EI=Ec∪E',∑I=∑且lI=l。G蘊(yùn)含I記為G?圯I,則“G蘊(yùn)含I”的概率P(G?圯I)可依下述公式(1)進(jìn)行計算:

P(G?圯I)=∏P(e)#8226;∏(1-P(e)) (1)

2 不確定圖間的期望子圖同構(gòu)判定

已知不確定圖G1和G2,設(shè)G1實(shí)際中以確定圖I1形式存在,G2實(shí)際中以確定圖I2形式存在。“G1子圖同構(gòu)于G2”當(dāng)且僅當(dāng)I1子圖同構(gòu)于I2。因?yàn)椋桑焙停桑彩俏粗模?I1可能是s(G1)中任一確定圖,I2可能是s(G2)中任一確定圖,所以G1是否子圖同構(gòu)于G2無法簡單用“是”或“否”回答。依據(jù)公式(1),可計算G1子圖同構(gòu)于G2的概率P(G1G2),計算公式(2)如下:

P(G1G2)=∑P(G1?圯I1)

P(G2I2)φ(I1,I2) (2)

函數(shù)φ(I1,I2)值域?yàn)閧0,1},如果I1子圖同構(gòu)于I2,則φ(I1,I2)值為1,否則φ(I1,I2)值為0。不難發(fā)現(xiàn), P(G1G2)是φ(I1,I2)的概率期望值。根據(jù)該期望值可定義不確定圖期望子圖同構(gòu)。

定義2:已知不確定圖G1和G2,期望閾值δ∈(0,1], G1期望子圖同構(gòu)于G2當(dāng)且僅當(dāng)P(G1G2)?叟δ,記為G1 δG2。

期望子圖同構(gòu)判定算法計算代價巨大。設(shè)G1和G2的不確定邊數(shù)目分別為N1和N2,則|s(G1)|×|s(G2)|等于2。除計算代價外,限制期望子圖同構(gòu)應(yīng)用的另一個問題是匹配結(jié)果描述困難。許多實(shí)際應(yīng)用要求獲知圖G1和G2中節(jié)點(diǎn)和/或邊間的匹配關(guān)系。對于期望子圖同構(gòu),最壞情況下,用戶將得到2個不同的匹配結(jié)果,伴隨每個匹配結(jié)果是該匹配成立的概率。

3 不確定圖間的α-β子圖同構(gòu)判定

3.1 α-β子圖同構(gòu)定義

定義3:不確定圖G的不確定邊集為Euc,函數(shù)α:2→[0,1]稱為誤差函數(shù),對Euc的任一子集E△,誤差函數(shù)值α(E△)按下述公式(3)計算:

1-∏(1-P(e))E△≠

定義4:不確定圖G的邊集為E,函數(shù)β:2E→(0,1]稱為強(qiáng)度函數(shù),對E的任一子集EΩ,強(qiáng)度函數(shù)值β(EΩ)按下述公式(4)計算:

β(EΩ)= (4)

為簡化表述作以下規(guī)定。Imax(G)表示不確定圖G蘊(yùn)含的最大確定圖,如果G=(V,E,∑,l,P),那么Imax(G)=(V,E,∑,l)。E△是G不確定邊集Euc的子集,Imax(G)-E△表示在圖Imax(G)里刪除E△中全部邊后形成的確定圖。f(E1)表示E2中所有對應(yīng)邊的集合,即f(E1)={f(e)|e∈E1}。

定義5:已知不確定圖G1和G2,設(shè)G1的不確定邊集為Euc;如果存在E△Euc和映射函數(shù)f同時滿足:

(1) Imax(G1)-E△子圖同構(gòu)于Imax(G2),f為同構(gòu)映射函數(shù);

(2) α(E△)αmax,常數(shù)αmax稱為誤差閾值,αmax∈[0,1];

(3) β(f(E1))?叟βmin,常數(shù)βmin稱為強(qiáng)度閾值,βmin∈[0,1];

那么G1“α-β子圖同構(gòu)于”G2,記為G1α,βG2。

3.2 α-β子圖同構(gòu)的語義

條件(1)“Imax(G1)-E△子圖同構(gòu)于Imax(G2)”可表述為:子樣本空間s(G1,E△)中每個圖都是確定圖Imax(G2)的子圖。集合s(G1)是被G1蘊(yùn)含的所有確定圖的集合,E△將s(G1)分為s(G1,E△)和s(G1)\ s(G1,E△),其中,s(G1,E△)={I|IImax(G1)-E△}。

條件(2)“α(E△)”對E△進(jìn)行限制,以保證“不確定圖G1 蘊(yùn)含子樣本空間s(G1,E△)”的概率P(G1?圯s(G1,E△))足夠大。參照公式(3), P(G1?圯s(G1,E△))按下述公式(6)計算。

P(G1?圯s(G1,E△))=∑P(G1?圯I)?叟1-α(E△) (6)

條件(3)“β(f(E1))?叟βmin”對同構(gòu)匹配函數(shù)f進(jìn)行限制,以保證不確定圖G2蘊(yùn)含確定圖Imax(G1)-E△的概率P(G2?圯Imax(G1)-E△)足夠大。所以Imax(G2)的以f(E1)為邊集的子圖I'(f)和Imax(G1)-E△彼此同構(gòu)。對每個確定的映射函數(shù)f,下述公式成立:

P(G2?圯Imax(G1)-E△) ?叟∏P(e)=β(f(E)) (7)

已知不確定圖G1在閾值αmax和βmin限制下α-β子圖同構(gòu)于G2,下述定理1揭示了α-β子圖同構(gòu)和期望子圖同構(gòu)定義的聯(lián)系。

定理1:如果不確定圖G1在閾值αmax和βmin限制下子圖同構(gòu)于G2,那么P(G1G2)?叟δ(αmax,βmin),其中,δ(αmax,βmin)等于(1-αmax)βminM, M等于確定圖Imax(G1)-E△邊數(shù)。

不確定圖G1“α-β子圖同構(gòu)”于G2,則圖G1在現(xiàn)實(shí)中子圖同構(gòu)于G2的概率P(G1G2)大于等于δ(αmax,βmin)。如定義2所示,期望子圖同構(gòu)使用單一常數(shù)δ作為限定閾值;α-β子圖同構(gòu)使用兩個常數(shù)αmax和βmin作為替代δ的限定閾值。α-β子圖同構(gòu)具有概率意義,概括表述為:如果G1“α-β子圖同構(gòu)”于G2且δ(αmax,βmin)不小于期望閾值δ,那么圖G1期望子圖同構(gòu)于G2。

α-β子圖同構(gòu)計算代價較期望子圖同構(gòu)定義小很多。在不確定圖G1和G2間進(jìn)行α-β子圖同構(gòu)判定的計算代價接近于在確定圖Imax(G1)和Imax(G2)間進(jìn)行子圖同構(gòu)判定的代價。α-β子圖同構(gòu)的匹配結(jié)果描述簡單,便于用戶理解和使用。匹配結(jié)果可用二元組(E△,f)表示。α-β子圖同構(gòu)具有實(shí)用意義。在一些應(yīng)用中,查詢圖的不確定性反映了用戶對查詢圖中各種元素存在的可能性的期望。在這種情況下,用戶傾向于利用查詢算法在數(shù)據(jù)圖G2上找到查詢圖G1的一個有意義的匹配,而不只是用一個閾值告知匹配成功的概率有多大。在查詢圖G1上引入不確定性的可能原因是用戶允許在查詢過程中忽略G1的某些因素,而頂點(diǎn)或邊的存在概率值恰恰反映了用戶對這種“忽略”行為的容忍程度。

4 α-β子圖同構(gòu)判定算法

不確定圖α-β子圖同構(gòu)判定算法是對確定圖子圖同構(gòu)算法的推廣,本文以確定圖上常用子圖同構(gòu)判定算法ullman算法為基礎(chǔ),設(shè)計實(shí)現(xiàn)不確定圖α-β子圖同構(gòu)判定算法如下:

AdvUmAlgo(G1,G2,H,F,d,α,β)

Input:Uncertain query graph G1 with N1 nodes

Uncertain data graph G2 with N2 nodes

ArrayH[N1], H[i] initializedby 0,1iN1

ArrayF[N1], F[i] initializedby 0,1iN2

Integerd, initializedby 1 ,

α,initialized by 0

β,initialized by 0

Output:boolean:G1α,βG2

(1)if d>N1 then

(2) if β<βmin then returnfalse

(3) else return true

(4) end if

(5)end if

(6)for each 1kN2∧F[k]=0 do

(7) if l(d)≠l(k) then goto line6

(8) calculate and update α

(9) if α>αmax then

(10) recover α and goto line6

(11) end if

(12) H[d]:=k

(13) F[k]:=1

(14) calculate and update β

(15) ifAdvUmAlgo(G1,G2,H,F,d+1)then

(16) return true

(17) end if

(18) F[k]:=0

(19) recover α and β

(20)end for

(21)return false

算法AdvUmAlgo是先深策略搜索狀態(tài)空間,以遞歸調(diào)用的方式實(shí)現(xiàn)。該算法包含七個輸入,分別是:不確定查詢圖G1,設(shè)G1頂點(diǎn)數(shù)等于N1;不確定數(shù)據(jù)圖G2,設(shè)G2頂點(diǎn)數(shù)等于N2;整數(shù)d初始化為1,始終等于遞歸深度;α初始化為0,計算方法參公式(3);β初始化為0,計算方法參公式(4);數(shù)組H記錄圖G1頂點(diǎn)和G2頂點(diǎn)匹配關(guān)系, H[i]=k當(dāng)且僅當(dāng)在當(dāng)前匹配中G1的頂點(diǎn)i對應(yīng)G2的頂點(diǎn)k;數(shù)組F記錄 G2頂點(diǎn)占用情況,F[k]=1說明G2的頂點(diǎn)k被當(dāng)前匹配占用,即存在H[i]=k,其中,1id-1,F[k]=0說明k尚未匹配G1中的任何頂點(diǎn)。

在深度為d的遞歸調(diào)用開始前,G1的前d-1個頂點(diǎn)已經(jīng)匹配完畢,頂點(diǎn)對應(yīng)關(guān)系存儲在數(shù)組H的前d-1位中。算法開始,首先檢查迭代深度是否超過G1頂點(diǎn)數(shù),如果d>N1,說明匹配完成,在這種情況下,如果β小于閾值βmin,那么返回上層繼續(xù)進(jìn)行搜索,否則返回真值。如果d<N1,則為G1的頂點(diǎn)d在G2中尋找匹配頂點(diǎn)。與ullman算法的主要差別在于搜索剪枝條件的不同:在ullman算法中,如果當(dāng)前數(shù)據(jù)圖中沒有合適頂點(diǎn)與查詢圖中當(dāng)前節(jié)點(diǎn)相匹配,那么進(jìn)行搜索剪枝并回溯。在不確定圖上的“α-β”子圖同構(gòu)匹配的精確算法中,如果當(dāng)前數(shù)據(jù)圖中沒有合適頂點(diǎn)與查詢圖中當(dāng)前節(jié)點(diǎn)相匹配,則嘗試忽略查詢圖中當(dāng)前節(jié)點(diǎn)的若干鄰接邊。

5 實(shí)驗(yàn)

本文通過實(shí)驗(yàn)分析α-β子圖同構(gòu)判定算法,測試判定算法在不同規(guī)模圖數(shù)據(jù)和不同閾值限制下的表現(xiàn),主要關(guān)注算法的執(zhí)行時間。因?yàn)楝F(xiàn)有不確定圖子圖匹配查詢方法中查詢圖基本為確定圖,所以實(shí)驗(yàn)無法利用這些方法進(jìn)行對比實(shí)驗(yàn),但實(shí)驗(yàn)對比優(yōu)化前后的α-β子圖同構(gòu)判定算法。

本文提出的算法采用標(biāo)準(zhǔn)C++和STL庫實(shí)現(xiàn),使用gcc/g++編譯器編譯,所有實(shí)驗(yàn)均在P4 1.7GHz/2G RAM的機(jī)器上進(jìn)行。

5.1 數(shù)據(jù)集和參數(shù)設(shè)定

不確定圖數(shù)據(jù),包括查詢圖和數(shù)據(jù)圖,以上述AIDS數(shù)據(jù)集為基礎(chǔ)生成,其基本思想是隨機(jī)為數(shù)據(jù)集中確定圖的部分邊添加存在概率作為權(quán)值。實(shí)驗(yàn)中用到五組不確定查詢圖Q8、Q12、Q16、Q20和Q24,Qn包含100個圖,每個圖的邊數(shù)都是n。不確定圖數(shù)據(jù)間α-β子圖同構(gòu)主要實(shí)驗(yàn)參數(shù)為αmax和βmin,實(shí)驗(yàn)在三種不同參數(shù)條件下進(jìn)行測試,三組設(shè)定參數(shù)分別為(αmax,βmin)=(0.8,0.4)、(αmax,βmin)=(0.2,0.4)和(αmax,βmin)=(0.2,0.8)。第二組參數(shù)作為參數(shù)的一般設(shè)定值;對比第一組和第二組參數(shù)設(shè)定可分析αmax與算法性能效果的關(guān)系;對比第三組和第二組參數(shù)設(shè)定可以分析βmin對判定算法性能的影響。

5.2 實(shí)驗(yàn)分析

實(shí)驗(yàn)對比α-β子圖同構(gòu)判定算法在三種不同條件下的執(zhí)行時間,結(jié)果如圖1所示。圖中橫軸標(biāo)明查詢圖規(guī)模(查詢圖邊數(shù)),每組查詢圖包含100個查詢圖;圖中縱軸為判定算法在不同查詢圖和不同參數(shù)條件下的平均執(zhí)行時間。第1組參數(shù)設(shè)定為(αmax=0.8,βmin=0.4),第2組參數(shù)設(shè)定為(αmax=0.2,βmin=0.4),第 3組參數(shù)設(shè)定為(αmax=0.2,βmin=0.8)。

通過分析圖1可知:在查詢圖邊數(shù)相同條件下,判定算法在第1組參數(shù)下的平均執(zhí)行時間大于第2組參數(shù)。在強(qiáng)度閾值βmin相同的條件下,誤差閾值αmax越小,則算法的執(zhí)行時間越短。在誤差閾值αmax相同的條件下,強(qiáng)度閾值βmin越大,則算法的執(zhí)行時間越長。

圖2為優(yōu)化前后的α-β子圖同構(gòu)判定算法的平均執(zhí)行時間。該項(xiàng)實(shí)驗(yàn)將參數(shù)固定為具有代表性的第二組(αmax=0.2,βmin=0.4)。通過分析圖2可知,判定算法在搜索順序進(jìn)行優(yōu)化以后執(zhí)行時間大幅縮短。

6 結(jié)束語

子圖同構(gòu)判定問題是NP完全問題,將不確定性引入子圖同構(gòu)匹配進(jìn)一步增大了判定算法的計算代價。不確定圖間α-β子圖同構(gòu)判定較之于期望子圖同構(gòu)判定具有較小的計算代價,但時間上界仍是指數(shù)級的。為將不確定圖數(shù)據(jù)上的子圖查詢或與之類似的其他查詢在多項(xiàng)式時間內(nèi)完成,最為可行的方法是結(jié)合實(shí)際應(yīng)用背景在圖數(shù)據(jù)匹配的語義層面尋求突破。

參考文獻(xiàn):

[ 1 ] DALVI N N,SUCIU D: Efficient query evaluation on proba-

bilistic databases[C]// VLDB J. 16(4): 52544 (2007).

[ 2 ] SOLIMAN M A,ILYAS I F, Kevin Chen-Chuan Chang: Top-

k Query Processing in Uncertain Databases[C]// ICDE 2007:

896-905.

[ 3 ] 張碩,高宏,李建中. 不確定圖數(shù)據(jù)庫中高效查詢處理. 計算

機(jī)學(xué)報[J]. 2009, 32(10):2066-2079.

[ 4 ] 周傲英,金澈清,王國仁,等. 不確定性數(shù)據(jù)管理技術(shù)研究綜述.

計算機(jī)學(xué)報[J]. 2009, 32(1):1-16.

[ 5 ] GAO Hong, ZHANG Wei. Research status of the management

of uncertain graph data. Communications of the China Comput-

er Federation[C]// 2009, 5(4):31-36.

[ 6 ] HINTSANEN P,TOIVONEN H. Finding reliable subgraphs fr-

om large probabilistic graphs[C]// Data Min. Knowl. Discov.

2008,17(1):23.

主站蜘蛛池模板: 九九这里只有精品视频| 国产精品黑色丝袜的老师| 狠狠色综合久久狠狠色综合| 亚洲天堂久久久| 日本不卡在线播放| 亚洲日本中文综合在线| 在线精品视频成人网| 日韩第九页| 亚洲天堂网在线视频| 综合久久五月天| 免费xxxxx在线观看网站| 国产美女无遮挡免费视频| 免费jizz在线播放| 午夜啪啪网| 久久夜色撩人精品国产| 国产在线精品人成导航| 四虎国产精品永久一区| 91精品国产综合久久不国产大片| 成年人免费国产视频| 手机永久AV在线播放| 一区二区三区四区精品视频| 久久99热66这里只有精品一| 一本大道无码高清| 亚洲va视频| 国产素人在线| 亚洲精品色AV无码看| 欧美三级不卡在线观看视频| 国产丝袜啪啪| 在线日韩一区二区| 99re在线视频观看| 狠狠色综合网| 欧美啪啪视频免码| 国产亚洲精品自在久久不卡| 亚洲综合九九| 亚国产欧美在线人成| 欧美在线精品一区二区三区| 国产精品综合色区在线观看| 天堂成人av| 欧美笫一页| 91网红精品在线观看| 国产91精品最新在线播放| 人妻21p大胆| 91热爆在线| 久久伊人操| 国产乱人伦精品一区二区| 免费毛片a| 国产精品九九视频| 人人艹人人爽| 婷婷色中文网| www.国产福利| 午夜精品一区二区蜜桃| 欧美性爱精品一区二区三区 | 最新国产成人剧情在线播放| 免费看黄片一区二区三区| 国产成人艳妇AA视频在线| 999国产精品| 在线va视频| 日韩成人在线视频| 一边摸一边做爽的视频17国产 | 国产97视频在线观看| 亚洲国语自产一区第二页| 日韩一区二区在线电影| 永久免费av网站可以直接看的 | 国产欧美日韩另类精彩视频| 成年看免费观看视频拍拍| 久久综合国产乱子免费| 特级精品毛片免费观看| 波多野结衣爽到高潮漏水大喷| 国产国产人成免费视频77777| 亚洲精品日产精品乱码不卡| 国产屁屁影院| 欧美黄网在线| 国产欧美日韩18| 国产精品福利社| 国产日韩欧美在线视频免费观看 | 四虎永久免费地址| 国产麻豆永久视频| 日韩欧美国产另类| 欧美精品1区| 熟女视频91| 国产人免费人成免费视频| 视频一区视频二区中文精品|