999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于決策樹的選擇查詢算法

2012-11-15 22:25:34鄧冬梅譚鍵龍
中國(guó)科技信息 2012年3期
關(guān)鍵詞:關(guān)聯(lián)

鄧冬梅 譚鍵龍

1. 湖南師范大學(xué)計(jì)算機(jī)教學(xué)部,湖南 長(zhǎng)沙 410081 2. 中國(guó)科學(xué)院計(jì)算技術(shù)研究所,北京 100190

一種基于決策樹的選擇查詢算法

鄧冬梅1譚鍵龍2

1. 湖南師范大學(xué)計(jì)算機(jī)教學(xué)部,湖南 長(zhǎng)沙 410081 2. 中國(guó)科學(xué)院計(jì)算技術(shù)研究所,北京 100190

本文提出了一種基于決策樹的查詢索引結(jié)構(gòu),筆者稱之為查詢決策樹。查詢決策樹不僅利用了查詢內(nèi)各個(gè)謂詞間的合取關(guān)系,還充分利用了單個(gè)屬性上的謂詞索引。

數(shù)據(jù)流管理系統(tǒng);查詢決策樹

引言

流動(dòng)數(shù)據(jù)處理長(zhǎng)期以來沒有受到足夠重視,目前并不存在像數(shù)據(jù)庫管理系統(tǒng)一樣的成熟的、通用的數(shù)據(jù)流處理平臺(tái)。但隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和廣泛應(yīng)用,國(guó)際、國(guó)內(nèi)對(duì)數(shù)據(jù)流的研究已逐步得到重視。

1.選擇多查詢處理及其分類

數(shù)據(jù)流管理系統(tǒng)和傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)最重要的區(qū)別之一是持續(xù)查詢?cè)跀?shù)據(jù)流管理系統(tǒng)中的重要地位,而選擇查詢是數(shù)據(jù)流持續(xù)查詢中最基本、也是最重要和使用得最廣泛的一類查詢。

直觀的說,一個(gè)選擇查詢就是一個(gè)過濾條件,當(dāng)流數(shù)據(jù)到達(dá)時(shí),數(shù)據(jù)流管理系統(tǒng)查詢處理引擎在選擇查詢上進(jìn)行條件測(cè)試,如果條件測(cè)試的結(jié)果為真,我們說這個(gè)選擇查詢得到滿足(或者說這個(gè)選擇查詢得到匹配)。

數(shù)據(jù)流管理系統(tǒng)中一般都注冊(cè)有大量的選擇查詢。數(shù)據(jù)流S上的選擇多查詢處理是指:給定S上的選擇查詢集合Qset{Q1,Q2,…,Qn},當(dāng)S的一個(gè)數(shù)據(jù)元組t到達(dá)時(shí),返回查詢集合中所有取值為真的查詢的編號(hào)。

Qset也可用表1直觀地表示,其中謂詞P[i, j]是查詢Qi在屬性aj上的謂詞。

表1 選擇多查詢的表格表示

一個(gè)流數(shù)據(jù)元組到達(dá)后,按照多查詢處理算法在表1中的處理順序,已有的多查詢處理算法可分為3類:

1.1 行順序處理方法:當(dāng)一個(gè)數(shù)據(jù)流元組到達(dá)后,多查詢處理引擎逐行(逐查詢)處理表1中各查詢;

相對(duì)于傳統(tǒng)的人際互動(dòng)、書信來往等交往方式,新媒體環(huán)境下人們之間的交往更加多樣化。除了傳統(tǒng)交往方式外,QQ、BBS、微博、微信等使大學(xué)生人際之間的交往更加多樣和便捷。

1.2 列順序處理方法:當(dāng)一個(gè)數(shù)據(jù)流元組到達(dá)后,多查詢處理引擎逐列(逐屬性)處理表1中的查詢;

1.3 行列交錯(cuò)處理方法:當(dāng)一個(gè)數(shù)據(jù)流元組到達(dá)后,多查詢處理引擎按照行(查詢)、列(屬性)交錯(cuò)的順序處理表1中的查詢。

2.基于決策樹的選擇查詢算法

本文提出一種新的數(shù)據(jù)流選擇多查詢的處理算法,這種多查詢的索引具有決策樹形式的結(jié)構(gòu),筆者稱之為數(shù)據(jù)流多查詢的決策樹索引算法。多查詢的決策樹索引同時(shí)利用了單個(gè)屬性上的謂詞索引和單個(gè)查詢內(nèi)各屬性謂詞間的合取關(guān)系,因而能更大程度減少冗余計(jì)算。各種單屬性上的謂詞索引能很容易集成到多查詢的決策樹索引中。這種多查詢的決策樹處理算法被歸入到行列交錯(cuò)處理算法類別。

2.1 查詢決策樹的構(gòu)造

設(shè)數(shù)據(jù)流S用模式R(a1:Ω 1, a2: Ω 2, …, am: Ω m)描述,Qset{Q1,Q2,…,Qn}是在S上定義的查詢集合,下面討論如何在Qset上建立基于決策樹的查詢索引。

查詢決策樹是以自上向下的方式構(gòu)造的,在構(gòu)造的過程當(dāng)中,每個(gè)結(jié)點(diǎn)關(guān)聯(lián)一個(gè)查詢集合和一個(gè)屬性集合,查詢集合是以當(dāng)前結(jié)點(diǎn)為根結(jié)點(diǎn)的子樹所索引的查詢子集,屬性集合是當(dāng)前結(jié)點(diǎn)可選的劃分屬性集合。構(gòu)造從決策樹的根結(jié)點(diǎn)開始,根結(jié)點(diǎn)關(guān)聯(lián)的查詢集合包含了原始查詢集合Qset中的所有查詢,根結(jié)點(diǎn)關(guān)聯(lián)的屬性集合包含了數(shù)據(jù)流模式S的所有屬性。利用一個(gè)先進(jìn)后出的棧(stack)來保存將要被擴(kuò)展的結(jié)點(diǎn),及其關(guān)聯(lián)的查詢集合和屬性集合。初始化棧時(shí),把根結(jié)點(diǎn)及其關(guān)聯(lián)的查詢集合和屬性集合壓入棧,然后每次從棧的頭部彈出一個(gè)待擴(kuò)展結(jié)點(diǎn),將這個(gè)結(jié)點(diǎn)擴(kuò)展,再將擴(kuò)展得到的新結(jié)點(diǎn)壓入棧,重復(fù)這個(gè)過程直到棧變?yōu)榭諡橹埂J褂脳肀4娲龜U(kuò)展結(jié)點(diǎn),按照先進(jìn)后出的順序依次擴(kuò)展每個(gè)結(jié)點(diǎn),是一種深度優(yōu)先的樹構(gòu)造策略。

假設(shè)當(dāng)前從棧頂彈出的待擴(kuò)展結(jié)點(diǎn)關(guān)聯(lián)的查詢集合為Qset{Q1,Q2,…,Qn},屬性集合為Aset{a1, a2, …, am}。從Aset中選擇一個(gè)屬性做為劃分屬性。預(yù)先對(duì)數(shù)據(jù)流的各屬性賦以一個(gè)序號(hào),結(jié)點(diǎn)擴(kuò)展時(shí)總是選擇Aset中序號(hào)最小的屬性做為劃分屬性。

條件(I)和(II)保證了,aj的任何一個(gè)可能取值落入且僅僅落入某一個(gè)值域子集σ k(1≤k≤s)。條件(III)保證了,對(duì)于任意值域子集σk,任意查詢?cè)趧澐謱傩陨系闹^詞P[i,j]確定的值域子集ωi要么完全包含σk,要么σk和不相交。等價(jià)的描述是,對(duì)于σk(1≤k≤s)中的任意兩個(gè)不同值x和y,P[i,j](x)=P[i,j](y) (" 1≤i≤n, 1≤j≤m)。在滿足上面三個(gè)條件的前提下,應(yīng)使s盡量的小。

圖1 查詢決策樹結(jié)點(diǎn)擴(kuò)展示意圖

在給定屬性aj的值域Ω上,定義關(guān)系R:對(duì)于任意的x, y,xRy當(dāng)切僅當(dāng)對(duì)所有的1≤i≤n有P[i,j](x)=P[i,j](y)。容易證明R是Ω上的一個(gè)等價(jià)關(guān)系,而σ1,σ 2,……,σs則是由這個(gè)等價(jià)關(guān)系劃分出的一族等價(jià)類。

接下來,為當(dāng)前結(jié)點(diǎn)創(chuàng)建s個(gè)子結(jié)點(diǎn),每個(gè)子結(jié)點(diǎn)分別對(duì)應(yīng)于一個(gè)值域子集。每個(gè)子結(jié)點(diǎn)都和屬性集合Aset{aj}關(guān)聯(lián),其中aj是當(dāng)前結(jié)點(diǎn)的劃分屬性。每個(gè)子結(jié)點(diǎn)初始時(shí)都和一個(gè)空的查詢集合關(guān)聯(lián),然后對(duì)于Qset中的每個(gè)查詢Qi和每個(gè)值域子集σk,如果P[i, j]完全包含了σk,則將Qi插入到第k個(gè)子結(jié)點(diǎn)關(guān)聯(lián)的查詢集合中。后面用Qset’[k]表示當(dāng)前結(jié)點(diǎn)第k個(gè)子結(jié)點(diǎn)關(guān)聯(lián)的查詢集合。注意,一個(gè)查詢可能被插入到多個(gè)子結(jié)點(diǎn)所關(guān)聯(lián)的查詢集合中。然后,這新建立的s個(gè)子結(jié)點(diǎn)及其關(guān)聯(lián)的屬性集合和查詢集合被壓入棧頂。每個(gè)子結(jié)點(diǎn)關(guān)聯(lián)的屬性集合為Aset{aj},也就是說,每個(gè)子結(jié)點(diǎn)所關(guān)聯(lián)的屬性集合大小至少比其父結(jié)點(diǎn)關(guān)聯(lián)的屬性集合少1,因此,構(gòu)造的查詢決策樹的最大深度為M,這里M是數(shù)據(jù)流屬性的個(gè)數(shù)。

最后,為當(dāng)前結(jié)點(diǎn)關(guān)聯(lián)的查詢集合Qset在劃分屬性aj的謂詞上建立匹配器matcher,matcher是劃分屬性上的謂詞索引。利用matcher,對(duì)于給定的劃分屬性值,能快速計(jì)算它落入了哪個(gè)值域子集。各種單屬性上的謂詞索引都可以用來建立matcher。

給一個(gè)查詢決策樹結(jié)點(diǎn)擴(kuò)展的簡(jiǎn)單例子。假設(shè)當(dāng)前結(jié)點(diǎn)關(guān)聯(lián)的查詢集合為:Q1:(50

2.2 查詢決策樹的匹配算法

利用查詢決策樹,搜索給定的數(shù)據(jù)流元組T滿足了哪些查詢的匹配算法,是一個(gè)從樹的根結(jié)點(diǎn)往下遍歷直到某個(gè)葉結(jié)點(diǎn)的過程。初始化時(shí)將匹配結(jié)果查詢ID集合Rset置為空,結(jié)點(diǎn)指針P指向查詢決策樹的根結(jié)點(diǎn),那么遞歸的匹配算法可以描述如下:

match (P, Rset, T) //P為指向當(dāng)前訪問結(jié)點(diǎn)的指針,Rset為存放匹配結(jié)果查詢ID的集合, T為待匹配的數(shù)據(jù)流元組

匹配算法中,訪問每個(gè)非葉結(jié)點(diǎn)時(shí),用數(shù)據(jù)元組的劃分屬性值搜索當(dāng)前結(jié)點(diǎn)的謂詞索引,如果元組的劃分屬性值落入了第k個(gè)值域子集,那么將搜索以第k個(gè)子結(jié)點(diǎn)為根的子樹,而直接跳過了其它的子結(jié)點(diǎn)及其子樹。因此,查詢內(nèi)各屬性謂詞間的合取關(guān)系得到了充分利用。

匹配算法最多需要搜索M個(gè)結(jié)點(diǎn)的謂詞索引,這里M是查詢決策樹的最大深度,即數(shù)據(jù)流屬性的個(gè)數(shù)。如果每個(gè)結(jié)點(diǎn)中的謂詞索引的搜索時(shí)間不大于O(f(N)),其中N是查詢的個(gè)數(shù),f(N)為單屬性謂詞索引的搜索時(shí)間復(fù)雜度上界,那么上述匹配算法的最壞情況時(shí)間復(fù)雜度為O(Mf(N))。一般情況下,常用的單屬性上的謂詞索引能滿足f(N) = O(log(N))。多查詢行順序處理算法、列順序處理算法和行列交錯(cuò)處理算法最壞情況下的時(shí)間復(fù)雜度都為O(MN),而查詢決策樹O(Mlog(N))的最壞情況時(shí)間復(fù)雜度顯然更適合實(shí)時(shí)數(shù)據(jù)流應(yīng)用。

3.結(jié)語

查詢決策樹不僅使用了單個(gè)屬性上的謂詞索引,各種單屬性上的謂詞很容易集成到查詢決策樹結(jié)構(gòu)中,而且還充分利用了查詢內(nèi)各謂詞間的合取關(guān)系,相對(duì)于以前的各種多查詢處理算法,能更有效減少冗余計(jì)算。

最后在一個(gè)模擬的網(wǎng)絡(luò)入侵檢測(cè)環(huán)境下測(cè)試了查詢決策樹的匹配時(shí)間效率和存儲(chǔ)使用量,并將其和改進(jìn)的行順序處理算法及列順序處理算法進(jìn)行對(duì)比,驗(yàn)證了查詢決策樹在匹配時(shí)間效率上的巨大優(yōu)勢(shì)。

[1]徐恪,徐明偉,吳建平,吳劍.路由查找算法研究綜述.軟件學(xué)報(bào),Vol.13(1),pp42~50

[2]陳有祺.形式語言與自動(dòng)機(jī).南開大學(xué)出版社,1999,pp.45~78

[3]王曉東.計(jì)算機(jī)算法設(shè)計(jì)與分析.電子工業(yè)出版社,pp210~216, 2001

10.3969/j.issn.1001-8972.2012.03.033

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
船山與宋學(xué)關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
新制度關(guān)聯(lián)、組織控制與社會(huì)組織的倡導(dǎo)行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測(cè)數(shù)據(jù)的關(guān)聯(lián)負(fù)選擇分步識(shí)別算法
主站蜘蛛池模板: 日韩成人高清无码| 日韩亚洲综合在线| 国产剧情伊人| 天堂中文在线资源| 国产人在线成免费视频| 国产精品大尺度尺度视频| 精品国产91爱| 美女被操91视频| 亚洲无线视频| 国产精品无码AV片在线观看播放| www精品久久| 国产情精品嫩草影院88av| 91在线高清视频| 日本人妻丰满熟妇区| 国产福利微拍精品一区二区| 国产精品亚洲va在线观看| 网友自拍视频精品区| 国产视频大全| 亚洲丝袜第一页| 国产成人毛片| 亚洲综合婷婷激情| 亚洲欧美在线综合图区| 亚洲三级成人| 欧美午夜精品| 日本一区中文字幕最新在线| 欧美啪啪网| 国产精品免费久久久久影院无码| 亚洲AV成人一区国产精品| 韩国v欧美v亚洲v日本v| 在线免费不卡视频| 自慰高潮喷白浆在线观看| 无码AV高清毛片中国一级毛片 | 精品天海翼一区二区| 成人看片欧美一区二区| 四虎成人精品在永久免费| 天堂网国产| 精品国产aⅴ一区二区三区| 成人精品视频一区二区在线 | 亚洲娇小与黑人巨大交| 国产爽歪歪免费视频在线观看| 丁香婷婷综合激情| 人人91人人澡人人妻人人爽| 久久黄色视频影| 高清码无在线看| 91探花国产综合在线精品| 国产另类乱子伦精品免费女| 四虎AV麻豆| 亚洲黄色激情网站| 国产视频 第一页| 国产美女无遮挡免费视频网站 | 人妻无码中文字幕一区二区三区| 曰韩人妻一区二区三区| 亚洲女同欧美在线| 97超爽成人免费视频在线播放| 不卡无码h在线观看| 国产无遮挡裸体免费视频| 2021国产v亚洲v天堂无码| 99国产精品一区二区| 99这里精品| 国产精品私拍在线爆乳| 色综合狠狠操| 免费国产一级 片内射老| 精品三级网站| 免费高清a毛片| 福利小视频在线播放| 97国产成人无码精品久久久| 日韩在线永久免费播放| 国产内射一区亚洲| 国产裸舞福利在线视频合集| 亚洲国产亚洲综合在线尤物| 青草国产在线视频| 久久香蕉国产线看观看精品蕉| 丝袜久久剧情精品国产| 亚洲高清中文字幕| 亚洲色图欧美激情| 她的性爱视频| 国产高颜值露脸在线观看| 中文字幕永久在线看| 国产精品吹潮在线观看中文| 欧美中文一区| 99视频在线免费| 毛片网站在线播放|