李英龍 朱藝華 呂明琪
(浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310023)(liyinglong@zjut.edu.cn)
傳感器網(wǎng)絡(luò)中語(yǔ)義事件區(qū)域查詢處理
李英龍 朱藝華 呂明琪
(浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310023)(liyinglong@zjut.edu.cn)
傳感器網(wǎng)絡(luò)可以看成是一個(gè)資源受限的無(wú)線分布式數(shù)據(jù)庫(kù)系統(tǒng),如何設(shè)計(jì)低功耗高可靠的數(shù)據(jù)處理方法,從分布式的感知數(shù)據(jù)中獲取用戶感興趣的信息是一個(gè)挑戰(zhàn)性工作.現(xiàn)有的事件(區(qū)域)檢測(cè)方法大都基于原始的感知數(shù)據(jù),處理大規(guī)模的原始感知數(shù)據(jù)的通信和時(shí)間開(kāi)銷(xiāo)很大,然而這些原始數(shù)據(jù)由于本身的不精確性和不確定性,難以保證得到精確的處理結(jié)果.大多數(shù)情況,用戶并不關(guān)心這些原始感知數(shù)據(jù)或者網(wǎng)內(nèi)過(guò)濾/融合時(shí)的數(shù)據(jù)形態(tài),而是想得到類(lèi)似自然語(yǔ)言的“有多嚴(yán)重?” 、“可信嗎?”等語(yǔ)義事件信息.此外,現(xiàn)有的事件區(qū)域檢測(cè)方法主要是利用鄰居協(xié)作來(lái)提高檢測(cè)的準(zhǔn)確性,而鄰居協(xié)作需要大規(guī)模的網(wǎng)內(nèi)數(shù)據(jù)交換,非常耗時(shí)耗能.鑒于上述問(wèn)題,提出一種新的基于模糊方法的語(yǔ)義事件區(qū)域查詢處理方法,語(yǔ)義事件信息代替原始的感知數(shù)據(jù)用于網(wǎng)內(nèi)過(guò)濾和融合,并設(shè)計(jì)了基于模糊方法的分布式語(yǔ)義事件信息表示、過(guò)濾和融合算法.基于真實(shí)數(shù)據(jù)集的仿真實(shí)驗(yàn)表明了該方法在兼顧節(jié)能和可靠性方面有良好的表現(xiàn).
語(yǔ)義事件信息;模糊方法;能量有效性;可靠性;傳感器網(wǎng)絡(luò)
傳感器節(jié)點(diǎn)計(jì)算、存儲(chǔ)、通信能力十分有限,尤其是能量供應(yīng)受限,在很多應(yīng)用中更換電池或者充電是難于做到的,因此無(wú)線傳感器網(wǎng)絡(luò)可以看成是一個(gè)資源受限(尤其能量有限)的無(wú)線分布式數(shù)據(jù)庫(kù)系統(tǒng).如何設(shè)計(jì)節(jié)能而可靠的數(shù)據(jù)處理算法,從分布式的感知數(shù)據(jù)中獲取用戶感興趣的信息是一個(gè)挑戰(zhàn)性工作.由于傳感器網(wǎng)絡(luò)的通信開(kāi)銷(xiāo)主要是用于數(shù)據(jù)傳輸,因此在滿足用戶精度要求下降低網(wǎng)絡(luò)數(shù)據(jù)傳輸量是一個(gè)有效的解決方法.此外,減少數(shù)據(jù)傳輸量還可以提高處理的響應(yīng)速度,以及減少無(wú)線通信中的信號(hào)干擾.
事件(區(qū)域)檢測(cè)是傳感器網(wǎng)絡(luò)/物聯(lián)網(wǎng)應(yīng)用中的一類(lèi)非常重要的任務(wù)[1-15],盡早地發(fā)現(xiàn)潛在事件并及時(shí)處理,可有效地減少災(zāi)害損失.獲取事件信息可分為用戶主動(dòng)查詢監(jiān)控區(qū)域內(nèi)的潛在事件信息,以及感知節(jié)點(diǎn)自發(fā)檢測(cè)并上報(bào)事件信息.目前這類(lèi)研究主要包括基于單個(gè)節(jié)點(diǎn)的簡(jiǎn)單事件檢測(cè)[5,11-12]和基于鄰居協(xié)作的復(fù)雜事件檢測(cè)[6,8,10],這些方法在兼顧節(jié)能性、實(shí)時(shí)性和可靠性方面仍存在不少問(wèn)題.
1) 單節(jié)點(diǎn)事件檢測(cè).事件定義往往取決于具體的應(yīng)用問(wèn)題,也影響著事件檢測(cè)的效率.在感知節(jié)點(diǎn)稀疏部署(單個(gè)節(jié)點(diǎn)覆蓋區(qū)域內(nèi)的冗余節(jié)點(diǎn)較少)且節(jié)點(diǎn)穩(wěn)定可靠的情況下,單個(gè)節(jié)點(diǎn)就可以完成局部事件檢測(cè).這種方法的最大優(yōu)點(diǎn)是網(wǎng)內(nèi)數(shù)據(jù)傳輸量少,處理也非常及時(shí),但是結(jié)果的準(zhǔn)確性難以保證,特別是對(duì)于用戶想查詢k個(gè)最嚴(yán)重事件區(qū)域的情況,往往不大適用.例如在煤礦安全監(jiān)控系統(tǒng)中,感知節(jié)點(diǎn)用于監(jiān)測(cè)瓦斯?jié)舛龋鐖D1所示,標(biāo)注有瓦斯?jié)舛?%)數(shù)據(jù)的節(jié)點(diǎn)是值得關(guān)注的潛在事件節(jié)點(diǎn).在單節(jié)點(diǎn)事件檢測(cè)方法中,top-3事件查詢的結(jié)果是{S1,S2,S3},這些結(jié)果均來(lái)自同一個(gè)區(qū)域,而用戶的本意可能是查詢以S2,S8,S12為中心的事件區(qū)域.另一方面,單節(jié)點(diǎn)事件檢測(cè)由于缺少空間相關(guān)性信息分析,容易造成事件誤報(bào),如圖1所示,孤立事件節(jié)點(diǎn)S16可能是一個(gè)誤報(bào).

Fig. 1 Example of coal mine gas concentration monitoring圖1 煤礦瓦斯?jié)舛缺O(jiān)測(cè)示例
2) 鄰居協(xié)作事件檢測(cè).在實(shí)際應(yīng)用中,感知節(jié)點(diǎn)的部署會(huì)較為稠密,即有一定的冗余,這樣可以利用空間相鄰節(jié)點(diǎn)交換感知數(shù)據(jù)來(lái)提高事件檢測(cè)的準(zhǔn)確性,這類(lèi)代表性研究就是基于權(quán)重的“投票(voting)技術(shù)”[6-7].該方法的好處是可以減少單個(gè)異常節(jié)點(diǎn)的誤報(bào)以及事件區(qū)域的漏報(bào),從而提高事件檢測(cè)的可靠性.例如圖1中,基于鄰居協(xié)作的top-3事件區(qū)域查詢能正確找出S2,S8,S12為代表的3個(gè)事件區(qū)域.然而此類(lèi)事件檢測(cè)方法,需要大量相鄰節(jié)點(diǎn)之間的信息交換,對(duì)于實(shí)時(shí)性和節(jié)能性來(lái)說(shuō),代價(jià)非常高.
此外,現(xiàn)有的事件檢測(cè)方法大都基于原始的感知數(shù)據(jù),處理大規(guī)模的原始感知數(shù)據(jù)的通信和時(shí)間開(kāi)銷(xiāo)很大,而且這些原始數(shù)據(jù)由于本身的不精確性和不確定性,難以保證得到精確的結(jié)果.然而在實(shí)際應(yīng)用中,用戶并不關(guān)心這些原始感知數(shù)據(jù)或者網(wǎng)內(nèi)過(guò)濾/融合時(shí)的數(shù)據(jù)形態(tài),而是想知道類(lèi)似自然語(yǔ)言的“嚴(yán)重性” 、“可信度”等語(yǔ)義事件信息.
本文提出一種低功耗可靠的語(yǔ)義事件區(qū)域查詢處理方法.提出語(yǔ)義事件信息代替原始感知數(shù)據(jù)用于網(wǎng)內(nèi)融合和傳輸,可明顯降低數(shù)據(jù)傳輸量.給出基于模糊方法的事件可信度測(cè)量方法和非均勻離散化的語(yǔ)義事件信息表示方法,并設(shè)計(jì)基于模糊方法的語(yǔ)義事件信息過(guò)濾和網(wǎng)內(nèi)融合算法,最后從節(jié)能和可靠性等方面,基于真實(shí)數(shù)據(jù)的仿真實(shí)驗(yàn)驗(yàn)證了此方法的有效性.
1.1 網(wǎng)絡(luò)模型
在事件監(jiān)測(cè)系統(tǒng)中,感知節(jié)點(diǎn)部署到監(jiān)控區(qū)域內(nèi)自組織形成一個(gè)連通的網(wǎng)絡(luò).感知節(jié)點(diǎn)部署通常包括隨機(jī)部署、規(guī)則部署和按需部署3種方法,每種部署方法都有各自的適用場(chǎng)景.其中規(guī)則部署和按需部署由于人工干預(yù),通常能保證一定的網(wǎng)絡(luò)連通性,而隨機(jī)部署則需要關(guān)注網(wǎng)絡(luò)的連通性,通常的做法是引入泊松點(diǎn)過(guò)程(Poisson point process)假設(shè)[16].泊松點(diǎn)過(guò)程是廣泛存在的,例如建模一個(gè)確定空間的星星數(shù)量或者描述皮氏培養(yǎng)皿中的細(xì)菌數(shù)等.本文網(wǎng)絡(luò)部署引入泊松點(diǎn)過(guò)程是因?yàn)樗隙鄶?shù)人對(duì)于“隨機(jī)部署”的直覺(jué)概念.
此外我們將監(jiān)控區(qū)域基于地理位置邏輯劃分成若干網(wǎng)格,每個(gè)格內(nèi)選擇一個(gè)格管理(grid manager,GM)節(jié)點(diǎn),用于收集局部事件信息和管理局部網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),被選中的GM可以更高的通信頻率形成一個(gè)以Sink節(jié)點(diǎn)為根的TAG[17]樹(shù)形路由結(jié)構(gòu)GM-Tree,如圖2所示:

Fig. 2 Grid network model based on uniform Poisson point process—GM-Tree圖2 基于均勻泊松點(diǎn)過(guò)程的格網(wǎng)絡(luò)模型——GM-Tree
值得注意的是,我們的網(wǎng)格劃分是基于地理位置的邏輯劃分,不需要像分簇網(wǎng)絡(luò)[18]那樣需要專(zhuān)門(mén)的簇結(jié)構(gòu)管理算法.網(wǎng)格的大小可以根據(jù)節(jié)點(diǎn)的通信半徑和監(jiān)控區(qū)域的大小而定,基本原則是每個(gè)網(wǎng)格覆蓋較多的節(jié)點(diǎn),以保證一定數(shù)量的空間相關(guān)性節(jié)點(diǎn)用于事件區(qū)域檢測(cè).GM的選擇方法也很多,比如可以離格中心最近的節(jié)點(diǎn)作為GM,這樣可使得GM收集本地事件信息的總能耗少;或者選擇剩余能量最大的節(jié)點(diǎn)為GM,這樣有利于網(wǎng)絡(luò)能量均衡.可以根據(jù)實(shí)際情況選擇GM.
此外,基于地理位置的網(wǎng)絡(luò)模型具有良好的魯棒性和可擴(kuò)展性.當(dāng)一個(gè)節(jié)點(diǎn)移動(dòng)或增加到某一個(gè)網(wǎng)格中時(shí),節(jié)點(diǎn)可以根據(jù)其地理坐標(biāo)(GPS定位裝置)計(jì)算得到其所屬的網(wǎng)格.當(dāng)一個(gè)GM失效或者移動(dòng)到另一個(gè)網(wǎng)格時(shí),它周?chē)墓?jié)點(diǎn)能夠發(fā)現(xiàn)它的移動(dòng)并且按一定方法選擇新的GM.
1.2 問(wèn)題定義
定義1. 語(yǔ)義事件區(qū)域查詢(semantic event region query,SERQ).SERQ查詢監(jiān)控區(qū)域內(nèi)k最有可能發(fā)生的潛在事件區(qū)域位置及其語(yǔ)義信息,可形式化為一個(gè)四元組:
SERQ=(Γ,n,k,QType),
其中,Γ為查詢覆蓋節(jié)點(diǎn)的集合,一般為監(jiān)控區(qū)域的所有的節(jié)點(diǎn);n為查詢的最近的采樣周期數(shù),與采樣周期間隔長(zhǎng)短有關(guān),采樣周期間隔越長(zhǎng),n越小;k為返回查詢結(jié)果的個(gè)數(shù),在事件監(jiān)控系統(tǒng)中,由于人力物力限制,往往只能同時(shí)處理k個(gè)潛在事件,如果沒(méi)有這個(gè)限制,則返回所有可能的潛在事件區(qū)域位置;QType是事件類(lèi)型,事件類(lèi)型決定了事件定義模型.
值得注意的是,一個(gè)事件監(jiān)測(cè)系統(tǒng)通常有默認(rèn)的事件類(lèi)型,比如煤礦安全監(jiān)控系統(tǒng)中通過(guò)監(jiān)測(cè)瓦斯?jié)舛劝l(fā)現(xiàn)潛在瓦斯爆炸事件、森林安全監(jiān)控系統(tǒng)中查詢潛在火災(zāi)事件、現(xiàn)代精細(xì)化農(nóng)業(yè)管理中溫度和濕度感知節(jié)點(diǎn)常用于查找需要澆灌的事件等.節(jié)點(diǎn)在部署前一般被嵌入默認(rèn)的事件可信度模型或事件概率模型,如果要更改查詢的事件類(lèi)型,那么需要基站廣播新的事件模型給每個(gè)節(jié)點(diǎn),以更新原來(lái)默認(rèn)的事件模型.
定義2.SERQ的查詢結(jié)果rst也可用一個(gè)三元組形式化表示:
rst=(nodeID,sev,serc),
其中,nodeID是相同或相似事件區(qū)域的代表性節(jié)點(diǎn)的位置,這個(gè)代表性位置監(jiān)控區(qū)域內(nèi)最接近真實(shí)潛在事件的位置;sev為語(yǔ)義事件變量(semantic event variable),sev使用接近人類(lèi)自然語(yǔ)言來(lái)描述一類(lèi)嚴(yán)重程度的潛在事件語(yǔ)義信息,詳見(jiàn)2.3節(jié)中的語(yǔ)義事件信息表示方法;serc為語(yǔ)義事件區(qū)域可信度(semantic event region confidence),用于表示潛在事件區(qū)域是否存在的可信度.
總體來(lái)說(shuō),在SERQ中,用戶不關(guān)心具體的感知數(shù)據(jù),也不關(guān)心網(wǎng)內(nèi)融合的數(shù)據(jù)格式,只關(guān)心最嚴(yán)重k個(gè)潛在事件的語(yǔ)義信息及其最可能的發(fā)生位置.
2.1 感知數(shù)據(jù)清洗
事件檢測(cè)應(yīng)該消除錯(cuò)誤感知數(shù)據(jù)對(duì)事件分析的影響.錯(cuò)誤數(shù)據(jù)通常有2個(gè)主要來(lái)源:1)失效節(jié)點(diǎn);2)正常節(jié)點(diǎn)的噪音數(shù)據(jù).一般來(lái)說(shuō),實(shí)時(shí)事件監(jiān)測(cè)系統(tǒng)中采樣周期都相對(duì)較短,那么可以基于最近n(n≥1)次采樣周期內(nèi)的感知數(shù)據(jù)來(lái)進(jìn)行實(shí)時(shí)事件檢測(cè)分析.現(xiàn)有噪聲數(shù)據(jù)檢測(cè)方法,大都利用時(shí)空相關(guān)性分析來(lái)發(fā)現(xiàn)和消除錯(cuò)誤感知數(shù)據(jù),其中空間相關(guān)性分析需要大量的相鄰節(jié)點(diǎn)信息交換[14,19],非常耗時(shí)耗能,因此我們只利用節(jié)點(diǎn)局部的時(shí)間相關(guān)性分析來(lái)消除錯(cuò)誤數(shù)據(jù).盡管這不能消除所有的錯(cuò)誤數(shù)據(jù),但可以消除大部分錯(cuò)誤數(shù)據(jù),而且?guī)缀鯖](méi)有通信代價(jià),非常適用于低功耗的實(shí)時(shí)事件檢測(cè).
對(duì)于失效節(jié)點(diǎn),它的大部分?jǐn)?shù)據(jù)會(huì)明顯偏離正常的取值范圍,因?yàn)閭鞲衅骶W(wǎng)絡(luò)應(yīng)用中,感知節(jié)點(diǎn)常用于感知物理環(huán)境,正常情況下物理環(huán)境值通常在一個(gè)合乎常理的取值范圍R之內(nèi),比如說(shuō)在精細(xì)化農(nóng)業(yè)管理中,土壤鹽堿度的取值范圍通常為[0,80%],如果某個(gè)鹽堿度感知節(jié)點(diǎn)的大部分采樣值超過(guò)100%,甚至是負(fù)值,那么該節(jié)點(diǎn)極有可能就是一個(gè)失效節(jié)點(diǎn).此外,失效節(jié)點(diǎn)的感知數(shù)據(jù)通常不具備時(shí)間相關(guān)性或者標(biāo)準(zhǔn)差難以接受.對(duì)于失效節(jié)點(diǎn)的感知數(shù)據(jù),應(yīng)該被提前過(guò)濾,以免事件誤報(bào).
對(duì)于正常工作的節(jié)點(diǎn),其采集的大部分感知數(shù)據(jù)符合一個(gè)正常模式V,少部分采樣周期內(nèi)的感知數(shù)據(jù)明顯偏離正常取值范圍R或者均值λ,這部分感知數(shù)據(jù)稱為噪聲數(shù)據(jù).我們之前的研究[8]提出一種識(shí)別和消除噪音數(shù)據(jù)的方法(improved smoothing factor, ISF),ISF方法可以根據(jù)精度需要,通過(guò)設(shè)定標(biāo)準(zhǔn)值閾值,消除那些明顯偏離均值的噪聲數(shù)據(jù),可以有效提高事件區(qū)域檢測(cè)的可靠性.
2.2 事件可信度測(cè)量
模糊方法[20]是扎德(Lotfi Zadeh)教授在1965年創(chuàng)立的,它以相對(duì)的、魯棒的和易于理解的方式分析處理復(fù)雜系統(tǒng)中的不精確和不確定數(shù)據(jù).語(yǔ)言變量代替數(shù)值變量用于描述系統(tǒng)的行為,這為人們處理不確定性問(wèn)題和近似問(wèn)題提供了一種新的解決方法[21].


其中,xi(i=1,2,…,m)是節(jié)點(diǎn)的感知數(shù)據(jù),m為感知數(shù)據(jù)的維數(shù),avg(xi)是每維感知數(shù)據(jù)的平均值.在2.1節(jié)中,數(shù)據(jù)清洗消除了大部分錯(cuò)誤數(shù)據(jù),我們可以用最近幾個(gè)采樣周期內(nèi)的感知數(shù)據(jù)的平均值來(lái)定義事件點(diǎn)的可信度.ωi(i=1,2,…,m)是可調(diào)因子,用于調(diào)節(jié)各屬性對(duì)于事件概率的影響程度,ω1+ω2+…+ωm=1.fun和fi可在領(lǐng)域?qū)<抑笇?dǎo)下設(shè)定.
其中,α是一個(gè)0~1之間的指定值,即α∈[0,1].通常α=0.5,表示最大不確定性的臨界值.
定義5. 事件的0.5-截集內(nèi)的所有事件點(diǎn)稱為值得關(guān)注的的事件節(jié)點(diǎn)(noteworthy event node, NEN).
上述定義是為了提早過(guò)濾那些可信度較低的事件節(jié)點(diǎn),即過(guò)濾那些安全的感知數(shù)據(jù),以減少網(wǎng)內(nèi)通信開(kāi)銷(xiāo).
2.3 語(yǔ)義事件信息表示
非均勻的事件可信度離散化方法:把NEN可信度ec的取值范圍[α,1)劃分成若干區(qū)間大小不等的子范圍Rsub,這種非均勻的劃分可以基于某種數(shù)學(xué)模型(如等差數(shù)列),也可以在領(lǐng)域?qū)<抑笇?dǎo)下設(shè)定,遵循的原則是ec越大,其所處的子范圍區(qū)間越小.
例1. NEN可信度ec的取值范圍為[0.5,1),它被劃分為6個(gè)不均勻的子區(qū)間,如表1中第4列所示.事件可信度取值越靠近1的Rsub,其區(qū)間間隔大小越小(0.03),越靠近α的子范圍區(qū)間間隔越大(0.16).這樣劃分的好處是可用較多的語(yǔ)言變量(表1中第1列)來(lái)描述較嚴(yán)重的語(yǔ)義事件信息,有助于事件信息網(wǎng)內(nèi)融合時(shí)提高事件檢測(cè)的可靠性.

Table 1 Example of Semantic Event Information Description表1 語(yǔ)義事件信息表示示例
語(yǔ)義事件信息表示方法:根據(jù)非均勻的事件可信度離散化方法,可以得到若干個(gè)區(qū)間大小不等的子范圍,我們定義相同數(shù)量的語(yǔ)義事件變量sev.每個(gè)子范圍對(duì)應(yīng)著一個(gè)語(yǔ)義事件信息變量及其語(yǔ)義解釋?zhuān)绫?中第1列、第2列所示.每個(gè)sev描述同一類(lèi)嚴(yán)重程度的事件信息,區(qū)間間隔越小的子范圍對(duì)應(yīng)的sev描述越嚴(yán)重的事件信息.在實(shí)際應(yīng)用系統(tǒng)設(shè)計(jì)時(shí),GM節(jié)點(diǎn)還可以對(duì)語(yǔ)義事件變量進(jìn)行二進(jìn)制編碼,如表1中第3列所示,以進(jìn)一步降低網(wǎng)內(nèi)通信開(kāi)銷(xiāo).
例2. 在表1中,6個(gè)子范圍對(duì)應(yīng)著6個(gè)sev,每個(gè)sev的語(yǔ)義解釋如表1中第2列所示,這些語(yǔ)義解釋可以幫助用戶容易地理解返回的結(jié)果信息,而不需要領(lǐng)域?qū)<业闹笇?dǎo).4個(gè)sev用于描述較為嚴(yán)重的事件信息,只有2個(gè)sev用來(lái)描述不重要的(事件可信度低于0.76)事件信息,這有利于提高事件信息表示的準(zhǔn)確性.
3.1 格內(nèi)語(yǔ)義事件區(qū)域信息處理
格內(nèi)語(yǔ)義事件信息過(guò)濾和存儲(chǔ)的過(guò)程為:每個(gè)節(jié)點(diǎn)根據(jù)2.2節(jié)式(2)計(jì)算本地語(yǔ)義事件的可信度;再根據(jù)定義6過(guò)濾0.5-截集內(nèi)的所有事件點(diǎn),即非NEN被過(guò)濾;然后根據(jù)2.3節(jié)語(yǔ)義事件信息表示方法得到本地語(yǔ)義事件變量sev,并發(fā)送其nodeID和sev到本格GM,GM有一張列表List,存儲(chǔ)每個(gè)接收到的nodeID及其對(duì)應(yīng)sev.
定義6. 語(yǔ)義事件區(qū)域可信度serc描述局部事件區(qū)域存在的可信度,這種可信度和格內(nèi)NEN數(shù)量有直接的關(guān)系,本文提出一種幾乎沒(méi)有額外通信代價(jià)的基于格內(nèi)NEN數(shù)量的serc計(jì)算方法:
其中,List.size為格內(nèi)NEN數(shù)量.當(dāng)某格內(nèi)NEN數(shù)為零時(shí),表明潛在事件和事件區(qū)域都不存在;當(dāng)只有1個(gè)NEN時(shí),表明是孤立的NEN,誤報(bào)的可能性比較大,這時(shí)serc=0.5;當(dāng)格內(nèi)有2個(gè)以上的NEN時(shí),那么潛在事件事件區(qū)域的可信度非常高,這時(shí)躍階函數(shù)serc的基數(shù)設(shè)為0.9,并隨著NEN數(shù)增加而增加;當(dāng)空間相關(guān)的NEN數(shù)量為4或以上時(shí),那么潛在事件事件區(qū)域的必然存在,serc=1.從理論分析和實(shí)際應(yīng)用角度上看,躍階函數(shù)serc的設(shè)計(jì)是比較可行的.
根據(jù)上述格內(nèi)語(yǔ)義事件信息過(guò)濾和存儲(chǔ)過(guò)程描述,我們可以設(shè)計(jì)格內(nèi)語(yǔ)義事件區(qū)域信息處理分布式算法如下:
算法1. Inner-GM_SERQ_Process.
輸入:SERQ查詢消息;
輸出:List(nodeID,sev),sercofGM.
步驟1. 每個(gè)節(jié)點(diǎn)根據(jù)2.2節(jié)式(2)計(jì)算本地事件點(diǎn)可信度;
步驟2. 根據(jù)定義6過(guò)濾0.5-截集內(nèi)的所有事件點(diǎn),即非NEN被過(guò)濾.
步驟3. 每個(gè)NEN根據(jù)2.3節(jié)語(yǔ)義事件信息表示方法得到本地語(yǔ)義事件變量sev,并發(fā)送其nodeID和sev到本格GM;
步驟4.GM內(nèi)的List存儲(chǔ)每個(gè)接收到的nodeID及其對(duì)應(yīng)sev,并根據(jù)定義7中式(3)計(jì)算該格serc值.

Fig. 3 Example of inner-grid semantic event information processing圖3 格內(nèi)語(yǔ)義事件信息處理的例子
例3. 算法1的一個(gè)運(yùn)行例子如圖3所示,在某個(gè)格GM內(nèi),GM收集所有的NEN,在圖3中NEN為S1,S3,GM本身,這些NEN的語(yǔ)義事件點(diǎn)信息存儲(chǔ)在GM的List中.算法1根據(jù)定義6式(3)計(jì)算該格內(nèi)存在事件區(qū)域的可信度為0.98.由于S1的語(yǔ)義信息最嚴(yán)重,因此它將作為該事件區(qū)域代表被發(fā)送給GM的父GM節(jié)點(diǎn).
算法1時(shí)間復(fù)雜度分析如下:算法1中各NEN發(fā)送消息包時(shí)是分布式的,GM接收多個(gè)NEN事件消息包時(shí)是串行通信的.假設(shè)格內(nèi)最大節(jié)點(diǎn)數(shù)為h,不考慮計(jì)算時(shí)間開(kāi)銷(xiāo),算法1的時(shí)間復(fù)雜度為T(mén)t+h×Tr,其中Tt為傳感器節(jié)點(diǎn)發(fā)送一個(gè)消息包的時(shí)間,Tr為GM接收一個(gè)事件消息包的時(shí)間.
3.2 網(wǎng)內(nèi)語(yǔ)義事件區(qū)域信息融合
這里說(shuō)的網(wǎng)內(nèi)是指GM-Tree格與格之間,包括葉子GM語(yǔ)義事件區(qū)域信息過(guò)濾傳輸,以及非葉子GM語(yǔ)義事件區(qū)域信息融合.
在給出網(wǎng)內(nèi)語(yǔ)義事件區(qū)域信息融合算法之前,我們基于模糊方法中的t-余模運(yùn)算[20]定義語(yǔ)義事件變量比較操作符,用于選舉格內(nèi)代表性事件點(diǎn).
定義7. 設(shè)U和V為2個(gè)事件語(yǔ)言變量,對(duì)于任意的可信度值x∈Rsub(U)和y∈Rsub(V),如果x 例如,在表1中,Rsub(A) 定義8. 設(shè)U和V為2個(gè)語(yǔ)言變量,它們的可信度子范圍分別為Rsub(U)和Rsub(V),如果Rsub(U) Θ即為格內(nèi)語(yǔ)義事件變量比較操作符. 引理1. 比較操作符Θ是t-余模運(yùn)算. 證明. 對(duì)任意的語(yǔ)言變量sev(如A,B,C,D)且Rsub(sev)?[0,1],函數(shù)Θ:sev×sev→sev,對(duì)于任意的語(yǔ)義事件變量A,B,C,D滿足4個(gè)條件: 1) 交換律Θ(A,B)=Θ(B,A); 2) 結(jié)合律Θ(Θ(A,B),C)=Θ(A,Θ(B,C)); 3) 單調(diào)性A≤B,C≤D?Θ(A,C)≤Θ(B,D); 4) 邊界條件Θ(A,0)=A. 由模糊方法[20],可得Θ即為t-余模運(yùn)算. 證畢. 此外,我們還要定義一個(gè)綜合排序函數(shù),用于格間語(yǔ)義事件區(qū)域信息top-k融合. 定義9. 定義格間語(yǔ)義事件區(qū)域信息融合排序函數(shù)score(sev,serc),score綜合考慮事件代表點(diǎn)可信度ec和事件區(qū)域可信度serc,一個(gè)score函數(shù)例子為 其中,ec(sev)計(jì)算sev對(duì)應(yīng)可信度區(qū)間的中間值.根據(jù)表1可知:ec(A)=0.985,ec(B)=0.945,ec(C)=0.885等,ω用于調(diào)節(jié)ec和serc對(duì)于score的影響程度,一般來(lái)說(shuō),事件區(qū)域存在可信度較大的時(shí)候,用戶往往對(duì)sev更大的事件區(qū)域代表點(diǎn)感興趣,因此本文實(shí)驗(yàn)設(shè)置ω=0.7. 網(wǎng)內(nèi)語(yǔ)義事件區(qū)域信息融合過(guò)程可用算法2描述. 算法2. Inter-GM_SERQ_Process. 輸入:SERQ查詢消息; 輸出:topknodeID,sev,serc. 步驟1. ① for each葉子GM(i)*GM-Tree的葉子GM* ② ifGM(i).Listis null then*List為空* ③ break; ④ else ⑤ 利用定義8中的Θ操作符查找最大sev對(duì)應(yīng)的List(j).nodeID;*最大sev的NEN為事件區(qū)域代表點(diǎn)* ⑦ endif 步驟2. ⑨ do{ ⑩ for each非葉子GM(i)*收集完子GM語(yǔ)義信息消息包* 例4. 算法2的一個(gè)運(yùn)行例子如圖4所示.葉子GM節(jié)點(diǎn)GM(1),GM(2),GM(3),GM(7) 把其語(yǔ)義事件區(qū)域信息(nodeID,sev,serc)發(fā)送給非葉子GM(8)節(jié)點(diǎn),這些信息存儲(chǔ)在GM(8) 的Listp中.GM(8)根據(jù)定義10中式(4)計(jì)算Listp中的語(yǔ)義事件區(qū)域信息的綜合得分,然后根據(jù)SERQ中的k值,返回查詢結(jié)果,k=1,2,3時(shí)的查詢結(jié)果分別為{(5,B,0.94)},{(5,B,0.94),(11,C,0.98)}和{(5,B,0.94),(11,C,0.98),(37,D,1.0)}. Fig. 4 Example of inter-grid semantic event region information fusion圖4 格間語(yǔ)義事件區(qū)域信息融合的例子 1)SERQ時(shí)間復(fù)雜度分析.SERQ時(shí)間復(fù)雜度即為算法2和算法1總的時(shí)間復(fù)雜度,設(shè)GM-Tree的最大度數(shù)為q,GM-Tree的層數(shù)為p.不考慮計(jì)算時(shí)間開(kāi)銷(xiāo),之前我們得到算法1的時(shí)間復(fù)雜度為T(mén)t+h×Tr,其中h為格內(nèi)最大節(jié)點(diǎn)數(shù).同理,我們考慮分布式發(fā)送和串行接收的情況,SERQ的時(shí)間復(fù)雜度為 (Tt+h×Tr)+(Tt+q×Tr)×(p-1),即為p×Tt+((p-1)×q+h)×Tr.由于h,p,q的值都比較小,因此SERQ的時(shí)間開(kāi)銷(xiāo)非常低. 2)SERQ結(jié)果可靠性分析.我們沒(méi)有考慮所有的空間相關(guān)性,比如格與格邊界節(jié)點(diǎn)的空間相關(guān)性,也不做嚴(yán)格的事件區(qū)域邊界檢測(cè),因此,SERQ的結(jié)果不是精確的,但是由于在SERQ的GM-Tree中,我們定義了格大小設(shè)置原則,即保證格內(nèi)有一定數(shù)量的節(jié)點(diǎn),使得格內(nèi)節(jié)點(diǎn)的空間相關(guān)性足夠判斷一個(gè)事件區(qū)域是否存在,也即SERQ考慮了網(wǎng)內(nèi)NEN的主要空間相關(guān)性,因此結(jié)果的可靠性比較高.如果我們考察所有的空間相關(guān)性以及做嚴(yán)格的事件區(qū)域邊界檢測(cè),那么網(wǎng)內(nèi)信息交換通信開(kāi)銷(xiāo)很大[1,6],將退化成現(xiàn)有的類(lèi)似投票方法. 4.1 實(shí)驗(yàn)設(shè)置 仿真實(shí)驗(yàn)平臺(tái)為OMNET++[22],它是國(guó)際認(rèn)可度很高的開(kāi)源多協(xié)議網(wǎng)絡(luò)仿真軟件.實(shí)驗(yàn)數(shù)據(jù)來(lái)自部分真實(shí)數(shù)據(jù)LUCE[23],我們已經(jīng)下載了該真實(shí)數(shù)據(jù)集,包括88個(gè)有效節(jié)點(diǎn)的位置數(shù)據(jù)和感知數(shù)據(jù)(節(jié)點(diǎn)號(hào)、溫度、濕度、光照、風(fēng)向等),節(jié)點(diǎn)分布在450 m×300 m的感知區(qū)域,感知節(jié)點(diǎn)和GM的通信半徑分別為50 m和80 m時(shí)的一個(gè)基于GM-Tree的網(wǎng)絡(luò)如圖5所示.我們主要使用其中的溫度T(temperature)和濕度H(humidity)來(lái)描述潛在火災(zāi)事件.另外,為了更好地模擬事件的時(shí)空相關(guān)性,以及考察網(wǎng)絡(luò)中不同NEN比例對(duì)于算法的影響,我們基于Intel Lab Data[24]合成了部分?jǐn)?shù)據(jù). 其中,Tn和Hn是最近n個(gè)采用周期內(nèi)的溫度和濕度值.實(shí)驗(yàn)時(shí)n=5,avg(Tn) 和avg(Hn)分別表示最近n個(gè)采樣周期內(nèi)的平均溫度值和平均濕度值,Tig和Hig是火災(zāi)事件的臨界值,本實(shí)驗(yàn)設(shè)置Tig和Hig分別為100°C和10%. 據(jù)我們檢索傳感器網(wǎng)絡(luò)/物聯(lián)網(wǎng)相關(guān)文獻(xiàn),并沒(méi)有發(fā)現(xiàn)可以進(jìn)行比較的同類(lèi)方法,因此我們選擇2類(lèi)代表性的事件處理方法進(jìn)行比較評(píng)估,其中集中式查詢可以得到精確的事件信息結(jié)果,而基于投票的方法是目前事件檢測(cè)最常用的一種空間相關(guān)技術(shù).為公平起見(jiàn),下述2種方法中,非值得關(guān)注的事件節(jié)點(diǎn)同樣被提前過(guò)濾. 1) 集中式查詢(central)方法.在集中式查詢處理中,所有值得關(guān)注的潛在事件節(jié)點(diǎn)將最近5個(gè)周期的感知數(shù)據(jù)的平均值傳輸?shù)絊ink,然后Sink利用全局的拓?fù)湫畔?lái)計(jì)算得到相對(duì)精確的潛在事件區(qū)域信息. Fig. 5 Real-world network with 4.4 nodes per gird圖5 真實(shí)網(wǎng)絡(luò)—每個(gè)格平均覆蓋節(jié)點(diǎn)4.4個(gè) 2) 投票方法(voting).事件發(fā)生具有空間相關(guān)性,投票技術(shù)的核心就是相鄰節(jié)點(diǎn)相互交換信息來(lái)驗(yàn)證事件的發(fā)生和事件區(qū)域的可信度;然后進(jìn)行網(wǎng)內(nèi)融合,返回k個(gè)最嚴(yán)重的事件區(qū)域.在投票方法中,通常需要距離因素確定投票權(quán)重,所以節(jié)點(diǎn)的地理位置信息也被傳輸.同樣為公平起見(jiàn),非值得關(guān)注事件節(jié)點(diǎn)不參與到相鄰信息交換過(guò)程中. 評(píng)估指標(biāo)有2個(gè): 1) 數(shù)據(jù)傳輸量 在無(wú)線通信中,數(shù)據(jù)傳輸耗能占總通信耗能開(kāi)銷(xiāo)的大部分,此外數(shù)據(jù)傳輸量對(duì)實(shí)時(shí)性也有很大影響,因此我們把數(shù)據(jù)傳輸量作為一個(gè)重要評(píng)估指標(biāo). 本實(shí)驗(yàn)中,nodeID設(shè)為8位整數(shù)(INTERGER),sev為8位字符(CHAR),溫度T、濕度H、地理位置坐標(biāo)數(shù)據(jù)、serc等都是32位實(shí)數(shù)(因?yàn)槭?2位的實(shí)驗(yàn)平臺(tái)).我們不考慮消息包中的包頭、校驗(yàn)碼等占位信息. 2) 準(zhǔn)確性 我們定義SERQ查詢結(jié)果的準(zhǔn)確性acc(accuracy): 4.2 數(shù)據(jù)傳輸量 我們考察圖5中4種不同NEN比例(10%,20%,30%,50%)的網(wǎng)絡(luò)情況對(duì)于SERQ,voting,central的節(jié)能性能影響.對(duì)于相同NEN比例的網(wǎng)絡(luò)情況,調(diào)整NEN節(jié)點(diǎn)的分布,重復(fù)做實(shí)驗(yàn)10次,分別計(jì)算得到它們平均數(shù)據(jù)傳輸量.上述4種不同NEN比例的網(wǎng)絡(luò)情況下,SERQ,voting,central三種方法的平均數(shù)據(jù)傳輸量如圖6所示. 現(xiàn)象1. 上述4種NEN比例的網(wǎng)絡(luò)環(huán)境下,SERQ的平均數(shù)據(jù)傳輸量都是最少的,central最大,voting介于它們之間.在30%NEN網(wǎng)絡(luò)中,SERQ的平均數(shù)據(jù)傳輸量大概是voting的43.5%,以及約是central的14.9%;在50%NEN網(wǎng)站中,SERQ的平均數(shù)據(jù)傳輸量大概是voting的39.6%,以及約是central的10.4%.在4種NEN比例的網(wǎng)絡(luò)環(huán)境下,SERQ的平均數(shù)據(jù)傳輸量大概是voting的44.7%,以及約是central的18.7%. 解釋.在實(shí)驗(yàn)對(duì)比時(shí),為盡可能地公平,我們都使用GM-Tree作為主干路由結(jié)構(gòu).在central方法中,沒(méi)有要求傳輸原始感知數(shù)據(jù),而是同樣經(jīng)節(jié)點(diǎn)處理后的節(jié)點(diǎn)事件概率值,此外還假設(shè)Sink或基站有全局的網(wǎng)絡(luò)拓?fù)湫畔ⅲ挥脗鬏數(shù)乩砦恢眯畔?在voting方法中,沒(méi)有要求考察所有的鄰居空間相關(guān)性,比如網(wǎng)格邊界節(jié)點(diǎn)的鄰居協(xié)作就沒(méi)有進(jìn)行處理,嚴(yán)格意義上說(shuō)本文的對(duì)比方法voting是一種改良版,相比傳統(tǒng)voting方法的數(shù)據(jù)傳輸量更少.在這些設(shè)置下,我們的SERQ方法仍然具有數(shù)據(jù)傳輸量上的較大優(yōu)勢(shì),這主要:得益于采用了網(wǎng)內(nèi)語(yǔ)義事件信息表示、過(guò)濾和融合的方法,這種方法可以減少原始感知數(shù)據(jù)直接或間接地參與到網(wǎng)內(nèi)融合,有效地減少了數(shù)據(jù)傳輸量,此外,通過(guò)設(shè)置GM,在格內(nèi)語(yǔ)義事件信息收集和融合時(shí),不用傳遞地理位置信息. 現(xiàn)象2. 在每個(gè)不同NEN比例的網(wǎng)絡(luò)中,SERQ和voting的數(shù)據(jù)傳輸量都隨著k值的增加而較為緩慢地增長(zhǎng),而central始終保持不變. Fig. 6 Data transmission comparison of three methods in 20 girds based network圖6 20個(gè)網(wǎng)格劃分下3種方法的數(shù)據(jù)傳輸量比較 解釋.顯而易見(jiàn),central方法和k無(wú)關(guān),因此它的數(shù)據(jù)傳輸量保持不變;而SERQ和voting方法中,k值的大小直接影響了網(wǎng)內(nèi)融合時(shí)過(guò)濾的程度,而且k越小,過(guò)濾的事件區(qū)域信息越多,相應(yīng)地總數(shù)據(jù)傳輸量越小,k增加時(shí)網(wǎng)內(nèi)信息融合過(guò)程中需要保護(hù)的信息較多,因而網(wǎng)內(nèi)數(shù)據(jù)傳輸量會(huì)增加. 現(xiàn)象3. 隨著NEN比例的增加,SERQ,voting,central的平均數(shù)據(jù)傳輸量都有相應(yīng)的增加. 解釋. NEN比例增加,參與傳輸和融合的事件節(jié)點(diǎn)和事件區(qū)域都在增長(zhǎng),最容易理解的就是在central方法中,需要傳輸數(shù)據(jù)的節(jié)點(diǎn)增加,轉(zhuǎn)發(fā)跳數(shù)也在增加,這必然導(dǎo)致整個(gè)網(wǎng)絡(luò)數(shù)據(jù)傳輸量的增加.同理,在SERQ和voting中,增加的NEN可能出現(xiàn)在網(wǎng)絡(luò)的任何位置,顯而易見(jiàn),增加的NEN信息需要參與傳輸和融合,這會(huì)增加數(shù)據(jù)傳輸量;此外如果增加的NEN位置遠(yuǎn)離Sink或基站,網(wǎng)內(nèi)傳輸?shù)目偺鴶?shù)也會(huì)增加. 此外,我們還考察了每個(gè)格覆蓋節(jié)點(diǎn)數(shù)量對(duì)SERQ性能的影響,對(duì)于圖5,每個(gè)格平均覆蓋節(jié)點(diǎn)數(shù)為4.4;當(dāng)GM通信半徑增加到100 m時(shí),圖5可劃分成12個(gè)網(wǎng)格,這時(shí)每個(gè)網(wǎng)格平均覆蓋節(jié)點(diǎn)數(shù)為7.3,與圖5中20網(wǎng)格網(wǎng)絡(luò)實(shí)驗(yàn)的設(shè)置和方法一樣,我們考察圖5中12個(gè)網(wǎng)格網(wǎng)絡(luò)中SERQ,voting,central方法的節(jié)能性.同樣4種NEN比例的網(wǎng)絡(luò)環(huán)境下,上述3種方法的數(shù)據(jù)傳輸量對(duì)比結(jié)果和20個(gè)網(wǎng)格網(wǎng)絡(luò)大致相同,在4種NEN比例的網(wǎng)絡(luò)環(huán)境下,SERQ的平均數(shù)據(jù)傳輸量約是voting的38.7%,以及central的17.7%左右,如圖7所示.其中原因和現(xiàn)象1的解釋相似,不再重復(fù). Fig. 7 Average data transmission comparison of 10%,20%,30% and 50% NENs in 12 girds based network圖7 12格網(wǎng)絡(luò)中4種NEN比例下平均數(shù)據(jù)傳輸量對(duì)比 4.3 準(zhǔn)確度 同樣地,我們考察圖5網(wǎng)絡(luò)中3種不同NEN比例(10%,30%,50%)的網(wǎng)絡(luò)情況對(duì)于SERQ查詢結(jié)果準(zhǔn)確性的影響.相同NEN比例的情況,重復(fù)做實(shí)驗(yàn)10次,計(jì)算得到誤報(bào)數(shù)、漏報(bào)數(shù)和準(zhǔn)確度的平均值. 這里說(shuō)的誤報(bào)(false positive)有2種情況:1)孤立節(jié)點(diǎn)被當(dāng)成事件區(qū)域;2)原本是1個(gè)事件區(qū)域,由于所處的格不同而被當(dāng)成2個(gè)事件區(qū)域.漏報(bào)(false negative)是指由于SERQ算法的原因,那些原本屬于查詢結(jié)果的事件區(qū)域,沒(méi)有出現(xiàn)在結(jié)果集中,值得注意的是,如果SERQ中用戶指定的k值比實(shí)際事件區(qū)域數(shù)量小,而造成的漏報(bào),我們不計(jì)入SERQ漏報(bào)性能評(píng)估,因?yàn)橛脩舨恍枰敲炊嗖樵兘Y(jié)果,這與SERQ算法無(wú)關(guān). 在上述3種NEN比例情況下的事件區(qū)域誤報(bào)數(shù)和漏報(bào)數(shù)如表2~4所示: Table 2 Average Number of False Positive and False Negative with 10% NEN Table 3 Average Number of False Positive and False Negative with 30% NEN Table 4 Average Number of False Positive and False Negative with 50% NEN 現(xiàn)象4. 表2~4沒(méi)有出現(xiàn)事件區(qū)域漏報(bào),而出現(xiàn)少量的誤報(bào).表2中的誤報(bào)主要是孤立NEN引起的誤報(bào),10%的NEN,在k=2時(shí),10組實(shí)驗(yàn)有1個(gè)誤報(bào);k=3時(shí),10組實(shí)驗(yàn)共有3個(gè)誤報(bào);k=4時(shí),10組實(shí)驗(yàn)共有10個(gè)誤報(bào);k=5時(shí),10組實(shí)驗(yàn)共有16個(gè)誤報(bào).表4中,50% NEN的情況,這時(shí)的誤報(bào)是原本屬于1個(gè)事件區(qū)域被誤報(bào)成2個(gè)或更多的事件區(qū)域,如在k=3,4,5時(shí),10組實(shí)驗(yàn)分別有4,6,11個(gè)誤報(bào). 解釋. 只要SERQ查詢中k值夠大,那么SERQ不會(huì)漏報(bào)潛在事件區(qū)域,也就是說(shuō)除非用戶在SERQ查詢中設(shè)置較小k值,這會(huì)漏報(bào)一些潛在事件,但這種漏報(bào)和SERQ方法無(wú)關(guān). SERQ可能會(huì)有誤報(bào),那些serc=0.5的事件區(qū)域內(nèi)只有1個(gè)NEN,因此可能是一個(gè)誤報(bào).如表2中,10%的NEN的情況,整個(gè)網(wǎng)絡(luò)中NEN數(shù)量較少,存在孤立NEN的概率較高,因此SERQ算法在k較大時(shí),誤報(bào)的可能性增加.NEN的比例為50%時(shí),網(wǎng)絡(luò)中有一半的NEN,這時(shí)的空間相關(guān)性比較復(fù)雜,事件區(qū)域往往橫跨幾個(gè)網(wǎng)格,尤其是本實(shí)驗(yàn)的20網(wǎng)格,網(wǎng)格區(qū)域較小,事件區(qū)域更容易包含在幾個(gè)網(wǎng)格中,在SERQ中,由于不做嚴(yán)格的事件邊界檢測(cè),而是以網(wǎng)格劃分事件區(qū)域(節(jié)能考慮),因此在表4中,這種誤報(bào)出現(xiàn)的次數(shù)增加. 總體來(lái)說(shuō),SERQ結(jié)果的準(zhǔn)確度很高,隨著k的增加和NEN比例的增加,準(zhǔn)確度有所下降. NEN比例不大的情況下,k值越小,SERQ會(huì)優(yōu)先選擇那些serc大且事件區(qū)域代表點(diǎn)可信度高的事件區(qū)域,那些孤立的NEN由于serc小,幾乎沒(méi)有機(jī)會(huì)成為SERQ的結(jié)果.就像現(xiàn)象4中解釋的一樣,NEN比例較大時(shí),事件區(qū)域可能會(huì)橫跨幾個(gè)網(wǎng)格,會(huì)造成一些誤報(bào),從而降低了SERQ的準(zhǔn)確度,但是從多組實(shí)驗(yàn)看來(lái),除非NEN分布完全沒(méi)有空間性規(guī)律(這也是不符合實(shí)際的),否則SERQ的總體準(zhǔn)確度還是非常高的. 本文探討了傳感器網(wǎng)絡(luò)中如何節(jié)能而可靠地獲取事件信息的問(wèn)題,提出一種低功耗可靠的語(yǔ)義事件區(qū)域查詢處理方法.我們沒(méi)有利用全部的空間相關(guān)性進(jìn)行事件信息確認(rèn),也不進(jìn)行嚴(yán)格的事件區(qū)域邊界檢測(cè),因?yàn)檫@些操作追求高可靠性而付出的時(shí)間和能耗代價(jià)非常高.本文借鑒了模糊方法中關(guān)于處理不精確性問(wèn)題的思想,語(yǔ)義事件信息代替原始的感知數(shù)據(jù)用于網(wǎng)內(nèi)事件信息的融合,并設(shè)計(jì)了基于模糊理論的分布式語(yǔ)義事件信息表示、過(guò)濾和融合算法.基于真實(shí)數(shù)據(jù)的仿真實(shí)驗(yàn)驗(yàn)證了所提出的方法在節(jié)能和可靠性方面的預(yù)期效果. 如何在可靠性、實(shí)時(shí)性和節(jié)能性之間取得最佳平衡以及本文所涉及的一些函數(shù)和參數(shù)在實(shí)際應(yīng)用系統(tǒng)的設(shè)計(jì)等問(wèn)題都值得進(jìn)一步研究. [1]Wu Tao, Cheng Qi. Online dynamic event region detection using distributed sensor networks[J]. IEEE Trans on Aerospace and Electronic Systems, 2014, 50(1): 393-405 [2]Dziengel N, Seiffert M, Ziegert M, et al. Deployment and evaluation of a fully applicable distributed event detection system in wireless sensor networks[J]. Ad Hoc Networks, 2016, 37(1): 160-182 [3]Xue Wenwei, Luo Qiong, Pung H K. Modeling and detecting events for sensor networks[J]. Information Fusion, 2011, 12(1): 176-186 [4]Amato G, Chessa S, Gennaroa C, et al. Querying moving events in wireless sensor networks[J]. Pervasive and Mobile Computing, 2015, 16(1): 51-75 [5]Ding Lei, Guo Ge. Distributed event-triggered H consensus filtering in sensor networks[J]. Signal Processing, 2015, 108(1): 365-375 [6]Brass P, Na H S, Shin C S. Local event boundary detection with unreliable sensors: Analysis of the majority vote scheme[J]. Theoretical Computer Science, 2015, 607(1): 96-112 [7]Ding Min, Cheng Xiuzhen. Robust event boundary detection in sensor networks—A mixture model approach[C] //Proc of the 28th IEEE Int Conf on Computer Communications. Piscataway, NJ: IEEE, 2009: 2991-2995 [8]Li Yinglong, Chen Hong, Zhao Suyun, et al. Efficient event prewarning for sensor networks with multi microenvironments[C] //Proc of the 19th European Conf on Parallel Processing. Berlin: Springer, 2013: 382-393 [9]Iqbal A, Murshed M. A hybrid wireless sensor network framework for range-free event localization[J]. Ad Hoc Networks, 2015, 27(1): 81-98 [10]Masud M, Christopher L, Shanika K. An adaptive elliptical anomaly detection model for wireless sensor networks[J]. Computer Networks, 2014, 64(1): 195-207 [11]Yang H, Chung C W, Kim M H. An efficient top-kquery processing framework in mobile sensor networks[J]. Data & Knowledge Engineering, 2016, 102(1): 78-95 [12]Li Yinglong, Yang Lianghuai, Lü Mingqi. Event-driven approximate top-kqueries in sensor networks with multi microenvironments[J]. Chinese Journal of Electronics, 2015, 24(2): 373-378 [13]Saleh O, Sattler A. Distributed complex event processing in sensor networks[C] //Proc of the 14th IEEE Int Conf on Mobile Data Management. Piscataway, NJ: IEEE, 2013: 23-26 [14]Xu Xiaolong, Geng Weijian, Yang Geng, et al. An efficient fault-tolerant event and event boundary detection algorithm for wireless sensor networks[J]. Journal of Computer Research and Development, 2014, 51(5): 997-1008 (in Chinese)(徐小龍, 耿衛(wèi)建, 楊庚, 等. 高效容錯(cuò)的無(wú)線傳感器網(wǎng)事件及其邊界檢測(cè)算法[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(5): 997-1008) [15]Shi Shengfei, Zhang Wei, Li Jianzhong. A complex event detection algorithm based on correlation analysis[J]. Journal of Computer Research and Development, 2014, 51(8): 1871-1879 (in Chinese)(石勝飛, 張偉, 李建忠. 一種基于模式匹配與相關(guān)性分析的事件檢測(cè)算法[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(8): 1871-1879) [16]Streit R L. Poisson Point Processes: Imaging, Tracking, and Sensing[M]. Berlin: Springer, 2010: 1-78 [17]Madden S, Franlin M J, Hellerstein J M, et al. TAG: A tiny aggregation service for ad-hoc sensor networks[C] //Proc of the 5th Symp on Operating Systems Design and Implementation. New York: ACM, 2002: 131-146 [18]Zhu Jiang, Lung C H, Srivastava V. A hybrid clustering technique using quantitative and qualitative[J]. Ad Hoc Networks, 2015, 25(1): 38-53 [19]Zhang Yang, Meratnia N, Havinga P. Outlier detection techniques for wireless sensor networks: A survey[J]. IEEE Communications Surveys & Tutorials, 2010, 12(1): 159-170 [20]Galindo J. Handbook of Research on Fuzzy Information Processing in Databases[M]. Hershey, Pennsylvania: IGI Global, 2008 [21]Kapitanova K, Son S H, Kang K D. Using fuzzy logic for robust event detection in wireless sensor networks[J]. Ad Hoc Networks, 2012, 10(1): 709-722 [22]OpenSim Ltd.. Discrete event simulator[EB/OL]. [2011-03-27]. http://www.omnetpp.org [23]Martin V. Sensorscope: Sensor networks for environmental[DB/OL]. [2011-04-17]. http://sensorscope.epfl.ch/index.php/Environmental_Data [24]Samuel M. Intel Lab Data[DB/OL]. [2011-05-18]. http://db.csail.mit.edu/labdata/labdata.html Semantic Event Region Query Processing in Sensor Networks Li Yinglong, Zhu Yihua, and Lü Mingqi (College of Computer Science & Technology, Zhejiang University of Technology, Hangzhou 310023) Sensor networks can be viewed as resources constrained distributed database systems, of which a significant challenge is to develop reliable, energy-efficient methods to extract useful information from distributed sensor data. Most of the existing event (region) detection approaches rely on using raw sensory data, which results in a large amount of data transmission as well as is time-consuming. However, it is difficult to ensure accurate results due to the imprecision and uncertainty of the raw sensor data. In many cases, users neither care about these raw sensory data nor pay attention to the data format during in-network filtering or fusion, but want to get natural language-like semantic event information, such as “how serious it is”, “is it credible?” Moreover, the main technique of the existing event detection is neighboring cooperation, which requires great data exchange between neighboring nodes. It is costly in terms of energy and time. This paper proposes a novel fuzzy methodology based semantic event region query processing approach. Semantic event information instead of raw sensor data is used for in-network fusion, and fuzzy method based distributed semantic event information description, filtering and fusion approaches are devised. The experimental evaluation based on real data set show that the proposed approach has good performance in terms of energy efficiency and reliability. semantic event information; fuzzy methodology; energy efficiency; reliability; sensor network Li Yinglong, born in 1981. PhD and lecturer. Member of CCF. His main research interests include data processing and mobile computing in sensor networks. Zhu Yihua, born in 1961. PhD and professor. Senior member of CCF. His main research interests include the Internet of things (IoT), wireless networks, and network coding. Lü Mingqi, born in 1981. PhD and lecturer. Member of CCF. His main research interests include ubiquitous computing, data mining. 2016-08-15; 2016-12-20 國(guó)家自然科學(xué)基金項(xiàng)目(61502421,61432015);浙江省自然科學(xué)基金項(xiàng)目(LY15F020026,LY15F020025) This work was supported by the National Natural Science Foundation of China (61502421, 61432015) and the Natural Science Foundation of Zhejiang Province of China (LY15F020026, LY15F020025). 朱藝華(yhzhu@zjut.edu.cn) TP391; TP393
4 實(shí)驗(yàn)結(jié)果與分析








5 總 結(jié)


