999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

單飛行事件噪聲關聯規則挖掘及信念網絡表示

2016-04-09 02:23:23楊婷婷謝繼文
中國民航大學學報 2016年1期

徐 濤,楊婷婷,謝繼文

(中國民航大學a.計算機科學與技術學院;b.中國民航信息技術科研基地,天津 300300)

?

單飛行事件噪聲關聯規則挖掘及信念網絡表示

徐濤a,b,楊婷婷a,謝繼文b

(中國民航大學a.計算機科學與技術學院;b.中國民航信息技術科研基地,天津300300)

摘要:挖掘各種噪聲影響因素與機場噪聲之間的關聯規則,能夠為機場經營者制定有效的降噪措施提供科學依據。先將FP-Growth算法與數據立方體相結合,構造FP-Growth-Cube算法挖掘單飛行事件噪聲與各噪聲影響因素之間的關聯規則,然后通過信念網絡可視化表示關聯規則。此方法不但直觀、清晰,而且克服了關聯規則不能表達不同規則之間聯系的弱點,圖形化地綜合表示各因素對噪聲的影響。最后,實驗從降噪措施之一的機型選擇角度,與權威噪聲預測軟件INM對比,驗證了該方法的可行性和有效性。

關鍵詞:單飛行事件噪聲;關聯規則;信念網絡;FP-Growth-Cube算法

近年來,中國民航業發展的速度令人矚目,航空運輸量不斷增加,機場噪聲對環境的污染日益加劇,由機場噪聲引起的糾紛已經是航空業不能回避的棘手問題。因此,有效控制機場噪聲對周邊環境的影響刻不容緩。

機場噪聲是由諸多單飛行事件所引起的噪聲污染[1]。單飛行噪聲事件指單架航空器一次飛行對地面產生的噪聲影響,是由各種噪聲影響因素綜合作用的結果。目前,主要根據計算模型來預測噪聲,其中美國聯邦航空局(FAA)提出的綜合噪聲模型[2](integrated noisemodel,INM)最具權威性。該模型以飛機噪聲距離曲線(NPD曲線)為核心,首先根據機型、發動機推力、飛機速度、飛行航跡、飛行剖面和飛機與監測點的直線距離等參數計算噪聲級,并在此基礎上根據機場特定環境條件,運用相應修正模型對噪聲級進行修正,從而得出實際噪聲級。但該模型需要全面、精確的輸入參數,在現實世界中難以獲取,因而不但增加了成本而且降低了預測準確度。研究表明[3-4],將實測噪聲數據中隱含的知識規律與聲學傳播模型結合,可以大大提高預測噪聲的準確率。機器學習和數據挖掘技術的發展為這種方法提供了良好的基礎。

由于機場噪聲與其影響因素之間存在復雜的非線性依賴關系,很難建立相應的函數模型。針對上述問題,本文通過挖掘機場歷史噪聲數據集中隱含的關聯規則,以發現單飛行事件噪聲影響因素與機場噪聲之間的依賴關系,為機場管理者制定降噪措施提供有力的科學依據。

關聯規則[5-6]是數據挖掘(datamining)中的一個主要研究分支,側重于發現數據中不同屬性之間的聯系,已廣泛應用于各個領域。目前,關聯規則的研究集中在2個方面:①對關聯規則挖掘算法的研究;②對關聯規則可視化表示方法的研究。人們已提出多種表示方法來支持用戶對關聯規則的觀察和分析。主要有基于表的關聯規則表示、基于二維矩陣[7]的表示、基于平行坐標[8]的表示、基于規則多邊形的表示技術。但都不能綜合表達不同規則之間的聯系。如一個事件由多種因素導致,各因素起的作用大小不同,即使每個因素和結果之間都可以挖掘到關聯規則,也不能綜合考慮到所有因素以及各因素作用的大小。因此關聯規則很難應用到如機場噪聲這樣復雜的領域中。而信念網絡能圖形化地綜合考慮各個因素的概率依賴關系。信念網絡與關聯規則結合起來應用,能夠取長補短,克服關聯規則無法綜合各種影響因素的缺點。

針對以上研究的不足,本文先用FP-Growth算法[9]與數據立方體[10]相結合,構造FP-Growth-Cube算法挖掘機場噪聲歷史數據集,挖掘出單個飛行事件噪聲與各種噪聲影響因素之間的關聯規則。然后,以信念網絡可視化表示這些關聯規則。信念網絡能圖形化地綜合考慮各因素的概率依賴關系,與關聯規則結合起來應用,不但直觀、清晰,而且可以綜合表示出單飛行事件噪聲與各影響因素之間的關聯。關聯規則本身表達了數據中蘊含的知識,反過來,可為構建信念網絡提供有效的先驗知識,構建的網絡具有較高的可接受度。

1 基本概念及理論

1.1關聯規則

令I= {i1,i2,…,im}為項的集合,W稱為交易的集合,W中每個交易T為項的集合,即T?I。一條關聯規則是如下形式的蘊含式X?Y,其中X?I,Y?I且X∩Y =φ。關聯規則的強度可以用支持度(sup)和置信度(conf)度量。支持度確定X∪Y在交易集合W中的頻繁程度,置信度確定Y在包含X的事務中出現的頻繁程度。

在交易集合W中所有滿足支持度閾值(ms)和置信度閾值(mc)的規則稱為強關聯規則。挖掘關聯規則可分為2個子問題。

1)尋找頻繁項集,其支持度超過ms;

2)尋找關聯規則,從頻繁項集中產生。如果ABCD 和AB是頻繁項集,那么,通過計算置信度c=s(ABCD)/ s(AB)來確定規則AB?CD是否成立。當c不小于mc時,規則成立。符號s(X)表示X的支持度。

1.2FP-Grow th算法

FP-Growth算法的基本思想是利用樹結構對事務進行壓縮,同時保留屬性之間的關系。該算法的重要步驟是通過2次掃描數據集構造FP樹:第1次掃描數據集,找出頻繁1-項集并按照支持度計數降序排列;第2次掃描數據集,以“null”為根節點,通過把數據集中每條記錄映射到FP樹中的一條路徑來構建FP樹。該算法不會產生候選項集,而采用增長頻繁集的方法進行數據挖掘。FP-tree的構造流程如圖1所示。

圖1 FP-Grow th算法的流程圖Fig.1 Flow chart of FP-grow th construction

1.3信念網絡

20世紀80年代,Pearl[11]基于概率論和圖論提出信念網絡,并成功研發基于信念網絡的專家系統。由于信念網絡具有嚴密的推理過程、清晰的語義表達和靈活的學習機制等優點,成為人工智能的一個研究熱點。

信念網絡(beliefnetworks),又稱貝葉斯信念網絡(bayesian beliefnetworks)。信念網絡的理論依據是圖論和概率論:圖論主要用來形象化地表達變量之間的依賴關系,在此基礎上,基于概率推理。為更好地說明信念網絡,首先說明貝葉斯公式。

設實驗E有一個樣本空間S,Cy為E的一個事件,事件D1,D2,…,Dz互不相容且有D1∪D2∪…∪Dz= S,P(Di)>0(i=1,2,…,z),根據乘法定理和條件概率可以得到貝葉斯公式為

信念網絡由2部分組成,分別對應變量依賴關系的直觀定性描述和定量描述:①有向無環圖(directed acyclic graph,DAG),用來表示信念網絡結構。每個DAG包括若干個節點和連接這些節點的有向邊,每個節點代表一個隨機變量。若2個節點被有向邊連接,表示它們之間存在依賴關系,且依賴關系具有方向性(由父節點指向子節點)。若2個節點之間沒有連接就表示它們對應的變量相互獨立。②條件概率表(conditionalprobability table,CPT),用來定量表示變量的之間關聯性。概率表用概率值定量地表示子節點與其父節點之間的關聯強度,對應關聯規則挖掘中的置信度。有向無環圖是問題領域的宏觀描述,直觀清晰地表達了變量之間的關聯關系,而條件概率表精確地表達了變量之間關聯強度。雖然關聯規則本身可以表達變量之間的關聯強度,但是,這種關聯關系比較零散,不利于對問題的綜合考量。

2 數據關聯規則的挖掘及信念網表示算法

2.1關聯規則的挖掘及信念網絡表示

數據立方體(data cube)是OLAP中一種多維數據結構,存儲多維數據和聚集量。

FP-Growth-Cube算法利用數據立方體具有便于多維關聯規則支持度計數的優勢。對一個n維關聯規則挖掘任務,可以通過OLAP操作生成數據立方體,其包含n+1個維,前n列存儲數據集本身的n個互不相同的維成員,最后一列存儲一個稱為“聚集量”的維成員,記錄對應的邊緣總和,記為count,對應關聯規則挖掘中的頻繁度計數。聚集量十分便于關聯規則挖掘中的支持度計算,節省關聯規則挖掘時間,提高挖掘的效率。

FP-Growth-Cube算法就利用了多維關聯規則便于支持度計數的優勢,其基本思想是先通過數據預處理將原始數據集存儲在一個數據立方體中,然后通過FP-Growth算法挖掘該數據立方體中隱含的關聯規則。FP-Growth-Cube算法描述如表1所示。

關聯規則形式簡單,能方便地表達事件之間的依賴關系,但它不能表達不同規則之間的聯系。而信念網絡能圖形化地綜合考慮各個影響因素的概率依賴關系。反過來,關聯規則挖掘到的知識可以作為信念網絡的先驗知識,所建立的網絡具有較高的可接受度,且它們都是以概率論為理論基礎的,具有理論可行性[12]。關聯規則的信念網絡表示算法描述如表2所示。

表1 FP-grow th-cube算法Tab.1 FP-grow th-cube algorithm

表2 關聯規則的信念網絡表示算法Tab.2 Belief network representation algorithm of association rules

2.2數據預處理

單飛行事件的噪聲影響因素[13]包括:飛機型號、飛行航跡、發動機推力、飛行速度、操作模式(起飛或降落),和氣象條件如風速、風向和溫度等。研究發現,發動機推力常與飛機型號有密切的關系,且此參數的精確值難以獲取,不適合作關聯規則挖掘的輸入參數。飛行航跡是飛機在起飛或降落的整個過程的飛行軌跡,同一航跡對不同噪聲監測點的噪聲不同。雖然一條航跡只對應于一個單飛行事件,但通常一條航跡上可以發生多個噪聲事件。還采用飛機到監測點的直線距離替代航跡作為輸入參數更為科學。有效感覺噪聲級(effective perceived noise level,EPNL)不但考慮了噪聲的持續時間,還考慮了特性噪聲的頻譜特性等,能夠很好地評價機場噪聲對人體的影響。因此,選擇飛機機型(TYPE)、飛機到噪聲監測點的直線距離(DISTANCE)簡稱直線距離、操作模式(OPERTATI-ON,DEP表示起飛、ARR表示降落)、平均風速(W IND_AVG)、風向(W IND_DIRE,包括東E、南S、西W、北N、東北NE、東南SE、西北NW、西南SW共8個方向)、溫度(TEMPERATURE)和有效感覺噪聲級(EPNL)這幾個屬性作為關聯規則挖掘的輸入參數,挖掘單飛行事件噪聲影響因素與噪聲之間的依賴關系。

2.2.1數據清洗

與其它現實世界的數據一樣,由于環境噪聲、設備故障等原因,在監測過程中機場噪聲數據,常常不一致、不完全、有誤差。因此進行數據清洗是必要的。

根據聲環境質量標準(GB 3096)[14],機場噪聲事件的定義為產生大于65 dB噪聲且持續時間超過10 s的飛行事件。針對單飛行事件噪聲數據集進行清洗的手段包括:刪除缺失數據、修正臟數據、剔除環境噪聲和篩選出大于65 dB的噪聲值等。清洗后的噪聲數據集示例如表3所示。

表3 清理后的單飛行事件產生的噪聲數據集示例Tab.3 Sam ple data of noise event sets for cleaned single flight

2.2.2數據準備

1)數值區間化

關聯規則處理連續屬性數據集的一般方法是將其離散化為數據區間,這是因為直接挖掘連續數值屬性,支持度會非常低,難以得到頻繁項集。這里采用蒲式風級離散化風速,將其量化為1級至12級后,就將風向與風速合并為一個屬性。例如,北風1級表示為N1。將溫度(℃)離散化為below(-∞,0]、low(0,15]、mild(15,28]和high(28,+∞)。將飛機與噪聲監測點的直線距離(m)離散化為VN(0,1 000]、NEAR(1 000,2 000]、MIDDLE(2 000,3 000]和FAR(3 000,+∞]。由于噪聲值大多數集中于[75,95]dB,采用等分法劃分為以下區間:A(65,75]、B(75,80]、C(80,85]、D(85,90]、E (90,95]、F(95,+∞]。

2)生成n維數據立方體

為提高挖掘效率,采用基于量化屬性的靜態離散化技術生成噪聲數據立方體,如表4所示。

表4 單飛行事件噪聲數據立方體示例Tab.4 Sam ple data cube of noise event sets for single flight

3 實驗結果與分析

為驗證本文算法的正確性、有效性,從國內某大型機場2010年的歷史監測數據中選取運輸能力相似的幾種中型機(如B733、A319、A320、A321)的噪聲數據進行實驗,采用FP-Growth-Cube算法挖掘出關聯規則61條,挖掘到的部分規則如下:

OPERTATION =[ARR],TYPE =[B738],

TEMPERTURE =[low]?EPNL=[C]

(sup=6.5%,conf=95%)

OPERTATION =[DEP],TYPE =[B744],

W IND =[SE2],DISTANCE =[FAR]?EPNL=[B]

(sup=5.79%,conf=74.9%)

將挖掘到的關聯規則表示為如圖2所示的信念網絡,截取溫度為mild時各飛機機型產生噪聲的概率表如表5所示。同時,將相同條件下的單飛行事件輸入權威噪聲預測軟件INM中,輸出每種機型的噪聲分段的影響面積如表6所示,從這2個不同的方面,比較這幾種中型機的噪聲污染情況。

圖2 關于單飛行事件噪聲的信念網絡Fig.2 Belief network of noise event for single flight

從表5的實驗結果可以得出,當飛機起飛時,機型A319最可能產生的噪聲影響C(80,85]dB,其發生概率為0.488。而其他3種機型(B733,A320,A321)最可能產生的噪聲影響是D(85,90]dB,對應的概率分別為0.44,0.488和0.464。當飛機降落時,機型A319最可能產生的噪聲影響還是C(80,85]dB,對應的概率是0.476。其他3種機型最可能產生的噪聲影響為D (85,90]dB,對應的概率分別是0.388,0.438和0.392。總而言之,無論是起飛還是降落,機型A319最可能產生的噪聲影響分貝段為C段,而其他3種機型為D段。因此,機型A319產生噪聲污染較小。

表5 截取部分概率表Tab.5 Intercepted p robability table of noise im pact

表6 噪聲影響面積Tab.6 Noise im pact area

表6的實驗結果說明,無論起飛還是降落,機型A319和A321在C(80,85]dB的噪聲影響面積相差不多。當飛機降落時,機型A319和A321產生在F(95,+ ∞]dB的噪聲影響面積相同。然而,總體來說,無論起飛還是降落A319產生的總體噪聲影響面積明顯小于其他幾種機型的影響面積。從另一個角度證明,此種機型產生的噪聲污染小。

兩實驗對比,得到相同的結論,驗證了關聯的信念網絡表示算法的有效性。

4 結語

本文分析了單個飛行事件的噪聲及其主要影響因素的特征,通過對機場歷史噪聲數據集進行關聯規則挖掘,并用信念網絡實現規則的綜合可視化表示。最后采用國內某擁有噪聲監測系統的大型機場2010年的歷史監測數據集對其進行了驗證,通過理論及實驗證明,相對于傳統預測模型,本文提出的方法只需要少量的參數,能夠有效、直觀地為機場管理層制定諸如機型選擇等降噪有效措施提供科學的依據。

參考文獻:

[1]徐濤,燕憲金,楊國慶.基于神經網絡集成的單個飛行事件噪聲預測模型[J].中國環境科學,2014,34(2):539-544.

[2] FAA.FAR150,AirportNoise Compatibility Planning[S].2006.

[3]尹志宇.基于L-M神經網絡的道路交通噪聲預測研究[J].中國環境監測,2009,25(4):84-87.

[4]杜繼濤,張育平,徐濤.一種BP神經網絡機場噪聲預測模型[J].計算機工程與應用,2013,49(9),236-239.

[5]毛宇星,陳彤兵,施伯樂.一種高效的多層和概化關聯規則挖掘方法[J].軟件學報,2011,22(12):2965-2980.

[6] AGRAW AL R,IMIELINSKIT,SW AMIA.Mining Association Rules between Sets of Items in Large Databases[C]//Proceedingsof the ACM SIGMOD Conference on Management of Data.W ashington DC:ACM,1993:207-216.

[7] W ONG P C,W HITNY P,THOMAS J.Visualizing Association Rules for TextMining[C]//Proceedingsof the IEEE Symposium on Information Visualization Richland,W A,1999:120-123.

[8] BRUZZESED,BUONO P.CombiningVisualTechniquesforAssociation Rules Exploration[C]//Proceedingsof the ACM Conferenceon Advanced Visual Interfaces.New York,2004:381-384.

[9] HAN J,PEI J,YIN Y.Mining Frequent Patterns without Candidate Generation[C]//Proceedingsof the ACM SIGMOD Conferenceon ManagementofData,Dallas.TX:ACM,2000:1-12.

[10]賀瓊,劉潭仁,郭平.數據立方體上多維多層挖掘算法[J].計算機應用,2004,24(3):85-88.

[11] PEARL J.Probabilistic Reasoning in Intelligent Systems:Networks of Plausible Inference[M]. SanMateo:Morgan Kaufmann Publisher,Inc,1988.

[12]趙海豐.關聯規則挖掘及貝葉斯網表示研究[D].重慶:重慶大學,2007.

[13]徐濤,楊奇川,呂宗磊.一種基于動態集成學習的機場噪聲預測模型[J].電子與信息學報,2014,36(7):1631-1636.

[14]GB9660-1988,機場周圍飛機噪聲環境標準[S].北京:中國標準出版社,1988.

(責任編輯:劉智勇)

Exp loration and belief network representation of association rules between noise event sets for single flight

XU Taoa,b,YANG Tingtinga,XIE Jiwenb
(a.CollegeofComputerScienceand Technology;b.Information Technology Research Base,CAUC,Tianjin 300300,China)

Abstract:Exploration of the relation ship between factorsand airportnoises can help airportoperators adopteffective noise reduction measures.FP-growth-cube algorithm is used to find the association rules between noise and factors. The association rules are represented in the form of belief network.The representation of association rules is intuitive and clear,which can overcome the weakness of association rules,which can not express all airport noise influencial factors synthetically.Experimental results prove the feasibility and effectiveness of themethod from the viewpointofone noise reductionmeasure-aircraft type selection.

Key words:noise event forsingle flight;association rules;beliefnetwork;FP-Growth-Cube algorithm

作者簡介:徐濤(1962—),男,重慶人,教授,博士,研究方向為智能信息處理、民航信息系統理論與安全等.

收稿日期:2014-12-29;修回日期:2015-03-19基金項目:國家自然科學基金重點項目(61139002);國家高技術研究發展計劃(863)(2012AA06 3301);國家科技支撐計劃(2014BAJ04B02);中國民用航空局科技基金項目(MHRD201006,MHRD201101);中央高校基本科研業務費專項(3122013P013)

中圖分類號:O177.91;O241.7

文獻標志碼:A

文章編號:1674-5590(2016)01-0027-05

主站蜘蛛池模板: 精品人妻无码区在线视频| 欧美一级在线播放| 精品无码视频在线观看| 91口爆吞精国产对白第三集| 久热re国产手机在线观看| 尤物国产在线| 欧美a级完整在线观看| 在线免费不卡视频| 亚洲成a人片| 亚洲午夜天堂| 久久国产精品影院| 国产91透明丝袜美腿在线| 青青青国产视频手机| 午夜啪啪网| 91激情视频| yjizz国产在线视频网| jizz在线免费播放| a毛片在线播放| 97在线公开视频| 91精品国产一区自在线拍| 精品无码人妻一区二区| 国产成人亚洲精品色欲AV| 欧美成人精品在线| 日韩在线欧美在线| 一本色道久久88综合日韩精品| 亚洲色图欧美一区| 国产v欧美v日韩v综合精品| 91av成人日本不卡三区| 欧美日韩国产综合视频在线观看| 日韩黄色大片免费看| 久久中文电影| 大香网伊人久久综合网2020| 中文字幕在线看视频一区二区三区| 亚洲男人的天堂久久精品| 亚洲成肉网| 中文字幕亚洲综久久2021| 亚洲日本中文字幕乱码中文 | 国产第一色| 久久免费视频6| 日韩av手机在线| 狠狠色狠狠色综合久久第一次| www亚洲精品| 色哟哟国产精品一区二区| 国产精品第| 麻豆精品在线播放| 国产亚洲欧美在线人成aaaa| 午夜啪啪福利| 中文字幕无线码一区| www.亚洲一区| 亚洲福利一区二区三区| 国产欧美在线视频免费| 99精品在线看| 国产大全韩国亚洲一区二区三区| 欧美亚洲欧美| 日本精品视频一区二区 | 国产成人超碰无码| 亚洲av片在线免费观看| 午夜在线不卡| 国产精品美乳| 亚洲视频黄| 色综合久久88色综合天天提莫| 毛片在线看网站| 亚洲av无码人妻| 日韩av高清无码一区二区三区| 国产一区二区三区免费观看| 一本大道视频精品人妻| 色国产视频| 久久99热这里只有精品免费看| 国产精品中文免费福利| 91精品综合| 99久久人妻精品免费二区| 国产精品亚洲综合久久小说| 免费在线成人网| 毛片最新网址| 国产成人精品日本亚洲| 四虎精品黑人视频| 国产男人天堂| 国产福利影院在线观看| 在线观看欧美国产| 波多野结衣一区二区三区四区| 曰AV在线无码| 国产 日韩 欧美 第二页|