999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進(jìn)Apriori算法的氣象數(shù)據(jù)質(zhì)量控制研究

2021-06-30 08:43:24韓格格黃艷紅姜娜娜徐曉慶
電子測試 2021年5期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)庫

韓格格,黃艷紅,姜娜娜,徐曉慶

(寧夏氣象信息中心,寧夏銀川,750002)

0 引言

Apriori是數(shù)據(jù)挖掘經(jīng)典算法之一,但是也具有一定局限性。Apriori算法每次生成頻繁集都要重復(fù)掃描一次數(shù)據(jù)庫,因此時間成本較大。王偉等[1]提出一種B_Apriori算法,該算法只需對數(shù)據(jù)庫進(jìn)行一次掃描,然后通過邏輯運(yùn)算的方式,計算出每一項(xiàng)的次數(shù),最終得到頻繁項(xiàng)集。李亮等[2]針對經(jīng)典Apriori算法的性能存在的問題,提出T-Apriori算法,該算法也只需要掃描一次數(shù)據(jù)庫,將數(shù)據(jù)轉(zhuǎn)化為布爾值矩陣,通過計算找出頻繁項(xiàng)集。這些改進(jìn)后的算法與Apriori算法相比,雖然達(dá)到一定縮減時間的目的,但只是減少了數(shù)據(jù)庫掃描的次數(shù),并沒有縮小數(shù)據(jù)庫的規(guī)模。本文提出一種基于布爾矩陣的壓縮矩陣頻繁項(xiàng)集挖掘算法,將矩陣進(jìn)行多次壓縮,對壓縮后矩陣的行向量進(jìn)行邏輯運(yùn)算,計算出每一項(xiàng)出現(xiàn)的次數(shù),最終得到頻繁項(xiàng)集,可以同時達(dá)到縮減掃描數(shù)據(jù)庫次數(shù)和縮小數(shù)據(jù)庫規(guī)模的目的。

1 基于關(guān)聯(lián)規(guī)則算法的氣象觀測數(shù)據(jù)質(zhì)量控制模型

基于關(guān)聯(lián)規(guī)則的氣象觀測數(shù)據(jù)質(zhì)量控制算法包括以下三個步驟,即數(shù)據(jù)離散化處理、產(chǎn)生關(guān)聯(lián)規(guī)則、進(jìn)行規(guī)則匹配[3]。

2 數(shù)據(jù)離散化處理

關(guān)聯(lián)規(guī)則的挖掘需要離散型數(shù)據(jù), 臺站得到的氣象觀測數(shù)據(jù)都是連續(xù)的,因此首先要對得到的基礎(chǔ)數(shù)據(jù)做離散化處理。將基礎(chǔ)數(shù)據(jù)中的各個氣象要素按照現(xiàn)行標(biāo)準(zhǔn),進(jìn)行等級劃分。以溫度為例,將數(shù)據(jù)按照以下等級劃分:大寒(-10 ~-14.9℃)、小寒 (-5 ~-9.9℃ )、輕寒 (-4.9 ~0℃ )、微寒 (0 ~4.9℃ )、涼 (5 ~9.9℃ )、溫涼 (10 ~11.9℃ )、微溫涼(12 ~13.9℃ )、溫和 (14 ~15.9℃ )、微濕和 (16 ~17.9℃ )、溫暖 (18 ~19.9℃ )、暖 (20 ~21.9℃ )、熱 (22 ~24.9℃ )等。

3 產(chǎn)生關(guān)聯(lián)規(guī)則

3.1 Apriori算法

3.1.1 定義及性質(zhì)

定義:Apriori算法是一種用迭代思想來挖掘出頻繁項(xiàng)集的算法,通過”k-1項(xiàng)頻繁項(xiàng)集"得到”k-項(xiàng)候選項(xiàng)集",進(jìn)而得到“k-項(xiàng)頻繁項(xiàng)集”。首先,找出頻繁”1-項(xiàng)集"的集合L1,通過L1找出頻繁”2-項(xiàng)集"的集合L2,依次尋找L3、L4… Lk-1,直到不能找出頻繁”k-項(xiàng)集"為止。

支持度(support):support(A=>B) = P(A ∪ B),表示要素A和要素B同時出現(xiàn)的概率。

性質(zhì)1 若項(xiàng)集Lk是頻繁項(xiàng),那么Lk除空集外的所有子集也都是頻繁的;

推論1 若項(xiàng)集Lk是非頻繁項(xiàng),那么所有包含Lk的項(xiàng)集都是非頻繁項(xiàng)集,因此包含Lk的項(xiàng)集可以直接刪除[4]。

3.1.2 算法流程

步驟1:設(shè)定一個最小支持度,將項(xiàng)集中所有不小于最小支持度的項(xiàng),作為頻繁1-項(xiàng)集 L1;步驟2:通過L1自身連接生成候選項(xiàng)集C2;步驟3:根據(jù)上述性質(zhì)1和推論1,將候選項(xiàng)集C2進(jìn)行剪枝處理;步驟4:生成2-項(xiàng)頻繁項(xiàng)集L2;步驟5:重復(fù)步驟2~步驟4,直到不能找出頻繁”k-項(xiàng)集”為止。

3.1.3 產(chǎn)生關(guān)聯(lián)規(guī)則

通過以上步驟,將得到的所有滿足最小支持度的頻繁項(xiàng)集作為關(guān)聯(lián)規(guī)則,形成關(guān)聯(lián)規(guī)則庫。

3.2 改進(jìn)算法

不難看出,Apriori算法每一次尋找Lk的過程都要掃描數(shù)據(jù)庫D,挖掘頻繁項(xiàng)集存在時間效率低下的局限性,因此本文提出壓縮矩陣的頻繁項(xiàng)集挖掘算法。根據(jù)頻繁項(xiàng)集的性質(zhì),通過對矩陣壓縮來縮小數(shù)據(jù)庫規(guī)模,進(jìn)而對壓縮后矩陣的行向量作邏輯“與”運(yùn)算,加快計算的速度,提高效率,即本文提出的MC_Apriori算法。

3.2.1 布爾矩陣定義及性質(zhì)

定義: 將數(shù)據(jù)庫D按以下規(guī)則轉(zhuǎn)化為矩陣M,項(xiàng)作為行,事務(wù)作為列,如果第j個項(xiàng)集在第i個事務(wù)中存在,則矩陣M的第i行、第j列的值dij=1,如果不存在,則dij=0。若數(shù)據(jù)庫 D 中含有n個事務(wù)(T1,T2…Tn), m個項(xiàng)(I1,I2…Im),則M可以表示為:

性質(zhì)2:如果布爾矩陣M中某一項(xiàng)dnm與其他項(xiàng)進(jìn)行“邏輯與”運(yùn)算時,結(jié)果都是非頻繁項(xiàng)集,則可以將此列從布爾矩陣 M中刪除。

性質(zhì)3:如果布爾矩陣中某一行的項(xiàng)數(shù)之和小于k,尋找頻繁k-項(xiàng)集時,則可以將此行從布爾矩陣 M中刪除。

3.2.2 MC_Apriori算法流程

步驟1: 將數(shù)據(jù)庫D轉(zhuǎn)化為布爾矩陣M;

步驟2:對布爾矩陣M中的列向量進(jìn)行運(yùn)算,與設(shè)定的最小支持度比較,得到1-項(xiàng)頻繁集L1;

步驟3:尋找頻繁1-項(xiàng)集時,如果項(xiàng)Ii是非頻繁的,則可以將此列從布爾矩陣 M中刪除,生成壓縮矩陣M1,得到頻繁1-項(xiàng)集;

步驟4:尋找頻繁k-項(xiàng)集時(k>=2),某一行的項(xiàng)數(shù)之和小于k,則可以將此行從布爾矩陣 M中刪除,生成壓縮矩陣Mk,計算得到頻繁k-項(xiàng)集;

步驟5:重復(fù)步驟4,直到不能產(chǎn)生頻繁k-項(xiàng)集為止。

4 規(guī)則匹配

將得到的所有滿足最小支持的頻繁項(xiàng)集作為關(guān)聯(lián)規(guī)則,用待檢測的氣象觀測數(shù)據(jù)中的每條記錄及其所有組合與關(guān)聯(lián)規(guī)則庫中的關(guān)聯(lián)規(guī)則進(jìn)行匹配,直到遍歷完所有的規(guī)則為止,如果出現(xiàn)k條相匹配的規(guī)則,則認(rèn)定當(dāng)前觀測記錄為正常記錄,否則為異常記錄。

5 算法實(shí)驗(yàn)

5.1 數(shù)據(jù)的采集與預(yù)處理

選取寧夏石炭井站2020年7月~8月的700條數(shù)據(jù)作為樣本數(shù)據(jù),選擇氣溫、10分鐘平均風(fēng)速、本站氣壓、整點(diǎn)相對濕度四個要素為例進(jìn)行實(shí)驗(yàn)。經(jīng)過等級劃分預(yù)處理過的數(shù)據(jù)如圖1所示。

圖1 預(yù)處理之后數(shù)據(jù)

5.2 數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘

(1)產(chǎn)生關(guān)聯(lián)規(guī)則

用Apriori關(guān)聯(lián)規(guī)則算法和MC_Apriori算法計算頻繁項(xiàng)集,設(shè)置最小支持度閾值為0.05,獲得實(shí)驗(yàn)數(shù)據(jù)集中的頻繁項(xiàng)集共85項(xiàng),將這些頻繁項(xiàng)集作為關(guān)聯(lián)規(guī)則。獲得的部分關(guān)聯(lián)規(guī)則如圖2。

圖2 部分關(guān)聯(lián)規(guī)則

(2)改進(jìn)前算法和改進(jìn)后算法的時效對比

將Apriori關(guān)聯(lián)規(guī)則算法和MC_Apriori算法處理數(shù)據(jù)產(chǎn)生頻繁項(xiàng)集的時間進(jìn)行對比。

對比結(jié)果表明:最小支持度小于0.35時,改進(jìn)后的算法在時間效率上明顯優(yōu)于改進(jìn)前的算法。

5.3數(shù)據(jù)的規(guī)則匹配

在700條樣本觀測數(shù)據(jù)中,植入30條異常數(shù)據(jù)進(jìn)行測試。以氣溫為例,在原始?xì)鉁刂档幕A(chǔ)上將每條氣溫值增加10攝氏度作為異常數(shù)據(jù)。設(shè)置質(zhì)量控制參數(shù)k=8,如果滿足匹配8條關(guān)聯(lián)規(guī)則庫中的規(guī)則時判定為正常數(shù)據(jù),否則判定為異常數(shù)據(jù)。

檢測結(jié)果為:30條異常數(shù)據(jù)中檢測出28條,存在2條異常數(shù)據(jù)被誤檢,找出錯誤數(shù)據(jù)率達(dá)到93.3%。其余670條數(shù)據(jù)中檢測出正確數(shù)據(jù)為662條,存在8條數(shù)據(jù)被誤檢,誤檢率為1%。

6 結(jié)論

本文提出基于關(guān)聯(lián)規(guī)則的氣象觀測數(shù)據(jù)質(zhì)量控制算法的模型,分析了Apriori算法存在的不足,提出了一種改進(jìn)的MC_Apriori算法,對事務(wù)數(shù)據(jù)庫對應(yīng)的布爾矩陣進(jìn)行行、列壓縮縮減數(shù)據(jù)庫規(guī)模,然后利用按位與運(yùn)算提高頻繁項(xiàng)集統(tǒng)計的速度,克服了傳統(tǒng)Apriori算法重復(fù)掃描數(shù)據(jù)庫的缺陷,提高了算法的執(zhí)行效率。同時對Apriori算法與MC_Apriori算法進(jìn)行了時間性能比較,仿真結(jié)果表明在一定的支持度范圍內(nèi),MC_Apriori算法比Apriori算法更具時效性。最后,植入異常數(shù)據(jù),與規(guī)則庫中的關(guān)聯(lián)規(guī)則進(jìn)行規(guī)則匹配,找出錯誤數(shù)據(jù)率達(dá)93.3%。

猜你喜歡
關(guān)聯(lián)規(guī)則數(shù)據(jù)庫
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨(dú)的規(guī)則和演變
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 中文成人在线视频| 中文字幕在线看| 国产sm重味一区二区三区| 亚洲伊人久久精品影院| 最新国产麻豆aⅴ精品无| 激情在线网| 国产18在线| 四虎永久在线| 国产午夜人做人免费视频中文| 国产欧美亚洲精品第3页在线| 国产精品第页| 久久久无码人妻精品无码| 国产屁屁影院| 天天色天天操综合网| 欧美成在线视频| 欧美精品xx| 亚洲欧美在线综合图区| 久久频这里精品99香蕉久网址| 亚洲精品动漫在线观看| 国产美女在线免费观看| 亚洲国产日韩视频观看| 亚洲免费毛片| 极品国产一区二区三区| 成人免费一级片| 中文字幕在线看| 亚洲天堂成人在线观看| 亚洲精品午夜无码电影网| 亚洲日韩精品无码专区97| 国产日本一区二区三区| 亚洲中文在线视频| av免费在线观看美女叉开腿| 亚洲男人天堂2020| 亚洲精品综合一二三区在线| 亚洲精品在线91| 国产乱人视频免费观看| 国产一级毛片网站| 天天综合色网| 免费毛片全部不收费的| 亚洲综合香蕉| 日韩国产综合精选| 亚洲激情99| 欧美不卡视频在线观看| 亚洲系列中文字幕一区二区| 欧美性精品不卡在线观看| 免费观看国产小粉嫩喷水| 欧美h在线观看| 99久久国产综合精品2023| 又爽又大又光又色的午夜视频| 国产午夜精品一区二区三区软件| 中文成人在线| 久久99国产精品成人欧美| 人妻丰满熟妇AV无码区| 91尤物国产尤物福利在线| 9久久伊人精品综合| 毛片手机在线看| 四虎成人免费毛片| 久青草国产高清在线视频| 欧美日韩理论| 亚洲天堂网视频| 99视频在线观看免费| 精品欧美一区二区三区久久久| 国产成人亚洲综合A∨在线播放| 极品性荡少妇一区二区色欲| 日韩精品一区二区三区视频免费看| 亚洲国产欧洲精品路线久久| 亚洲国产成人久久精品软件| 无码高潮喷水专区久久| 亚洲狼网站狼狼鲁亚洲下载| 亚洲天堂视频在线免费观看| 亚洲精品不卡午夜精品| 欧美亚洲国产精品久久蜜芽| 97se亚洲综合在线天天| 日韩精品无码免费一区二区三区 | 亚洲一级毛片在线观播放| 狠狠做深爱婷婷久久一区| 国产精品对白刺激| 免费国产小视频在线观看| 国产精品女人呻吟在线观看| 蜜桃视频一区| 看看一级毛片| 一级毛片在线播放| 91久久天天躁狠狠躁夜夜|