999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則的工業控制系統運維數據挖掘方法

2023-10-12 10:40:26李軍
微型電腦應用 2023年9期
關鍵詞:數據挖掘關聯規則

李軍

(中核建中核燃料元件有限公司,四川,宜賓 644000)

0 引言

工業控制系統是集計算機技術、通信技術以及信息技術等多項先進技術為一體的綜合性大型系統,為工業生產過程中的管理提供自動化應用。隨著社會經濟和信息化技術的不斷提升,工業控制系統在化學、鐵路、航空航天以及冶金等多個重要領域均取得了廣泛應用,解決了工業生產過程中的自動化問題,保證整個過程在高精度和低能耗的環境下進行。在提高產品質量和生產速度的同時,使得人工作業強度得以降低。

工業控制作為一個時刻處于變化的復雜動態過程,面臨諸多的問題,例如被控變量的選擇、系統關聯問題確定及動態系統異常數據挖掘等。以往研究方法大多采用專家經驗,主觀性結果占絕大部分。文獻[1]設計了一種基于支持度—置信度—提升度框架的挖掘算法,從配網自動化控制系統歷史數據庫中低質量的海量數據中智能挖掘頻繁項集,建立符合配網自動化動作邏輯,具備整體一致性的強關聯規則。文獻[2]提出了一種利用矩陣描述事務以減少遍歷次數的挖掘改進算法,同時該算法基于云平臺技術并采用并行方式以降低時間復雜度。但是上述兩種方法不能及時挖掘到工業控制系統運行過程中的異常數據。

數據挖掘算法可以憑借關聯規則探究海量數據之間存在的深層聯系,為此,本文創新性地利用關聯規則來挖掘工業控制系統運維數據內在聯系,幫助更好延長系統壽命、降低危險事故發生概率。首先,對關聯規則中的支持度和置信度展開分析,研究二者的值與關聯強度間強關聯規則,對采集到的工業控制運維數據進行預處理,使其轉換為離散型數據,利用Apriori算法和DLG(梯度深度泄露算法)計算得到頻繁項集,循環計算頻繁項目集,直至不再產生新的項集時終止計算,此時所得結果即為最終的數據挖掘結果。通過在TEP(田納西伊化學工業仿真控制過程)上展開仿真實驗,結果也驗證了本文方法在工業控制系統中的實用性,可及時挖掘到異常數據以明顯的波動圖顯示出來,提醒工作人員及時查看異常部分,減少因停機造成的成本損失。

1 關聯規則計算

以關聯規則作為依據的數據挖掘算法,可以根據某種算法規則或者已知的、但極為復雜的條件進行深層次條件規則計算,最終得到最正確、理想的信息結果。關聯規則數據挖掘,就是在給定的事務數據庫中,通過不斷改變數值確保支持度和置信度始終為最小值。與其他數據挖掘算法相比,關聯規則具有以下無法比擬的幾點優勢:

(1) 通過計算可以得到清晰、有用的規則信息結果;

(2) 可以通過間接方法[3]實現數據的挖掘,無需過多步驟即可完成;

(3) 對于變長集合條件數據依然可以實現有效處理;

(4) 可以預測關聯規則計算過程中產生的消耗量[4]。

1.1 事務集關聯規則定義

關聯規則可以反映項目與項目之間存在的某種關系以及關系的密切程度。將E={E1,E2,…,En}定義為一個事件集合,其中,n代表的是不同事件元素。E中的任意一個元素,En(n=1,2,…,p)都可稱之為事件項。將D定義為已知事務數據庫中所有與挖掘任務有關的事件集合,事務T均為E的子集,每個事務都分配了獨有的ID號,用TID來表示。將X定義為E的任意子集,也被稱為模式[5](項集)。關聯規則的形式是X?Y的蘊含式,其中X?E,Y?E,且X是關聯規則中的條件,Y是關聯規則的最終結果。

關聯分析的目的就是將數據之間存在的深層聯系挖掘出來,換句話說,就是通過對記錄集的分析得到項目之間存在的關聯性。

1.2 置信度和支持度明確

關聯規則X?Y對D的支持度(support)換個角度也可以看作是D中包含事務X和Y的比例大小;關聯規則X?Y對D的置信度(confidence),就是計算D中既包含X又包含Y的事物數、在僅包含X的事物數中所占有的比例大小。計算公式如式(1)、式(2):

(1)

(2)

與此同時,D包含A事務中僅包含B的概率值,可以通過條件概率P(B|A)計算得到,計算過程如式(3):

P(B|A)=confidence(A?B)

(3)

式中,P(B|A)表示在發生了A事件的前提下,發生B事件的概率值。

設定一個閾值a,當支持度最小值min_sup和置信度最小值min_conf同時小于a時,認定此時的規則為強規則;反之,如果二者的值大于a,則認定此時的規則為弱規則[6]。本文主要針對強規則進行分析,計算公式為

(4)

數據挖掘就是在工業控制運維數據中,找出滿足上述強規則的數據集。通過不斷調整支持度support和置信度confidence的值,使其在滿足最小值條件下時進行數據之間關聯程度的挖掘。在計算過程中,(X∪Y)與強規則X?Y相互對應,因此,(X∪Y)也是一個頻繁集C。基于此,可以將關聯規則的數據挖掘過程看作是根據min_sup找出D中的所有C或者是根據C和min_conf產生關聯規則的過程。

2 基于關聯規則的工業控制系統運維數據挖掘

完整的數據挖掘過程包含數據預處理和關聯規則挖掘兩個步驟。

2.1 數據預處理

本文采集的工業系統運維數據主要包括運行時間、運行狀態、是否發生異常以及異常發生原因[7]等幾個方面。由于直接采集到的數據不利于挖掘,因此先對其進行數據預處理。針對采集到的各類數據,選取其中的非數值數據進行清洗操作,將殘缺不全的數據直接剔除掉。鑒于關聯規則處理的數據多為離散型數據[8],因此,還需將數值型數據轉換為離散型數據。完成以上兩步處理后,即可開始數據挖掘工作。

通過計算二值化特征的方式,將數據轉化成0與1的形式,以便之后的數據挖掘,此時可以通過式(5)計算被轉換后的工業系統運維離散型數據。

(5)

式中,xi表示經過離散型數據轉換的數據形式,通常為0或1,xp表示未經過轉換的離散型數據,ad表示離散型數據中的一個隨機數,gi表示原始數據。通過該公式轉換工業系統運維數據。當統計不同時間序列中,經過轉換的數據格式時,可以通過式(6)判斷是否轉換完全。

(6)

式中,fh表示離散型數據的轉換標準差,mp表示轉換差值,xi表示為轉換前的格式,Ri表示經過轉換的工業系統運維數據數量。若fh大于0,則表示轉換成功,若fh小于0,則表示離散型數據轉換失敗,通過該公式可以判斷離散型數據轉換是否成功[9]。

2.2 工業控制系統運維數據挖掘實現

Apriori算法可有效降低關聯規則中最大頻繁項集對后續挖掘結果的影響[10]。通過對k項集的搜索過程得到k+1項集,給定一個頻繁1項集和2項集,將L1作為1項集的集合、L2作為2項集的集合,通過對集合L1的搜索可以得到集合L2。按照這個思路計算下去,直到最后不會再生成新的K項集停止[11]。依據Apriori算法的思路,在頻繁項集下的所有非空子集也都是頻繁的,可通過以下兩個步驟來實現。

(1) 連接步:將Lk-1中的每一個元素都連接起來,即可得到Lk的候選集合Ck。

(2) 剪枝步:將Ck看作是Lk的超集,也就是說,在Ck中,存在部分元素不是頻繁的。可按照Apriori算法的計算思路,逐漸減小Ck的范圍,全面掃描工業控制系統運維數據庫[12],得到Ck中所有候選的計數,進一步得到Lk頻繁項集的最終挖掘結果。

在這里引入DLG算法,減少計算過程中掃描事務數據庫的次數,降低挖掘過程中的I/0代價。DLG算法的實現過程主要有三步:首先,生成頻繁1項目集并記錄下來;然后構建關聯圖,將所有頻繁項目集之間的關系通過關聯圖的形式展現出來;最后通過觀察關聯圖,生成頻繁k項集(k?2)。接下來對其進行詳細描述。

(1) 首先,利用DLG算法對工業控制系統運維數據庫進行掃描,通過計算得到其支持度值,針對所有項目建立與之對應的比特向量,由數據庫中事務數量的多少來決定向量的最終長度。將BVi定義為與項目i之間存在關聯的比特向量,假設項目i被包含在第j個事務中,那么就需要將BVi的第i個比特向量長度設置為1;反之,如果第j個事務中不包含i,則將第j個比特向量設置為0[13]。在BVi中,1的數量決定了項目i的支持度。

(2)BVi1∧BVi2∧…∧BVik中含有1的數量直接決定了項目集{i1,i2,…,ik}的支持度。符號“∧”表示了邏輯“與”運算。通過步驟(1)對數據庫完成掃描后,這一步無需再重復,直接構建關聯圖即可。如果min_sup大于等于BVi∧BVp(ip)中包含1的數量,則在項目i與項目p之間建立一條有向邊,定義項集(i,p)是一個頻繁2項集。

(3) 完成關聯圖的構建后,得到頻繁k項集(k?2)。根據DLG算法的規則,通過生成的頻繁項集對Lk(k?2)項集進行擴展,得到(k+1)2項集。假設{i1,i2,…,ik}為一個頻繁k2項集,通過項目之間的有向邊,使得項集{i1,i2,…,ik}擴展成為(k+1)項集。當DLG算法不再生成新的頻繁k項集,就可以終止計算過程。

通過上述分析過程,代入到本文要解決的工業控制系統運維數據的挖掘過程中,并對關聯規則做以下定義:假設給定了一組異常運行數據M=(M1,M2,…,Mm),異常情況發生的部位為S=(Sec 1,Mec 2,…,SecN),異常數據挖掘的關聯規則是X?Y的蘊含式,其中,X、Y分別是M和S的模式。

如果通過計算得到的關聯規則表達式為{M1,M2,M3?2},則可判定在M1、M2、M2挖掘到了系統異常運行數據,斷定異常發生的部分為2。

綜上所述,利用關聯規則實現工業控制系統運維數據挖掘的算法流程圖如圖1所示。

圖1 本文算法實現流程圖

3 仿真實驗

為了驗證本文方法在實際應用中是否可以取得滿意的挖掘結果,將實際化學工業的TEP控制案例作為實驗的仿真環境。實驗中所用到的數據是在某大型工業生產過程中采集得到,借助TEP仿真系統的過程監測來實現。

3.1 TEP過程分析和對應數據采集

TEP過程中參與操作的單元主要有五個:反應器、循環壓縮機、汽/液分離器、冷凝器和汽提塔。在反應器內部存在某種催化劑,當氣態的反應物進入后,經過催化劑的作用使其輸出狀態為液態。這里所使用的催化劑能完全與液體相溶,且為一種永久性催化劑。同時,反應器內部還放置了一根冷卻管,防止反應過程散發的大量熱影響反應結果。反應剩下的氣態物體以及未完全反應的物體,以蒸氣的形式被傳送至冷凝器中。在冷凝器對二者進行冷卻處理,之后被傳送至汽/液分離器中。沒有完全冷卻的氣體會被重新返回至反應器中進行二次反應,經過完全冷卻的氣體則被傳送至汽提塔中。在汽提塔中對反應物進行分離處理,分離后的氣體經由汽提塔頂部散發出去,與壓縮機作用后的循環流股匯合在一起。整個反應過程的最終產物在汽提塔底部提取,經過最后的提純處理即可得到所需要的反應產物。整個過程中添加的催化劑以及其他物質均通過汽/液分離器以氣體的形式從頂部散發出去。

3.2 異常運行數據

在整個實驗過程中,本文在TEP過程中添加了一種正常運行狀態和21種類型不同的異常運行狀態。將所有運行狀態數據整合在一起,分為訓練數據集和測試數據集,二者中包含的數據量分別是480組和960組。在每一種運行狀態中又包含了52個變量數據,這52個變量中又包含了11個控制變量和41個測量變量。其中,測量變量又由19個分析變量和22個連續測量變量共同組成。在實驗持續進行過程中,每隔三分鐘進行一次數據的采集,實驗過程共持續48個小時。在進行到第8個小時實驗時,在第160組數據中人為添加一組異常信號。

利用本文提出的關聯規則挖掘算法應用到TEP過程仿真系統中,用于異常數據的挖掘。TEP過程中的異常運行狀態說明如表1所示。從表1中可以看出,異常運行狀態有隨機變化、階躍、粘住、慢偏移和未知5種類型。

表1 TEP過程異常運行狀態說明

3.3 化學工業控制系統運維數據挖掘

這里主要針對異常1情況發生時的數據進行分析。訓練數據集和測試數據集中共包含了52個觀測變量,當運行到時刻T時,觀測向量的計算公式如式(7):

x=[XMEAS(1),…XMEAS(41),XMV(1),…,

XMV(11)]T

(7)

式中,XMEAS(1)~XMEAS(22)代表的是控制系統連續過程中的測量變量,XMEAS(22)~XMEAS(41)代表的是系統中成分分析的測量變量,XMV(1)~XMV(11)代表的則是整個過程的控制變量。

在實驗進行的第8個小時人為添加一組異常信號,設定發生的異常情況為編號1,根據表1能夠得出:進料比的變化會引起整個系統出現一個階躍變化,使在原本進料多的地方沒有給足夠進料,導致整個系統反應出現異常。

利用本文方法對正常運行狀態下以及異常運行狀態下的兩種物料總流量數據進行挖掘,挖掘結果如圖2所示。

(a) 正常運行狀態下進料總流量

在第8個小時人為添加了異常信號后,使得整個控制系統接下來的反應都發生了相應的改變。從圖2中可以看出,本文方法挖掘結果符合實驗設定結果,進料總流量具有明顯的波動,與正常狀態下的數據波動走向完全不同,證明本文方法對控制系統中的異常數據實現了準確挖掘。

為了進一步驗證本文方法的有效性,采用本文方法、文獻[1]方法和文獻[2]方法,對工業控制系統運維數據挖掘精度進行對比分析,對比結果如表2所示。

表2 三種方法的挖掘精度對比結果

根據表1可知,本文方法進行工業控制系統運維數據挖掘精度的精度最高可達98.9%,而文獻[1]方法和文獻[2]方法進行工業控制系統運維數據挖掘精度的精度最高只有85.0%和69.2%,本文方法的挖掘精度最好,效果最好。

4 總結

將關聯規則數據挖掘方法應用到工業控制系統中,有著其他方法所不具備的優勢,同時保證算法規則更加直觀具體,高效地從海量運維數據中挖掘到有價值的數據,在保證工業系統正常運行的前提下,完成了異常數據的挖掘。對于提高工作效率、降低人工勞作強度、促進工業向高效化、智能化方向邁進都起到了重大的推動作用。同時,關聯規則數據挖掘方法不僅適用于小規模數據,面對海量的數據依然有效。這也是其他方法所不能比擬的。

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 欧美日本中文| 国产丝袜丝视频在线观看| 亚洲 日韩 激情 无码 中出| 久久精品人人做人人爽97| 波多野结衣无码中文字幕在线观看一区二区 | 四虎精品国产AV二区| 不卡的在线视频免费观看| 亚洲午夜久久久精品电影院| 日韩成人在线一区二区| 日韩黄色在线| 亚洲男人天堂2020| 无码专区国产精品第一页| 日韩福利在线观看| 日本在线亚洲| 视频一本大道香蕉久在线播放 | 五月激情婷婷综合| 欧美精品xx| 97成人在线视频| 伊人久综合| 亚洲自偷自拍另类小说| 欧美在线视频a| 国产精品主播| 四虎影视库国产精品一区| 亚洲精品无码不卡在线播放| 欧美日韩另类在线| 久久精品无码国产一区二区三区| 日韩人妻少妇一区二区| 999国内精品视频免费| 国产欧美日韩另类| 日本在线免费网站| 51国产偷自视频区视频手机观看| 亚洲日韩AV无码精品| 国产精鲁鲁网在线视频| 三级欧美在线| 免费一极毛片| yjizz国产在线视频网| 国产成年女人特黄特色毛片免 | 亚洲精品在线91| 毛片免费高清免费| 91久久偷偷做嫩草影院免费看| 天天综合网亚洲网站| 亚洲国产欧美国产综合久久 | 黄色网站在线观看无码| 国产视频一二三区| 色国产视频| 国产综合欧美| 日日噜噜夜夜狠狠视频| 久久综合伊人 六十路| 亚洲人成网站色7799在线播放| 亚洲激情99| 国产精品国产三级国产专业不| 香蕉eeww99国产精选播放| 五月激情综合网| 欧洲免费精品视频在线| 少妇精品网站| 在线视频精品一区| 狼友av永久网站免费观看| 中文字幕欧美日韩高清| 欧美日本一区二区三区免费| 手机在线看片不卡中文字幕| 久久人与动人物A级毛片| 免费一级大毛片a一观看不卡| 喷潮白浆直流在线播放| 成年看免费观看视频拍拍| 欧美视频在线播放观看免费福利资源| 国产情精品嫩草影院88av| 亚洲无码高清一区| 久综合日韩| 91亚洲国产视频| 国产性精品| 欧美日韩资源| 无码粉嫩虎白一线天在线观看| 欧美中文字幕一区| 欧美精品1区2区| 曰韩人妻一区二区三区| 精品无码视频在线观看| 激情视频综合网| 青青草久久伊人| 国产成人毛片| 在线观看亚洲国产| 又猛又黄又爽无遮挡的视频网站| www亚洲精品|