999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于先驗(yàn)聚類的機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)算法

2025-03-14 00:00:00邢鵬李新娥
現(xiàn)代電子技術(shù) 2025年6期
關(guān)鍵詞:檢測(cè)

摘" 要: 傳統(tǒng)的聚類異常數(shù)據(jù)檢測(cè)算法在處理高維度、大數(shù)據(jù)量且異常值分布雜亂的機(jī)電設(shè)備環(huán)境參數(shù)時(shí),存在聚類效果差和檢測(cè)效率低的問題。為此,在原有異常檢測(cè)算法的基礎(chǔ)上提出一種基于先驗(yàn)聚類的機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)算法。該算法改用歷史數(shù)據(jù)構(gòu)建先驗(yàn)聚類,確保聚類構(gòu)建不會(huì)受太多異常環(huán)境參數(shù)所影響;在選取聚類中心時(shí)引入密集度的概念,以確保聚類中心的可靠性,并在選取聚類中心過程中去除已選聚類中心周圍的數(shù)據(jù)點(diǎn),防止選取的聚類中心集中在某一區(qū)域,以此提升聚類效果。進(jìn)行異常檢測(cè)時(shí),依次將待檢測(cè)數(shù)據(jù)放入先驗(yàn)聚類中進(jìn)行匹配,一旦測(cè)試數(shù)據(jù)無法匹配任何一個(gè)已知聚類,則將其標(biāo)記為異常數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明:所提算法在機(jī)電設(shè)備環(huán)境參數(shù)的異常檢測(cè)方面具有檢測(cè)率高、誤報(bào)率低的特點(diǎn),在2 000例數(shù)據(jù)異常檢測(cè)中,其檢測(cè)準(zhǔn)確率達(dá)到了97.5%,優(yōu)于DBSCAN算法的97%以及基礎(chǔ)K?means算法的86%;同時(shí),誤檢率低至0.010 6,優(yōu)于DBSCAN算法的0.023 9和基礎(chǔ)K?means算法的0.022 8。改進(jìn)后的模型較基礎(chǔ)K?means算法和DBSCAN算法在機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)中檢測(cè)效果更佳,在機(jī)電設(shè)備環(huán)境異常數(shù)據(jù)檢測(cè)上具有良好的性能。

關(guān)鍵詞: 機(jī)電設(shè)備; 環(huán)境參數(shù); 異常數(shù)據(jù)檢測(cè); 先驗(yàn)聚類;" K?means算法; 密集度; 聚類匹配

中圖分類號(hào): TN915.08?34; TP301" " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " "文章編號(hào): 1004?373X(2025)06?0078?07

Prior clustering based environmental parameter anomaly detection algorithm of electromechanical equipment

XING Peng, LI Xine

(State Key Laboratory of Electronic Measurement Technology, North University of China, Taiyuan 030051, China)

Abstract: The traditional clustering anomaly data detection algorithm has the problem of poor clustering effect and low detection efficiency when dealing with the environmental parameters of electromechanical equipment with high dimension, large data amount and chaotic distribution of outliers. Therefore, on the basis of the traditional anomaly detection algorithm, a prior clustering based environmental parameter anomaly detection algorithm of electromechanical equipment is proposed. In this algorithm, the historical data is used to construct prior clustering to ensure that the cluster construction cannot be affected by too many abnormal environmental parameters. The concept of density is introduced to ensure the reliability of cluster centers when selecting cluster centers, and the data points around the selected cluster centers are removed in the process of selecting cluster centers to prevent the selected cluster centers from being concentrated in a certain area, so as to improve the clustering effect. In the process of anomaly detection, the data to be detected are put into the prior clustering for matching. Once the testing data cannot match any of the known clusters, it is marked as abnormal data. The experimental results show that the proposed algorithm has the characteristics of high detection rate and low 1 positive rate in the abnormal detection of electromechanical equipment environmental parameters. In the abnormal detection of 2 000 cases of data, the detection accuracy rate can reach 97.5%, which is better than 97% of DBSCAN algorithm and 86% of basic K?means algorithm. Its 1 detection rate is as low as 0.010 6, which is better than 0.023 9 of DBSCAN algorithm and 0.022 8 of basic K?means algorithm. In comparison with basic K?means algorithm and DBSCAN algorithm, the improved model has better detection effect in the environmental parameters anomaly detection of electromechanical equipment, and has good performance in the detection of environmental abnormal data of electromechanical equipment.

Keywords: electromechanical equipment; environmental parameters; anomaly data detection; priori clustering; K?means algorithm; degree of density; cluster matching

0" 引" 言

隨著微電子、MEMS技術(shù)及無線通信技術(shù)的不斷發(fā)展,無線傳感器網(wǎng)絡(luò)(WSN)憑借其節(jié)點(diǎn)微型化、低成本及靈活部署的優(yōu)勢(shì),目前已廣泛應(yīng)用于機(jī)電設(shè)備的環(huán)境參數(shù)檢測(cè)中[1]。傳感器節(jié)點(diǎn)往往通過機(jī)械固定、物理貼附等方式附著于機(jī)電設(shè)備之上,承擔(dān)著關(guān)鍵環(huán)境參數(shù)的實(shí)時(shí)采集與傳輸任務(wù)[2]。然而,一旦傳感器或其所在環(huán)境中設(shè)備遭遇故障,或是周邊環(huán)境突變,節(jié)點(diǎn)將不可避免地產(chǎn)生異常數(shù)據(jù),若未能及時(shí)甄別與處理,不僅會(huì)威脅設(shè)備安全,還會(huì)造成顯著的經(jīng)濟(jì)損失[3]。同時(shí),由于數(shù)據(jù)信息的多維性和復(fù)雜性,簡(jiǎn)單的異常檢測(cè)手段無法迅速準(zhǔn)確地將異常數(shù)據(jù)檢測(cè)出來。因此,如何構(gòu)建異常數(shù)據(jù)檢測(cè)算法來高效識(shí)別并剔除海量數(shù)據(jù)中的異常信息,對(duì)于確保機(jī)電設(shè)備環(huán)境穩(wěn)定以及發(fā)生故障時(shí)的迅速處理至關(guān)重要。

目前國(guó)內(nèi)外關(guān)于傳感器數(shù)據(jù)異常檢測(cè)算法已取得豐富成果,主要分為以下四類:基于分類的方法[4?5]、基于機(jī)器學(xué)習(xí)的方法[6?7]、基于統(tǒng)計(jì)的方法[8]以及基于聚類的方法[9?12]。其中基于聚類的異常檢測(cè)算法對(duì)輸入數(shù)據(jù)進(jìn)行分簇,通過識(shí)別那些不能很好地融入到任何聚類的數(shù)據(jù)點(diǎn)來進(jìn)行異常檢測(cè),能夠較好地應(yīng)用于傳感器異常數(shù)據(jù)的檢測(cè),且聚類分析的異常值檢測(cè)速度較快,每個(gè)待檢測(cè)數(shù)據(jù)需進(jìn)行比較,聚類數(shù)一般較小,在近幾年的異常檢測(cè)中應(yīng)用較為廣泛。

文獻(xiàn)[9]使用改進(jìn)K?means聚類算法對(duì)無線傳感器數(shù)據(jù)進(jìn)行異常檢測(cè),但數(shù)據(jù)維度較低,沒有深入探究高維度下的無線傳感器數(shù)據(jù)異常檢測(cè)。文獻(xiàn)[10]改進(jìn)了算法中選取聚類中心的規(guī)則,在選取聚類中心時(shí)挑選密集度中相距最遠(yuǎn)的數(shù)據(jù)作為聚類核心,雖規(guī)避了初始聚類中心選取到離散點(diǎn)的可能,但可能導(dǎo)致聚類中心僅僅分布在相距較遠(yuǎn)的兩簇密集區(qū)內(nèi),導(dǎo)致聚類中心分布不均勻。文獻(xiàn)[11]使用DBSCAN算法進(jìn)行異常數(shù)據(jù)檢測(cè),選取合適的鄰域半徑和最小樣本數(shù),具有良好的異常數(shù)據(jù)檢測(cè)效果;然而該算法在聚類間差距較大時(shí),聚類質(zhì)量較差。文獻(xiàn)[12]在迭代聚類中心時(shí)通過使用改進(jìn)閾值的收斂方式,從而降低了聚類迭代次數(shù)以及算法聚類收斂迭代層數(shù);然而該算法并未關(guān)注初始聚類中心對(duì)聚類結(jié)果的影響,可能存在聚類結(jié)果較差的情況。

針對(duì)以上算法中的缺點(diǎn),本文提出一種基于先驗(yàn)聚類的機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)算法,改進(jìn)了聚類算法中初始聚類核心的選取方法,保證了聚類結(jié)果的準(zhǔn)確性。在異常數(shù)據(jù)檢測(cè)策略中,本文算法首先通過部分先驗(yàn)數(shù)據(jù)構(gòu)建標(biāo)準(zhǔn)聚類結(jié)果,然后根據(jù)標(biāo)準(zhǔn)聚類結(jié)果對(duì)含錯(cuò)誤數(shù)據(jù)的傳感器數(shù)據(jù)進(jìn)行異常檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該算法較以往算法檢測(cè)率有一定提升,誤檢率也較低。

1" 數(shù)據(jù)模型及算法原理

1.1" 機(jī)電設(shè)備存儲(chǔ)環(huán)境多維數(shù)據(jù)模型

在機(jī)電設(shè)備網(wǎng)絡(luò)監(jiān)測(cè)環(huán)境中,往往通過機(jī)械固定、物理貼附等方式將傳感器節(jié)點(diǎn)貼附在機(jī)電設(shè)備機(jī)身,并按照固定采樣周期采集多維環(huán)境參數(shù)(如溫度、濕度、光照度、電壓、加速度等),再通過無線傳輸?shù)姆绞絺鬏數(shù)接脩魴z測(cè)端并進(jìn)行異常檢測(cè)。機(jī)電設(shè)備環(huán)境參數(shù)監(jiān)測(cè)模型如圖1所示。

某一時(shí)間段內(nèi)單個(gè)傳感器節(jié)點(diǎn)的m維數(shù)據(jù)檢測(cè)模型可表示為:

式中:[t1,t2,…,tn]代表不同的采樣時(shí)刻;[d1,d2,…,dm]表示數(shù)據(jù)的維度。為方便使用,后續(xù)以[xi]表示[ti]時(shí)的m維數(shù)據(jù)集合。

1.2" 傳統(tǒng)K?means異常檢測(cè)算法原理及缺陷

K?means算法又稱K均值算法[13],可以根據(jù)數(shù)據(jù)之間的相關(guān)性將數(shù)據(jù)分成若干個(gè)聚類,并且使相同聚類的數(shù)據(jù)體現(xiàn)高相關(guān)性,不同聚類的數(shù)據(jù)體現(xiàn)高差異性。當(dāng)數(shù)據(jù)點(diǎn)與所屬聚類的聚類中心之間的距離遠(yuǎn)大于聚類內(nèi)數(shù)據(jù)到聚類中心的平均距離時(shí),將其視為異常值。

傳統(tǒng)K?means算法的具體流程如下。

算法1:基礎(chǔ)K?means異常檢測(cè)算法

輸入:數(shù)據(jù)樣本集X={[x1,x2,…,xn]},聚類數(shù)目為K。

Step1:對(duì)樣本集X進(jìn)行預(yù)處理,得到預(yù)處理樣本集[X′]=

{[x1,x2,…,xn]},從[X′]中隨機(jī)選取K個(gè)樣本視為初始聚類核心。

Step2:For i=1,2,[…],n

Do計(jì)算數(shù)據(jù)[xi]與K個(gè)聚類中心的歐氏距離值并求最小值,將[xi]放入距離值最小的聚類中心所在的聚類中,索引號(hào)記入IDX。

End

Step3:計(jì)算每個(gè)聚類內(nèi)數(shù)據(jù)的平均值,并將其作為新的聚類中心,判斷新的聚類中心是否滿足聚類收斂函數(shù)。聚類收斂函數(shù)如下:

式中:[ci]為循環(huán)前的聚類中心;[c'i]為新的聚類中心;[rTh]為聚類中心的收斂閾值。新的聚類中心滿足該函數(shù)則循環(huán)Step3,反之退出并輸出聚類中心c={[c1,c2,…,cK]}以及數(shù)據(jù)聚類索引IDX。

Step4:For i=1,2,…,n

Do計(jì)算數(shù)據(jù)[xi]聚類中心[cj]的歐氏距離,使用拉伊達(dá)準(zhǔn)則判斷數(shù)據(jù)是否異常,拉伊達(dá)準(zhǔn)則如下:

式中:[d-]為聚類中所有點(diǎn)到該聚類中心距離的平均值;s為標(biāo)準(zhǔn)差。s的求解公式為:

當(dāng)被測(cè)數(shù)據(jù)滿足上述拉伊達(dá)準(zhǔn)則公式時(shí),將該數(shù)據(jù)點(diǎn)視為異常數(shù)據(jù),放入異常值集合U中。

End

Step5:輸出異常值集合U。

輸出:異常值集合U。

然而,傳統(tǒng)的K?means異常檢測(cè)算法仍然存在以下缺陷。

1) 聚類算法的聚類效果高度依賴于初始的聚類中心,傳統(tǒng)的聚類算法通過隨機(jī)挑選的方法進(jìn)行初始聚類中心的選取,如果初始聚類中心選擇不佳,算法可能會(huì)找到一個(gè)局部最優(yōu)解,而不是全局最優(yōu)解,從而導(dǎo)致聚類結(jié)果不夠理想,影響異常檢測(cè)效果。

2) 數(shù)據(jù)中的離群點(diǎn)會(huì)嚴(yán)重影響聚類的準(zhǔn)確性,它們與其他數(shù)據(jù)點(diǎn)的分布明顯不同。如果將這些離群點(diǎn)選為初始聚類中心,那么算法可能會(huì)試圖將其他所有數(shù)據(jù)點(diǎn)都?xì)w到這些離群點(diǎn)附近,從而導(dǎo)致聚類效果差,影響異常檢測(cè)效果。

3) 傳統(tǒng)K?means異常檢測(cè)算法使用無監(jiān)督的策略,當(dāng)檢測(cè)數(shù)據(jù)中錯(cuò)誤數(shù)據(jù)占比較小時(shí),傳統(tǒng)K?means異常檢測(cè)算法可以很輕松地將錯(cuò)誤數(shù)據(jù)檢測(cè)出來;但是,當(dāng)檢測(cè)數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)占比較大時(shí),基礎(chǔ)K?means異常檢測(cè)算法基于內(nèi)含大量錯(cuò)誤數(shù)據(jù)構(gòu)建的聚類結(jié)果往往效果較差,從而導(dǎo)致異常數(shù)據(jù)檢測(cè)算法的檢測(cè)結(jié)果準(zhǔn)確率下降。

2" 基于先驗(yàn)聚類的機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)算法

本文依據(jù)機(jī)電設(shè)備存儲(chǔ)環(huán)境多維數(shù)據(jù)模型,提出了一種基于先驗(yàn)聚類的機(jī)電設(shè)備存儲(chǔ)環(huán)境參數(shù)異常檢測(cè)算法。該算法主要分為兩個(gè)階段:第一階段對(duì)大量標(biāo)定數(shù)據(jù)進(jìn)行聚類分析,構(gòu)建先驗(yàn)聚類結(jié)果;第二階段依據(jù)求得的先驗(yàn)聚類結(jié)果,輸入待檢測(cè)數(shù)據(jù)進(jìn)行異常檢測(cè),輸出異常檢測(cè)結(jié)果。

本文基于傳統(tǒng)檢測(cè)算法對(duì)聚類生成過程中的缺陷進(jìn)行了以下改進(jìn)。

1) 使用標(biāo)定數(shù)據(jù)生成聚類

為解決使用測(cè)試數(shù)據(jù)進(jìn)行聚類構(gòu)建以及異常值檢測(cè)時(shí)測(cè)試數(shù)據(jù)中異常數(shù)據(jù)占比較大造成的影響,改用標(biāo)注過的大量正確數(shù)據(jù)構(gòu)建標(biāo)準(zhǔn)的先驗(yàn)聚類結(jié)果。

2) 改進(jìn)聚類中心的選取規(guī)則

根據(jù)密集度公式[13]挑選密集數(shù)據(jù)點(diǎn),形成密集集,避免聚類中心選取到離群點(diǎn)。在密集集中選取密集度最大的數(shù)據(jù)對(duì)象作為聚類中心并將鄰近部分?jǐn)?shù)據(jù)點(diǎn)剔除(防止聚類中心重復(fù)選取某一區(qū)域),形成新的密集集。

重復(fù)以上步驟直至選取完K個(gè)聚類中心。

2.1" 構(gòu)建先驗(yàn)聚類結(jié)果

通過使用改進(jìn)的聚類中心選取規(guī)則對(duì)標(biāo)定過的歷史數(shù)據(jù)進(jìn)行聚類分析,在選取聚類中心前計(jì)算各數(shù)據(jù)點(diǎn)的密集值,去除離群點(diǎn),將其他數(shù)據(jù)的集合視為密集集并在密集集中選取聚類中心;之后將其他數(shù)據(jù)按照歐氏距離分配給最近的聚類中心從而形成聚類,構(gòu)建先驗(yàn)聚類結(jié)果。

先驗(yàn)聚類結(jié)果構(gòu)建算法具體流程如下。

算法2:先驗(yàn)聚類結(jié)果構(gòu)建算法

輸入:先驗(yàn)數(shù)據(jù)樣本集X={[x1,x2,…,xn]},聚類數(shù)目為K,數(shù)據(jù)

刪減量為m。

Step1:根據(jù)不同維度數(shù)據(jù)對(duì)聚類結(jié)果影響程度的差異性[14],

對(duì)樣本集X進(jìn)行預(yù)處理,得到預(yù)處理樣本集[X′]={[x1,x2,…,xn]}。

計(jì)算鄰域半徑R,公式為:

Step2:創(chuàng)建密集度矩陣Mn×1,用于存儲(chǔ)每個(gè)數(shù)據(jù)點(diǎn)的密集度。

For i=1,2,…,n

Do對(duì)數(shù)據(jù)[xi]進(jìn)行以下計(jì)算:以[xi]為圓心,R為半徑,尋找所有

在上述圓內(nèi)的數(shù)據(jù)(即滿足[dxi,xj≤R]的點(diǎn)),構(gòu)成[xi]的鄰

域集合G([xi]),計(jì)算數(shù)據(jù)點(diǎn)[xi]與G([xi])內(nèi)其他所有數(shù)據(jù)點(diǎn)的歐氏

距離,計(jì)算[xi]的密集度并儲(chǔ)存到密集度矩陣的第i行中,點(diǎn)[xi]

在其鄰域集合G([xi])下的密集度公式如下:

式中:R為鄰域半徑;k為G([xi])中的數(shù)據(jù)數(shù)量。

End

Step3:根據(jù)Step2中求得的密集度矩陣,計(jì)算數(shù)據(jù)集X內(nèi)所有

數(shù)據(jù)的平均密集度。平均密集度計(jì)算公式為:

將所有數(shù)據(jù)的密集度與平均密集度做比較,密集度大于平

均密集度的數(shù)據(jù)保留,將其他數(shù)據(jù)剔除,形成密集集D。

Step4:For i=1,2,…,K

Do計(jì)算密集集中所有數(shù)據(jù)的密集度,求得集中的最大密集

度,并將最大密集度對(duì)應(yīng)的數(shù)據(jù)作為第i個(gè)聚類中心[ci]。

尋找該聚類中心鄰域半徑R內(nèi)的所有數(shù)據(jù),將該聚類中心及

其鄰域半徑內(nèi)最近的m個(gè)數(shù)據(jù)剔除,形成新的密集集[D′],并

替換原有密集集。

End

Step5:根據(jù)Step4生成的聚類中心c={[c1,c2,…,cK]}以及樣本集

X進(jìn)行以下運(yùn)算。

For i=1,2,…,n

Do計(jì)算數(shù)據(jù)[xi]與K個(gè)聚類中心的歐氏距離值并求最小值,將

[xi]放入距離值最小的聚類中心所在的聚類中,索引號(hào)記入IDX。

End

Step6:計(jì)算每個(gè)聚類內(nèi)數(shù)據(jù)的平均值,并將其作為新的聚類

中心,判斷新的聚類中心是否滿足聚類收斂函數(shù)。聚類收

斂函數(shù)如下:

式中:[ci]為循環(huán)前的聚類中心;[c'i]為新的聚類中心;[rTh]為聚類

中心的收斂閾值。新的聚類中心滿足該函數(shù)則回到Step5,

反之退出并輸出聚類中心c={[c1,c2,…,cK]}以及數(shù)據(jù)聚類索引

IDX。

輸出:先驗(yàn)聚類結(jié)果,聚類中心c={[c1,c2,…,cK]}及數(shù)據(jù)聚類索

引IDX。

2.2" 異常數(shù)據(jù)檢測(cè)算法

對(duì)本階段基于算法2獲得的先驗(yàn)聚類結(jié)果進(jìn)行待檢測(cè)數(shù)據(jù)的異常檢測(cè),使用拉伊達(dá)準(zhǔn)則依次檢測(cè)待測(cè)數(shù)據(jù)是否屬于某個(gè)聚類,若被檢測(cè)數(shù)據(jù)不屬于任何一個(gè)聚類,則將其視為異常值。

異常數(shù)據(jù)檢測(cè)算法的具體步驟如下。

算法3:異常數(shù)據(jù)檢測(cè)算法

輸入:聚類中心c={[c1,c2,…,cK]},數(shù)據(jù)聚類索引IDX,待檢測(cè)

樣本集X={[x1,x2,…,xn]}。

Step1:首先對(duì)待測(cè)樣本集X進(jìn)行預(yù)處理,得到預(yù)處理樣本集

[X′]={[x1,x2,…,xn]}。

Step2:根據(jù)聚類中心c={[c1,c2,…,cK]}及數(shù)據(jù)聚類索引IDX計(jì)

算每個(gè)聚類內(nèi)數(shù)據(jù)與其聚類中心的平均距離[d-]和標(biāo)準(zhǔn)差s。

Step3:For i=1,2,…,n

Do選取樣本[xi] for j=1,2,…,K

Do計(jì)算[xi]與聚類中心[cj]的歐氏距離[Xabn],若[Xabn≤0],

則[Aabn+1]。

end for

if [Aabn=5],則視[xi]為正確數(shù)據(jù)。

else,視[xi]為錯(cuò)誤數(shù)據(jù),輸出該數(shù)據(jù)信息(值、序列號(hào))。

End" For

Step4:輸出異常值集合U。

輸出:異常值集合U。

基于先驗(yàn)聚類的異常數(shù)據(jù)檢測(cè)算法總體流程如圖2所示。

3" 實(shí)驗(yàn)分析

3.1" 數(shù)據(jù)來源

本文實(shí)驗(yàn)選取與機(jī)電設(shè)備儲(chǔ)存環(huán)境參數(shù)相似的因特爾伯克利研究實(shí)驗(yàn)室(IBRL)環(huán)境參數(shù)作為實(shí)驗(yàn)數(shù)據(jù)。數(shù)據(jù)包括54個(gè)傳感器每31 s測(cè)量一次的時(shí)間、事件序列號(hào)、溫度、濕度、光照度和電壓測(cè)量值。

在進(jìn)行實(shí)驗(yàn)前,首先對(duì)先驗(yàn)數(shù)據(jù)進(jìn)行標(biāo)定處理,刪除部分重復(fù)值和空值,從中選取對(duì)機(jī)電設(shè)備運(yùn)行、存儲(chǔ)過程影響較大的溫度、濕度、電壓測(cè)量值三項(xiàng)數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象;然后選取2024年2月28日傳感器1~5的2 000個(gè)實(shí)測(cè)數(shù)據(jù)進(jìn)行先驗(yàn)聚類結(jié)果的求解,并從上述數(shù)據(jù)的鄰近時(shí)間內(nèi)選取傳感器1~5的2 000個(gè)實(shí)測(cè)數(shù)據(jù)作為檢測(cè)數(shù)據(jù),在檢測(cè)數(shù)據(jù)的基礎(chǔ)上隨機(jī)替換10%的異常數(shù)據(jù)作為最終測(cè)試數(shù)據(jù)。

3.2" 實(shí)驗(yàn)驗(yàn)證

實(shí)驗(yàn)分別使用本文算法、傳統(tǒng)K?means異常檢測(cè)算法以及DBSCAN異常檢測(cè)算法進(jìn)行對(duì)比。本文算法單獨(dú)使用2 000例歷史數(shù)據(jù)進(jìn)行先驗(yàn)聚類結(jié)果求解,三種算法均使用內(nèi)含錯(cuò)誤數(shù)據(jù)的2 000例鄰近時(shí)間實(shí)測(cè)數(shù)據(jù)進(jìn)行異常環(huán)境數(shù)據(jù)檢測(cè)效果測(cè)試。

本文算法首先選取2 000例標(biāo)定數(shù)據(jù)中的溫度、濕度、電壓三項(xiàng)測(cè)量值作為先驗(yàn)聚類數(shù)據(jù)的來源,根據(jù)傳感器節(jié)點(diǎn)的數(shù)量選取聚類數(shù)為5,依據(jù)改進(jìn)的初始聚類中心選取算法選擇初始聚類中心。先驗(yàn)聚類結(jié)果如圖3所示。

依據(jù)數(shù)據(jù)量的不同,分別基于先驗(yàn)聚類結(jié)果進(jìn)行4組實(shí)驗(yàn),異常數(shù)據(jù)檢測(cè)的結(jié)果如圖4~圖7所示,其中異常數(shù)據(jù)標(biāo)注為叉號(hào)。

由圖4~圖7可知,正常數(shù)據(jù)集中分布在中心區(qū)域,而異常數(shù)據(jù)分布則較為分散。

為驗(yàn)證本文算法的性能,分別以檢測(cè)率(True Positive Rate, TPR)和誤檢率(False" Positive Rate, FPR)[15]兩個(gè)指標(biāo)對(duì)算法性能進(jìn)行驗(yàn)證,公式如下:

式中:TN(真陰性)表示實(shí)際錯(cuò)誤且被正確檢測(cè)為錯(cuò)誤的數(shù)據(jù);FP(假陽性)表示實(shí)際錯(cuò)誤但被錯(cuò)誤檢測(cè)為正確的數(shù)據(jù);FN(假陰性)表示實(shí)際正確但被錯(cuò)誤檢測(cè)為錯(cuò)誤的數(shù)據(jù);TP(真陽性)表示實(shí)際正確且被正確檢測(cè)為正確的數(shù)據(jù)。

表1展示了本文算法、傳統(tǒng)K?means算法、DBSCAN異常檢測(cè)算法在檢測(cè)率與誤檢率方面的性能對(duì)比。

如表1所示,隨著傳感器測(cè)試數(shù)據(jù)量的逐步增長(zhǎng),三種算法均展現(xiàn)出了檢測(cè)率上升與誤檢率下降的正向態(tài)勢(shì);然而,本文算法異常數(shù)據(jù)的檢測(cè)率更高、誤檢率更低,在機(jī)電設(shè)備環(huán)境參數(shù)異常數(shù)據(jù)檢測(cè)中表現(xiàn)出了高于其他兩種算法的優(yōu)良性能。

4" 結(jié)" 語

本文提出了一種基于先驗(yàn)聚類的機(jī)電設(shè)備環(huán)境參數(shù)異常檢測(cè)算法。首先輸入先驗(yàn)數(shù)據(jù),根據(jù)改進(jìn)后的聚類中心選取規(guī)則選取合適的聚類中心,從而進(jìn)行先驗(yàn)聚類結(jié)果的求解;然后根據(jù)先驗(yàn)聚類的聚類中心和聚類內(nèi)數(shù)據(jù),輸入待檢測(cè)數(shù)據(jù)并依次判斷待檢測(cè)數(shù)據(jù)是否可以分配到某個(gè)聚類中,當(dāng)數(shù)據(jù)不能分配到任何聚類時(shí),視其為異常數(shù)據(jù),從而完成機(jī)電設(shè)備環(huán)境參數(shù)的異常檢測(cè)。

實(shí)驗(yàn)結(jié)果表明,本文算法在機(jī)電設(shè)備環(huán)境參數(shù)的異常檢測(cè)中較原有異常檢測(cè)算法具有檢測(cè)準(zhǔn)確率高、誤檢率低的特點(diǎn),在機(jī)電設(shè)備環(huán)境異常數(shù)據(jù)檢測(cè)上表現(xiàn)了良好的性能。

參考文獻(xiàn)

[1] CHANDER B, KUMARAVELAN G. Outlier detection strategies for WSNs: a survey [J]. Journal of King Saud University?computer and information sciences, 2021(6): 5684?5707.

[2] 孫嘉徽,劉山尖,顧勝健,等.基于船舶振動(dòng)環(huán)境應(yīng)力的機(jī)電設(shè)備全壽命仿真與試驗(yàn)技術(shù)[J].機(jī)電設(shè)備,2023,40(5):15?19.

[3] 車麗娜,任秀麗.基于滑動(dòng)窗口和置信度的無線傳感器網(wǎng)絡(luò)異常檢測(cè)算法[J].傳感技術(shù)學(xué)報(bào),2023,36(11):1801?1807.

[4] 陳雪芳.基于AL?SVM算法的無線傳感器網(wǎng)絡(luò)入侵檢測(cè)研究[J].沈陽工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2021,17(4):68?73.

[5] Anon. A novel clustering approach and adaptive SVM classifier for intrusion detection in WSN: a data mining concept [J]. Sustainable computing: informatics and systems, 2020, 23: 120?135.

[6] ABHALE A B, MANIVANNAN S S. Supervised machine learning classification algorithmic approach for finding anomaly type of intrusion detection in wireless sensor network [J]. Optical memory and neural networks, 2020, 29(3): 244?256.

[7] POORNIMA A G I, PARAMASIVAN B. Anomaly detection in wireless sensor network using machine learning algorithm [J]. Computer communications, 2020, 151: 331?337.

[8] SAMPARTHI V S K, VERMA H K. Outlier detection of data in wireless sensor networks using kernel density estimation [J]. International journal of computer applications, 2011, 5(6): 924?1302.

[9] 費(fèi)歡,李光輝.基于K?means聚類的WSN異常數(shù)據(jù)檢測(cè)算法[J].計(jì)算機(jī)工程,2015,41(7):124?128.

[10] 蔣華,季豐,王慧嬌,等.改進(jìn)Kmeans算法的海洋數(shù)據(jù)異常檢測(cè)[J].計(jì)算機(jī)工程與設(shè)計(jì),2018,39(10):3132?3136.

[11] 雷萌,郭鵬,劉博嵩.基于自適應(yīng)DBSCAN算法的風(fēng)電機(jī)組異常數(shù)據(jù)識(shí)別研究[J].動(dòng)力工程學(xué)報(bào),2021,41(10):859?865.

[12] 常榮,徐敏.基于改進(jìn)K?Means和DNN算法的電力數(shù)據(jù)異常檢測(cè)[J].南京理工大學(xué)學(xué)報(bào),2023,47(6):790?796.

[13] 劉紅達(dá),王福順,孫小華,等.一種基于改進(jìn)差分進(jìn)化的K?Means聚類算法研究[J].現(xiàn)代電子技術(shù),2024,47(18):156?162.

[14] 費(fèi)歡,肖甫,李光輝,等.基于多模態(tài)數(shù)據(jù)流的無線傳感器網(wǎng)絡(luò)異常檢測(cè)方法[J].計(jì)算機(jī)學(xué)報(bào),2017,40(8):1829?1842.

[15] 鄭俊華,魏晉宏.基于特征補(bǔ)全的無線傳感器網(wǎng)絡(luò)異常數(shù)據(jù)流檢測(cè)[J].傳感技術(shù)學(xué)報(bào),2024,37(6):1061?1066.

[16] 吳蕊,張安勤,田秀霞,等.基于改進(jìn)K?means的電力數(shù)據(jù)異常檢測(cè)算法[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2020(4):79?87.

[17] 王尊祥,王金剛,鐘建峰.常用機(jī)電設(shè)備關(guān)鍵部件紅外熱成像信號(hào)特征研究及應(yīng)用[J].中國(guó)特種設(shè)備安全,2024,40(7):67?72.

[18] 特木爾朝魯,張亞萍.基于卷積神經(jīng)網(wǎng)絡(luò)的無線傳感器網(wǎng)絡(luò)鏈路異常檢測(cè)算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2024,54(8):2295?2300.

[19] 馬正武.基于GPRS網(wǎng)絡(luò)的惡劣環(huán)境煤礦機(jī)電設(shè)備動(dòng)態(tài)信息實(shí)時(shí)采集系統(tǒng)[J].電子設(shè)計(jì)工程,2024,32(20):149?152.

[20] 賈宇翔,張益,成亮,等.基于圖像特征的鐵路車輛制動(dòng)組件異常檢測(cè)[J].電子設(shè)計(jì)工程,2024,32(7):182?185.

作者簡(jiǎn)介:邢" 鵬(2000—),男,山西大同人,在讀碩士研究生,研究方向?yàn)闊o線傳感器網(wǎng)絡(luò)。

李新娥(1971—),女,山西大同人,博士研究生,教授,研究方向?yàn)闇y(cè)試計(jì)量技術(shù)及儀器。

收稿日期:2024?09?27" " " " " "修回日期:2024?10?31

猜你喜歡
檢測(cè)
QC 檢測(cè)
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
“幾何圖形”檢測(cè)題
“角”檢測(cè)題
“有理數(shù)的乘除法”檢測(cè)題
“有理數(shù)”檢測(cè)題
“角”檢測(cè)題
“幾何圖形”檢測(cè)題
主站蜘蛛池模板: 在线观看免费人成视频色快速| 欧美在线导航| 1769国产精品免费视频| 孕妇高潮太爽了在线观看免费| 囯产av无码片毛片一级| 中文字幕丝袜一区二区| 小蝌蚪亚洲精品国产| 女人18毛片久久| 欧美成人午夜影院| 国产精品99久久久| 日韩东京热无码人妻| 亚洲丝袜中文字幕| 91探花在线观看国产最新| 亚洲 欧美 偷自乱 图片 | 久久99国产综合精品1| 77777亚洲午夜久久多人| 97精品久久久大香线焦| 亚洲天堂自拍| 中文无码日韩精品| 国内精品一区二区在线观看| 成人日韩视频| 欧美影院久久| 免费毛片全部不收费的| 免费在线国产一区二区三区精品| 色欲色欲久久综合网| 国产精品尹人在线观看| 亚洲精品无码人妻无码| 潮喷在线无码白浆| 野花国产精品入口| 五月激激激综合网色播免费| 在线免费观看a视频| 97久久免费视频| 欧美日韩v| 欧美亚洲第一页| 国产呦精品一区二区三区网站| 婷婷色狠狠干| 亚洲美女高潮久久久久久久| h视频在线观看网站| 高清乱码精品福利在线视频| 日本黄色a视频| 色视频久久| 亚洲欧美国产五月天综合| 亚洲天堂视频网| 看你懂的巨臀中文字幕一区二区| 永久免费精品视频| 亚洲精品日产AⅤ| 国产亚洲精久久久久久无码AV | 成年人免费国产视频| 色有码无码视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 永久成人无码激情视频免费| 欧美日韩国产在线播放| 26uuu国产精品视频| 国产成人三级在线观看视频| 国产精品自在在线午夜区app| 久久黄色小视频| 国产一区二区三区在线观看免费| 日韩无码黄色| 欧洲高清无码在线| 亚洲国产成人在线| 激情综合五月网| 欧美一级高清免费a| 亚洲AV无码不卡无码| 国产成人a毛片在线| 找国产毛片看| 中文精品久久久久国产网址 | 亚洲精品国产精品乱码不卞| 老熟妇喷水一区二区三区| 久久久久国产一区二区| 欧美性爱精品一区二区三区 | 欧美v在线| 久久久噜噜噜久久中文字幕色伊伊| 亚洲无码视频喷水| 日韩在线欧美在线| 国产精品无码AV中文| 日韩A∨精品日韩精品无码| 2021天堂在线亚洲精品专区| A级毛片无码久久精品免费| 日本成人一区| 国产69精品久久久久妇女| 国产玖玖视频| 免费高清毛片|