999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K近鄰與支持向量機協同訓練的風機葉片結冰早期檢測

2021-11-01 05:52:08濤,
實驗室研究與探索 2021年9期
關鍵詞:檢測方法模型

韓 濤, 姚 維

(浙江大學電氣工程學院,杭州 310027)

0 引 言

隨著我國電力市場的不斷擴大與對清潔可再生能源日益增長的需求,風力發電行業在我國得到了迅猛發展,風機葉片結冰現象也日益突出[1-5]。葉片結冰不僅縮短風機使用壽命,降低生產效益,還會產生安全隱患[6]。部分風電設備具有自動檢測結冰功能,但其僅能檢測到嚴重的結冰現象,風機葉片結冰是一個緩變過程,從早期的輕度結冰到葉片的嚴重覆冰需要較長的時間。如果能夠在故障初期有效地檢測到結冰趨勢,并給予適當的應對措施,則能夠有效地避免上述諸多不良影響。

目前,監控與采集(supervisory control and data acquisition,SCADA)系統已經廣泛應用在風力發電領域[7-8],在發電過程中實時采集風機工作的運行參數,儲存海量的歷史數據。利用智能算法挖掘歷史數據中的關鍵信息,建立結冰檢測模型,在實際運行中對葉片結冰進行實時監測,為風力發電的安全與效率提供有力保障。目前,數據驅動的智能算法在風機葉片結冰檢測已經成為風電領域內的研究熱點之一,如支持向量機(Support Vector Machine,SVM)[9]、隨機森林[10]、Xgboost[11-13]、人工神經網絡[14-15]等,這些方法普遍是樣本標簽已知的有監督算法。

風機葉片結冰是一個漸變過程,初期不易被觀測,人工記錄時容易造成歷史數據的標簽缺失以及誤標注問題。標簽的誤標注將誤導模型將早期結冰判別為正常,在一定程度上削弱了模型對早期結冰趨勢的檢測靈敏度;缺失標簽的樣本中也蘊含著豐富的信息,如果能對其加以利用,則模型的判別準確度得以提升。

針對上述問題,提出一種K 近鄰(K-Nearest Neighbor,KNN)[16]與SVM協同訓練[17-18]的風機葉片結冰早期檢測方法。KNN與SVM被分別用于提取樣本間的相似關系與樣本自身的判別特征。本方法利用半監督學習中的協同訓練機制,充分利用了標簽缺失樣本,對可能誤標注的樣本進行標簽矯正與重新訓練,對早期結冰數據進行信息提取,以提高模型對葉片結冰檢測的準確度和靈敏度。

1 K近鄰與支持向量機

1.1 K近鄰分類方法

KNN是一種典型的分類算法,它可以直接應用于在線場景。采集到新的在線樣本時,KNN 在歷史樣本點中尋找k個與在線樣本最為相似的歷史樣本,通過投票法獲取標簽。

KNN需要事先定義樣本間的距離函數來度量近鄰關系,通常情況下選擇歐氏距離。給定兩個n 維樣本和,其歐氏距離dij定義為:

對于一個新的在線樣本xnew,KNN 在訓練樣本集合中尋找與樣本xnew距離最小的k 個樣本及其對應標簽{(x1m,y1m),(x2m,y2m),…,(xkm,ykm)},則xnew的標簽被確定為{y1m,y2m,…,ykm}中出現次數最多的標簽類別。KNN利用了樣本間的相似關系,但對于每個樣本不同變量的關系不敏感。

1.2 SVM分類方法

SVM發展于統計學習理論,是一種具有高泛化能力的分類模型,具有結構風險最小化的特點,能夠在模型復雜性與擬合能力間找到最好的平衡點。

給定訓練數據集D ={(x1,y1),…,(xm,ym)},其中,每個樣本點(xi,yi)包括特征xi∈R,標簽yi∈{+1,- 1}。對于超平面ωx +b =0,定義樣本點(xi,yi)到該超平面的幾何距離為:

式中:ω為投影向量;b為截距。定義樣本集合關于該超平面的距離為γ,此距離等價于樣本集合中所有樣本點到該超平面幾何距離的最小值,即:

SVM旨在找到一個最佳的超平面,使兩類樣本集合關于該超平面的距離γ 最大化,從而達到最佳分割的效果。其優化目標為:

該優化問題可以通過適當變換以及拉格朗日乘子法轉換為:

式中,αi為對應的拉格朗日因子。該問題可通過序列最小優化算法求解,從而得到最優解α*。根據Vapnik的理論,α*中至少存在一個k 使得αk能夠取得最優解[19],對于此k,有下述關系成立:

因此,最優分隔超平面的投影向量

以及截距

綜上,對于在線樣本xnew,其標簽為

上述運算過程主要針對線性可分數據,當不同類別間無法通過超平面線性分隔時,可以引進非線性的核函數,將原非線性問題轉化為高維空間中的線性可分問題。當非線性核函數K(xi,xj)滿足Mercer理論,其就對應著高維空間中的一種內積,只需將式(5)中的內積替換為核函數,即可構建非線性分隔的目標函數,即:

對應的在線樣本標簽為:

在核SVM中,最常用的非線性核函數為徑向基函數:

式中,r為徑向基函數的到達率參數。

2 風機葉片結冰早期檢測算法

2.1 KNN-SVM協同訓練分類方法

協同訓練是一種半監督學習方法,充分利用標簽缺失數據中的隱藏信息,提升模型準確度。協同訓練的主要步驟如圖1 所示。

圖1 協同訓練機制示意圖

構建兩個彼此不同的分類器,先由有標簽樣本進行訓練,再分別從無標簽樣本集合中選擇出高置信度樣本并打上標簽,將選出的樣本從無標簽集合中剔除,加入對方的有標簽樣本集合中。將上述過程重復多次,直到達到預先設定的最大迭代次數或沒有新的無標簽樣本被選出。這種訓練機制能夠在充分利用標簽缺失的樣本信息的同時,使2 種分類器互相促進,共同提升分類準確度。

采用KNN和SVM分別充當協同訓練中的2 個分類器。這2 種方法關注的數據模式不同,分類原理也有較大差異,能夠分別從樣本間的相似關系以及樣本的幾何特征這2 個相異的角度來進行分類,因此適合用于協同訓練。

在協同訓練機制中,需要根據分類器的輸出結果尋找高置信度樣本。對于KNN模型,設對于某無標簽樣本,其在有標簽樣本集合中搜索得到的k 個近鄰樣本為{(x1m,y1m),(x2m,y2m),…,(xkm,ykm)},其中yim∈{1,0},則其將該樣本標簽判別為1 和0 的置信度分別為:

對于SVM,可以利用新樣本距離分隔超平面距離γnew來衡量其置信程度

即新樣本距離分隔超平面越遠,置信度越高。

易知,KNN和SVM的分類置信度均為取值在0 ~1 之間的浮點數,且越接近1 說明分類置信度越高。通常情況下,可設定置信度閾值在0.7 ~0.9 之間,當模型對某標簽缺失樣本的分類置信度高于該閾值時,即認為其是高置信度樣本,并將其用于模型重訓練。

2.2 葉片結冰早期檢測方法

基于前述的KNN-SVM 協同訓練方法,可以構建風機葉片結冰的早期檢測算法。該方法能夠對標簽缺失樣本以及潛在的誤標注樣本進行信息提取與矯正,提升分類模型的準確度與靈敏度。具體建模與應用步驟如下。

步驟1訓練樣本集合構建與數據標準化。在數據集的有標簽樣本中,分為結冰數據與正常樣本。通常情況下,結冰樣本的標簽為風電場巡視人員發現結冰現象后進行標注,因此可信度較高。由于觀測不及時以及人為觀察的局限性,一些早期結冰樣本可能被誤標注為正常,如果能對這些樣本的標簽進行矯正并將其用于模型訓練,將可提升模型對早期結冰的檢測靈敏度。結冰是一個緩慢演化的過程,不可能突然發生,因此設立如下規則:在有標簽數據中,若在結冰樣本采集時間點之前一段時間內的樣本被標注為正常,則認為其標簽不可信,將其標簽剔除并歸入無標簽樣本集合,因此無標簽樣本集合中包含標簽缺失樣本以及標簽不可信樣本。

由于KNN與SVM方法需要各變量的取值范圍一致,利用數據標準化方法對原始數據進行處理。對于每個變量x,其標準化方法為:

式中:μ、σ分別為該變量在訓練集中的均值和標準差。

步驟2模型訓練。設置最大迭代次數、SVM 和KNN的置信度閾值,利用步驟1 中得到有標簽樣本集合與無標簽樣本集對兩個模型進行協同訓練,得到訓練后的分類模型。

步驟3在線應用。將步驟2 中訓練好的模型用于在線結冰檢測。需要注意的是,對于某些樣本,SVM和KNN可能會出現不同的分類結果,此時需要利用2種方法的分類置信度進行決策。如果KNN 的判定結果為結冰(第1 類),SVM 的判別結果為正常,則最終分類結果y的計算方式為:

反之,如果KNN的判定結果為正常(第0 類),SVM的判別結果為結冰,則標簽y的計算方式為:

3 實驗驗證

3.1 數據情況與評價指標說明

采用某風機SCADA系統采集的數據進行模型訓練與性能測試。采樣時間為7 s,數據集內包括風速、有功功率、環境溫度、機艙溫度、變槳電動機溫度、葉片角度等26 個變量,這些變量構成樣本點的特征x。按照前述的訓練數據集構建方法,將在發現結冰時間點之前的20 min內的正常標簽樣本視為標簽不可信,并將其歸入無標簽集合中。最終,得到有標簽樣本16 572個,無標簽樣本2 405 個,隨機選取有標簽數據集中80%作為訓練集(共13 258 個樣本),其余20%作為測試集(共3 314 個樣本)。

實驗之前,需要建立合理的評價指標來客觀評價模型的檢測性能,參考曹渝昆等[13]所采用的查準率(precision)、查全率(recall)以及F1指標進行性能評價。

3.2 實驗結果分析

利用訓練集中的有標簽數據及無標簽數據協同訓練KNN和SVM模型,通過交叉驗證[20]對模型超參數進行調整,最終選取KNN 中的近鄰樣本數目k =7,KNN和SVM的置信度閾值分別為0.7 和0.85。最終無標簽樣本中有786 條數據被選取為高置信度樣本并參與訓練。圖2 展示了模型在測試集中3 314 個測試樣本的分類結果的混淆矩陣。

圖2 KNN-SVM方法檢測結果的混淆矩陣

混淆矩陣是一種用于評估模型分類性能的可視化方法,其橫坐標為模型的預測結果,縱坐標則為真實的標簽。圖中,主對角線上的2 個元素分別為模型成功檢測出的正常樣本數目和結冰樣本數目,而副對角線上的元素則分別為模型的誤判樣本數和漏檢樣本數。如圖2 所示,模型成功地檢測出大多數結冰樣本,其有效性得以驗證。

為評估協同訓練機制對結冰檢測性能的促進作用,引入其他結冰檢測模型,包括KNN、SVM、隨機森林、Xgboost進行性能對比,根據混淆矩陣計算各方法的檢測結果的性能指標參數見表1。

在不使用協同訓練機制時,KNN的各性能指標均低于KNN-SVM 協同方法,而SVM 除查準率略高以外,其查全率與F1值也明顯低于協同模型,這說明2種模型在協同訓練的過程中起到了相互促進的作用,提高了結冰檢測的準確度。隨機森林與Xgboost 2 種集成學習模型的查準率略高于所提出的方法,但由于沒有對早期結冰樣本進行充分學習與利用,導致其對結冰數據的檢測靈敏度不足,其查全率和F1值均顯著低于KNN-SVM協同模型,這說明了對無標簽和標簽不可信數據的利用與矯正的必要性。在結冰檢測中,模型的查全率比查準率更為重要,因為一旦結冰現象被漏檢,將有可能造成巨大安全隱患,相比于誤檢的后果更加嚴重。因此,在評估模型性能時應更加關注模型的查全率。在所有方法中,KNN-SVM協同方法的查全率顯著高于其他方法,這進一步驗證了協同訓練機制的優勢。

4 結 語

現有數據驅動風機結冰檢測方法主要采用有監督算法,對于廣泛存在的標簽缺失與誤標注數據沒有進行矯正與利用,這在一定程度上降低了葉片結冰檢測的準確度。

本文提出了一種基于KNN和SVM協同訓練的風機結冰檢測模型,該方法能夠對標簽缺失和標簽不可信樣本進行信息提取與利用,增加模型對早期結冰趨勢的擬合能力。實驗結果表明,相比于其他有監督方法,該方法具有較高的檢測準確性與靈敏度,對風力發電的安全性維護研究具有實際意義。

猜你喜歡
檢測方法模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 欧美激情视频一区| 人妻精品久久久无码区色视| 宅男噜噜噜66国产在线观看| 亚洲性一区| 最新国语自产精品视频在| 亚洲伦理一区二区| 欧美在线天堂| 伊在人亚洲香蕉精品播放| 欧美精品在线免费| 色婷婷成人网| 国产精品成人久久| 国产精品男人的天堂| 无遮挡一级毛片呦女视频| 手机在线看片不卡中文字幕| 国产视频入口| 日韩在线欧美在线| 日韩专区欧美| 国产真实乱人视频| 亚洲精品另类| 日韩一区精品视频一区二区| 国产高清在线丝袜精品一区| 欧美三级视频在线播放| 亚洲综合极品香蕉久久网| 欧美国产在线精品17p| 色欲不卡无码一区二区| 国产精品观看视频免费完整版| 精品福利网| 一级一毛片a级毛片| 免费jizz在线播放| 不卡无码h在线观看| 爱色欧美亚洲综合图区| 国产精品yjizz视频网一二区| 久久综合婷婷| 国产精品视频猛进猛出| 日韩天堂视频| 国产黄色片在线看| 国产成人成人一区二区| 一区二区自拍| 91精品日韩人妻无码久久| 99热这里只有精品久久免费| 最新精品久久精品| 中文毛片无遮挡播放免费| 日日噜噜夜夜狠狠视频| 国产亚洲男人的天堂在线观看| 被公侵犯人妻少妇一区二区三区| 性欧美精品xxxx| 欧美精品色视频| 丝袜美女被出水视频一区| 国产三级韩国三级理| 好吊妞欧美视频免费| 国产网友愉拍精品视频| 9966国产精品视频| 国产黑丝一区| 久久99蜜桃精品久久久久小说| 亚洲色图另类| 日韩第一页在线| 毛片久久网站小视频| 日韩免费中文字幕| 国产精品内射视频| 高清国产va日韩亚洲免费午夜电影| 久久国产成人精品国产成人亚洲 | 国产亚洲美日韩AV中文字幕无码成人| 国产在线观看91精品| 黄色一及毛片| 精品少妇人妻av无码久久| 亚洲区视频在线观看| 天天色综网| 亚洲色图欧美激情| 亚洲欧美日韩另类在线一| 成人在线综合| 欧美精品xx| 爆乳熟妇一区二区三区| 亚洲中文字幕av无码区| 欧美a级完整在线观看| 四虎综合网| 国产乱子伦精品视频| 欧美在线视频不卡第一页| 九九热视频在线免费观看| 四虎永久在线精品国产免费| 欧美精品伊人久久| 亚洲第一成年免费网站| 免费一级毛片在线播放傲雪网|