999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電網總調調度信息披露不平衡性數(shù)據(jù)處理模型

2022-09-14 08:19:58侯方迪高衛(wèi)東
電子設計工程 2022年17期
關鍵詞:數(shù)據(jù)處理分類模型

侯方迪,高衛(wèi)東,張 勇,翟 哲,楊 凡,吳 亮

(中國南方電網有限責任公司,廣東廣州 610106)

電力供應一直是電力企業(yè)的核心業(yè)務,隨著電力設備的改造和升級,對調度可靠性要求越來越高,通過傳統(tǒng)的電話下令模式進行調度已經無法滿足要求,通過移動網絡及調度數(shù)據(jù)網實現(xiàn)配網調度成為當下的主流方式[1]。然而,這種新興的調度模式興起時間較短,發(fā)展并不成熟,普遍存在披露的數(shù)據(jù)信息內容雜亂,缺乏深層次統(tǒng)計和分析的問題。

披露的數(shù)據(jù)信息內容雜亂主要是由不平衡性數(shù)據(jù)造成的,因此必須對不平衡性數(shù)據(jù)進行處理。關于不平衡性數(shù)據(jù)處理的研究有很多,如:文獻[2]基于KFDA-Boosting 算法的不平衡數(shù)據(jù)分類模型,提取樣本非線性特征并進行集成學習,有效地提高了數(shù)據(jù)分類處理算法的精度,去除了冗余信息;文獻[3]提出基于隨機森林算法的不平衡大數(shù)據(jù)動態(tài)分類方法,通過隨機森林算法建立大數(shù)據(jù)動態(tài)分類基本框架,利用決策樹模型實現(xiàn)不平衡數(shù)據(jù)分類;文獻[4]提出基于SMOTE 的不平衡數(shù)據(jù)分類算法,通過SMOTE算法根據(jù)少數(shù)類樣本間特征空間的相似性人工合成新樣本,解決了數(shù)據(jù)不平衡的問題,提高了數(shù)據(jù)處理的精度。

基于前人的研究成果,為提高披露數(shù)據(jù)信息的完整性、規(guī)范性和有效性,該文構建了一種電網總調調度信息披露不平衡性數(shù)據(jù)處理模型。該模型構建分為3 個步驟,即數(shù)據(jù)預處理、數(shù)據(jù)特征提取以及數(shù)據(jù)分類。最后進行不平衡性數(shù)據(jù)處理性能測試,證明了該模型的準確性和有效性。

1 基于分類器的不平衡性調度數(shù)據(jù)處理模型

調度機構信息披露對于促進電力調度運行的公開透明以及維護公平、有序的市場秩序發(fā)揮著不可替代的作用。然而,當前的電網總調調度信息披露中,數(shù)據(jù)處理部分由于不平衡性數(shù)據(jù)的存在,導致處理效率差、準確性低。不平衡性數(shù)據(jù)的典型特點就是數(shù)據(jù)中各類別所包含的樣本數(shù)量差異較大,導致在后期的分類中更容易識別包含樣本較多的類別,而包含樣本較少的類別的識別準確性較低。面對電網總調調度信息披露不平衡性數(shù)據(jù),構建了數(shù)據(jù)處理模型。

1.1 不平衡性數(shù)據(jù)預處理

不平衡性數(shù)據(jù)預處理對于提高數(shù)據(jù)處理模型的精度具有十分重要的意義,其主要包括數(shù)據(jù)清洗、數(shù)據(jù)標準化以及數(shù)據(jù)平衡化三部分。

1.1.1 數(shù)據(jù)清洗

電網總調調度披露的數(shù)據(jù)信息中,經過采集、傳輸?shù)拳h(huán)節(jié),數(shù)據(jù)集中難免存在缺失、異常、噪聲等問題,數(shù)據(jù)清洗主要包括缺失填補、異常識別以及噪聲處理,其方法如表1 所示。

表1 數(shù)據(jù)清洗方法

1.1.2 數(shù)據(jù)標準化

電網總調調度信息披露不平衡性數(shù)據(jù)來自不同的數(shù)據(jù)源,因此每種類型數(shù)據(jù)的量綱都不同,而不同的量綱導致數(shù)據(jù)彼此之間無法進行比較和分析,因此需要對數(shù)據(jù)進行標準化處理[5],主要包括Min-Max 標準化、正規(guī)化方法及l(fā)og 函數(shù)轉換法,分別如下所示:

式中,x′為規(guī)范化后的大數(shù)據(jù);x為原始數(shù)據(jù);xmax為大數(shù)據(jù)集中最大值;xmin為大數(shù)據(jù)集中最小值;a為對應特征均值;b為標準差。

1.1.3 數(shù)據(jù)平衡化

數(shù)據(jù)的不平衡性是導致電網總調調度數(shù)據(jù)信息處理精度不高的根本原因,因此對數(shù)據(jù)進行平衡化處理是解決上述問題的關鍵。數(shù)據(jù)平衡化的關鍵在于增加少數(shù)類別的樣本數(shù)據(jù),使其與少數(shù)類別的樣本數(shù)據(jù)數(shù)量相同,以維持二者平衡[6]。采用SMOTE算法實現(xiàn)數(shù)據(jù)平衡化,其原理為在一些位置距離較近的少數(shù)類樣本中線性插入新的樣本,以達到數(shù)量平衡。

SMOTE 算法數(shù)據(jù)平衡化原理如下:首先從少數(shù)類樣本點中隨機選取一個樣本點,記為x1,然后尋找該樣本點的同類近鄰,記為{x1,x2,…,xn},一般情況下n取值為5~10,接著從{x1,x2,…,xn} 中隨機選擇一個樣本,記為x2,再然后計算x1和x2在對應屬性j上的差值,記為:

然后與[0,1]范圍內的一個隨機數(shù)相乘,再與x1j相加,即可生成一個新的的屬性值f1j,即:

利用SSR分子標記技術進行純度鑒定時,有些與雜交種帶型有明顯差異的單株在種植鑒定時并不一定表現(xiàn)出表型性狀的差異,因此SSR分子標記技術用于純度鑒定時,可以有效鑒別出大田無法確定的表型以及難以鑒別的植株,因而分子鑒定和種植鑒定結果必然存在一定的差異,而種植鑒定是最符合生產實踐的純度鑒定方法,如何使分子鑒定結果更接近種植鑒定、更好地輔助種植鑒定結果還需進一步研究。

不斷重復上述過程,最后得到m個屬性值,將其組合在一起,產生一個新的少數(shù)類樣本,將這一新的少數(shù)類樣本加入到原始少數(shù)類樣本數(shù)據(jù)集中,即可完成數(shù)據(jù)平衡化處理[7-9]。

1.2 數(shù)據(jù)特征提取

不同類別的數(shù)據(jù)擁有不同的特征,如電網總調調度信息中的缺失數(shù)據(jù)、趨勢突變數(shù)據(jù)等。該文選用的特征提取方法為人工蜂群算法[10-12]。

人工蜂群算法基本流程如下:

步驟1:初始化種群,隨機生成S個可行解,記為xi,i=1,2,…,S;

步驟2:計算種群中各蜜蜂的適應值[13];

步驟3:重復計算各蜜蜂的適應值,得到蜂群新的解,記為vi,并計算適應值;

步驟4:雇傭蜂根據(jù)貪心策略選擇蜜源;

步驟5:計算引領蜂找到蜜源xi的概率pi;判斷蜜源xi是否滿足被放棄的條件,若滿足,對應的引領蜂角色變?yōu)閭刹旆洌㈦S機產生一個新的蜜源代替舊的蜜源,否則繼續(xù)進行下一步驟;

步驟6:判斷算法是否滿足終止條件,若滿足,則終止,記錄最優(yōu)解,否則轉到步驟2[10-12]。

1.3 不平衡性數(shù)據(jù)分類處理

基于上述研究,構建分類器并進行訓練,利用訓練好的分類器進行不平衡性數(shù)據(jù)分類處理[14]。決策樹是一種分類算法器,其構建基本原理是通過遞歸的方式進行屬性歸類,生成不同的決策樹,基本流程如圖1 所示。

圖1 決策樹構建基本流程

將構建的決策樹作為基分類器,構成隨機森林,實現(xiàn)分類[15]。具體過程如下:首先利用Bagging 方法進行放回抽樣,為每棵決策樹產生訓練集,然后利用訓練集訓練決策樹[16]。訓練完成后,將決策樹組合構成隨機森林,最后將測試數(shù)據(jù)集輸入到隨機森林中,通過投票方式完成分類預測。

2 仿真實驗分析

為了驗證該文提出的電網總調調度信息披露不平衡性數(shù)據(jù)處理模型的有效性,在Eclipse 環(huán)境下的Weka 平臺進行仿真實驗,并用文獻[2]、[3]、[4]提到的3 種算法作為對比項,進行對比分析。

2.1 實驗樣本

以紅水河水庫日來水數(shù)據(jù)為例,選取2020.01.01-2020.03.31 的日來水數(shù)據(jù)作為不平衡性數(shù)據(jù)示例,仿真實驗參數(shù)設置如表2 所示。

表2 仿真實驗參數(shù)設置

2.2 實驗結果

分別采用文獻[2]、[3]算法及所提方法對實驗數(shù)據(jù)中的不平衡性數(shù)據(jù)進行分類處理,得到2020.01.01-2020.03.31的紅水河水庫日來水數(shù)據(jù)趨勢如圖2所示。

分析圖2,該文模型對不平衡性數(shù)據(jù)的處理性能較好,按照日來水數(shù)據(jù)整體趨勢對不平衡性數(shù)據(jù)進行處理,得到紅水河水庫日來水數(shù)據(jù)趨勢整體在2 200~2 800 m3/s 之間波動,而兩種文獻對比模型對數(shù)據(jù)的處理性能較差,不能很好地得到紅水河水庫日來水數(shù)據(jù)趨勢。

圖2 不平衡數(shù)據(jù)處理后的紅水河水庫日來水數(shù)據(jù)趨勢

經不同方法對數(shù)據(jù)處理后,根據(jù)所得數(shù)據(jù)趨勢對2020.04.01-2020.04.31 的數(shù)據(jù)進行預測,得到紅水河水庫日來水數(shù)據(jù)預測結果如圖3 所示。

分析圖3,該文模型預測值與實測值較為接近,說明該文模型能夠準確處理不平衡性數(shù)據(jù),實現(xiàn)水庫日來水情況的預測。

圖3 紅水河水庫日來水數(shù)據(jù)預測情況

3 結束語

綜上所述,隨著電力的需求范圍越來越廣泛,對電力調度的可靠性和效率性要求越來越高,因此,電網總調調度信息披露系統(tǒng)逐漸取代傳統(tǒng)的調度信息傳遞方式,提高了數(shù)據(jù)信息傳遞效率,然而披露系統(tǒng)的應用,同時也使數(shù)據(jù)信息量劇增,導致數(shù)據(jù)信息內容雜亂,缺乏深層次的統(tǒng)計和分析。基于此,構建一種電網總調調度信息披露不平衡性數(shù)據(jù)處理模型,該模型經仿真實驗測試,證明了其在不平衡性數(shù)據(jù)處理中的性能,提高了不平衡性數(shù)據(jù)處理的精度,規(guī)范了電網總調調度數(shù)據(jù)信息。

猜你喜歡
數(shù)據(jù)處理分類模型
一半模型
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
主站蜘蛛池模板: 54pao国产成人免费视频| a亚洲天堂| 黄色三级网站免费| 精品伊人久久久香线蕉 | 久久久久人妻一区精品| 青青草国产精品久久久久| 91久久精品日日躁夜夜躁欧美| 久久夜色精品| 日本午夜影院| 亚洲免费人成影院| 国产精品女主播| 中文无码日韩精品| 亚洲综合亚洲国产尤物| 草草影院国产第一页| 亚洲成人福利网站| 日韩国产综合精选| 18黑白丝水手服自慰喷水网站| 免费国产不卡午夜福在线观看| 国产制服丝袜无码视频| 国产最爽的乱婬视频国语对白| 九九精品在线观看| 久草视频中文| 2021国产精品自产拍在线观看| 91在线精品麻豆欧美在线| 国产精品一区在线麻豆| 欧美伦理一区| 欧美无专区| 日本成人在线不卡视频| 2024av在线无码中文最新| 国产免费羞羞视频| 一级毛片不卡片免费观看| 亚洲成人精品| 麻豆精品国产自产在线| 国产极品粉嫩小泬免费看| 欧洲成人免费视频| 国产尤物视频网址导航| 欧美日韩精品综合在线一区| 91在线激情在线观看| 日韩精品一区二区三区视频免费看| 伊在人亚洲香蕉精品播放| 在线观看免费国产| 国产人成午夜免费看| av午夜福利一片免费看| 久久久久久高潮白浆| 亚洲视频三级| 在线观看热码亚洲av每日更新| 亚洲人成网线在线播放va| 亚洲精品日产精品乱码不卡| 国产在线视频二区| 日本一本在线视频| 亚洲国产成人久久精品软件 | 日韩毛片在线视频| 亚洲精品你懂的| 成人va亚洲va欧美天堂| 日本欧美午夜| 亚洲人成影院在线观看| yjizz视频最新网站在线| 成人无码一区二区三区视频在线观看 | 久久精品免费看一| 一级毛片免费不卡在线| 99无码中文字幕视频| 国产精品亚欧美一区二区| 久久精品国产91久久综合麻豆自制| 日本高清免费一本在线观看| 国产一线在线| 久草视频一区| 成人看片欧美一区二区| 久久精品中文无码资源站| 国产高清无码麻豆精品| 婷婷色一区二区三区| 丁香六月激情综合| 美女无遮挡拍拍拍免费视频| 57pao国产成视频免费播放| 亚洲精品日产AⅤ| 日韩毛片免费观看| 黄色网站在线观看无码| 精品中文字幕一区在线| 国产精品三区四区| 精品国产欧美精品v| 亚洲国产精品无码AV| 国产高颜值露脸在线观看| 欧美人与牲动交a欧美精品|