999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Stacking集成模型的臺區線損率預測方法研究

2023-01-18 09:07:26李晉源保富胡凱張麗娟
電測與儀表 2023年1期
關鍵詞:方法模型

李晉源,保富,胡凱,張麗娟

(1.云南電網有限責任公司信息中心,昆明 650217; 2. 云南電網有限責任公司,昆明 650200)

0 引 言

在電力系統中,線損管理是電網運維和供電企業電能營銷服務系統的重要基礎業務[1]。在我國,臺區線損約占整個電網線損的20%,嚴重的電力損耗不僅損害了電網公司的利益,也與我國雙碳這一目標的實現背道而馳,對臺區線損進行管理迫在眉睫[2]。而線損率的準確預測有助于提高線損管理水平,因此,對線損率預測方法進行研究具有重要的實際意義。

目前,國內外有許多研究人員對線損率計算方法進行了深度研究,主要集中在深度學習、集成學習等智能算法上。文獻[3]中,提出了一種將級聯BP神經網絡和小生境遺傳算法相結合的臺區線損率預測模型。結果表明,該預測方法的訓練效率和泛化能力均優于傳統預測方法。文獻[4]中,提出了一種改進的自編碼器方法來預測臺區的線損率。結果表明,該預測方法的相對誤差和計算效率均優于傳統的預測方法。文獻[5]中,提出了一種將變分模態分解和改進最小二乘支持向量機相結合來預測臺區線損率。結果表明,該預測方法的精度和效率均優于傳統預測方法。文獻[6]中,提出了一種降噪自編碼器和長短期記憶網絡相結合的線損率預測方法。結果表明,該模型預測線損率精度高,運行速度適中,具有一定的應用價值。雖然上述預測方法在一定程度上比傳統方法更準確、更高效,但在線損率預測精度方面并不理想,需要進一步提高。

在此基礎上,提出了一種結合Stacking集成學習模型和改進的k-均值聚類方法來預測臺區的線損率。通過聚類方法進行數據聚類,在通過Stacking集成學習模型對臺區線損率進行預測。通過試驗進行了對比分析。

1 數據預處理

原始輸入數據為某省電力公司臺區數據,采樣為1天/次,將連續30天的數據作為輸入,對第31日的線損率進行預測。由于采集設備故障和人為操作等因素的干擾,存在缺失和異常等情況,在預測低壓臺區線損率之前,應對這些線損數據進行處理[7]。

(1)缺失值處理技術。

部分線損率數據為零或為空,影響線損率預測效果。文中用拉格朗日插值法對這些數據進行了補充。

提取缺失點前后的五個數據,并用式(1)和式(2)進行補充[8]。

(1)

(2)

式中r為缺數據對應的下標序號;ri為非缺失數據yi的下標序號;Ln(r)為補充數據;li(r)為拉格朗日多項式。

(2)異常值處理。

對數據進一步分析,找出異常值進行剔除。線損率:剔除線損率≤0%或>40%的異常高損耗臺區。功率因數:剔除功率因數<0.6的臺區[9]。

(3)數據歸一化。

為了更全面地預測線損率,需要對數據進行歸一化處理,數據歸一化過程如式(3)所示[10]:

(3)

式中x和x′分別為原始數據的實際值和歸一化數據;xmax和xmin分別為原始數據的最大值和最小值。

2 線損率預測方法

2.1 改進的K-means 聚類方法

麥奎因提出了k-均值聚類算法,不再考慮相似性問題,而是考慮距離問題[11]。作為一種優化,它是通過找到目標函數的極值來調整的。步驟如下:

步驟1:將類別數k定義為初始化過程中初始集群中心的數量。

步驟2:根據式(4)計算樣品與每個中心點之間的距離。樣本和最近的中心點被分組為一類,形成k個簇[12]。

(4)

式中Iij為樣本點i到j的距離;m為樣本點坐標的維數;Zik和Zjk分別第k個簇中樣本點i和j的坐標。

步驟3:將坐標平均值作為新聚類中心。

步驟4:通過式(5)判斷是否收斂[13]。

(5)

式中Zq為Ci類中的樣本q的坐標;mi為Ci類的聚類中心坐標;E為平方誤差。

k-均值聚類方法需要在聚類之前確定聚類的數目[14]。其次,聚類中心的確定原則不明確,如果初始值選擇不正確,后續工作就無法得到理想的聚類擬合結果[15]。

為了優化k-means聚類方法,使用聚類結果的總輪廓系數St(值越高,效果越好)來選擇最優k值。對于任何采樣點i,輪廓系數S(i)的計算如式(6)所示[16]:

(6)

式中q(i)為點i與聚類中其他點的距離值;p(i)為點i與聚類中其他點的最小平均距離。

聚類結果總輪廓系數計算如式(7)所示[17]:

(7)

采用評價指標PE評估聚類的質量,聚類如式(8)所示[18]:

(8)

式中ωj為第j個特征參數的權重;Zij為第j個簇中樣本點i的坐標;Zjmin為距離最近的第j個聚類中心坐標。根據PE值的升序原則,將樣本平均劃分為k個類別,并將每個類別的中心樣本設置為該類別的聚類中心。使用上述公式通過迭代計算確定理想分類。

2.2 Stacking集成學習模型

Stacking集成學習模型融合了多個預測模型,將原始數據劃分多個子集,輸入第1層的各基學習器,輸出結果作為第2層的元學習器的輸入[19]。學習方法如圖1所示。

圖1 Stacking集成學習模型學習方法

模型的訓練方法如下:

對于數據集S={(xn,yn),n=1,…,N},xn為第n個樣本的特征向量;yn為第n個樣本對應的預測值;p為包含的特征個數。即每個特征向量為(x1,x2,…,xp)。將數據隨機分成k個大小相同的子集S1,S2,…,Sk。

以第1個基學習器為例,每個子數據Si(i=1,2,…,K)作為測試集,剩下的作為訓練集,得到預測結果,組合成集合L1[20]。L1長度與S相同。 所有L={L1,L1,…,Ln}基學習器得到集合L1,L1,…,Ln作為新的數據集L,作為第2層的輸入,第2層對第1層的誤差進行修正,從而提高診斷模型的準確性[21]。

Stacking集成模型第1層選擇不同類型的基學習器對數據進行多角度分析。第2層元學習器要泛化能力強的模型,這有助于糾正第1層診斷錯誤并獲得最佳診斷結果[22]。

基于基學習器的預測能力,在Stacking模型的第1層選擇XGBoost模型、長短時記憶網絡(Long Short Term Memory, LSTM)和梯度提升決策樹(Gradient Boosted Decision Tree,GBDT)。這是因為LSTM能夠充分挖掘包含在大量數據中的有效信息,具有長期記憶以及深度學習的能力[23]。采用bagging 集成的GBDT適用于高維數據,學習能力較強,擁有并行處理能力[24]。采用boosting方法集成的XGBoost增加了正則化項,有效地防止了過度擬合,效率較高[25]。

第2層選擇泛化能力強的模型。根據該模型,總結和糾正了各種學習算法對訓練集的偏差,并通過集合方法防止了過度擬合效應。在第2層中, XGBoost 被選為元學習器,模型架構如圖2所示。

圖2 Stacking集成模型結構

2.3 預測方法

預測方法的具體步驟如下:

步驟1:輸入原始數據;

步驟2:數據預處理。補充缺失數據,刪除異常數據,對所有數據進行歸一化;

步驟3:通過灰色關聯度分析對指標體系進行構建;

步驟4:降低樣本數據指標的維度,消除指標之間相關性的影響,從而更好地對樣本進行分類;

步驟5:利用改進的k-均值聚類技術對臺區進行聚類;

步驟6:選擇XGBoost模型、GNDT模型和LSTM模型作為元學習器,建立Stacking集成學習模型預測線損率;

步驟7:與傳統模型進行對比比較。圖3所示預測方法的流程。

圖3 預測方法流程

3 試驗結果與分析

3.1 試驗參數

此次試驗的CPU為Intel i52450m,操作系統為Windows 10 64位旗艦,內存為64 G,硬盤為1 T,頻率為2.5 GHz,仿真軟件為MATLAB。為了驗證所提方法的優越性,選取了9 000個有源臺區對線損率進行了計算和分析。訓練集與測試集的比值為2:1。算法參數如表1所示,算法參數通過參考文獻[26-27]和多次試驗取值。

表1 算法參數

為了更好地評估文中模型的性能,選擇兩個指標對模型進行評估,均方誤差(Mean Square Error,MAE)和R2,如式(9)和式(10)所示:

(9)

(10)

式中xs和x′s分別為s時刻臺區線損率的實際值和預測值;N為計算的總時間;x′為臺區線損率平均值。

3.2 試驗分析

使用所提的聚類算法對數據進行聚類,將初始聚類數k從2增加到9,并計算不同k值的輪廓系數,如表2所示。

表2 不同 k時的輪廓系數

從表2可以看出,當k=5時,輪廓系數的值為最大值0.341,聚類效果最優。文中選取k=5。

將樣本根據PE從小到大分為五類,樣本中心是初始聚類中心。五個中心的樣本數如表3所示。

表3 各類樣本數

基于上述分類結果,使用Stacking集成學習對5類樣本的訓練集進行訓練,測試樣本用于預測訓練模型的線損率,并與傳統模型(XGBoost、GBDT、LSTM)進行比較。預測結果如表4所示,部分評估結果如表5所示,運行時間如表6所示。

表4 不同模型的預測誤差對比

從表4和表5可以看出,文中模型預測結果中相對誤差小于5%或10%的臺區占比高于傳統方法,相對誤差大于20%占比與其相反。說明所提方法預測精度最高,與實際值最為接近。這是因為所提方法融合多種模型進行互補,預測結果較為精準。由表6可以看出,文中模型相比于單一模型運行時間最長。這是因為集成模型中每個基分類器都需要交叉訓練,導致運行時間過長。

表5 部分評估結果

表6 不同模型運行時間對比

為了進一步驗證所提方法的優越性。MSE和R2被用作衡量不同模型擬合程度的指標,如圖4和圖5所示。

圖4 不同方法MSE結果對比

圖5 不同方法R2結果對比

從圖4和圖5可以看出,文中模型的MSE值一直處于最低水平,R2值一直處于最大值,說明文中預測方法相比于傳統XGBoost、GNDT、LSTM模型具有更好的預測效果,結果更加準確,泛化能力更強。

4 結束語

提出了一種改進的k-均值聚類方法和Stacking集成學習模型相結合用于預測臺區線損率。通過聚類算法進行聚類,在通過Stacking集成學習模型對臺區線損率進行預測。Stacking集成學習模型由XGBoost模型、GBDT模型、LSTM模型構成。結果表明,與傳統預測模型相比,該方法具有更好的性能,預測結果更加準確、泛化能力更強和實用價值更高。鑒于目前的測試設備和數據規模,文章對線損率預測方法的研究還處于起步階段。由于采用Stacking集成學習模型,計算時間較長。因此,未來的研究需要結合分布式計算,逐步提高模型的性能,有效減少模型的執行時間。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲无码熟妇人妻AV在线| 国产精品久久精品| 本亚洲精品网站| 亚洲一区二区精品无码久久久| 激情六月丁香婷婷四房播| 国产香蕉国产精品偷在线观看 | 国模粉嫩小泬视频在线观看| 91精品啪在线观看国产| 亚洲欧美日韩中文字幕一区二区三区| 日本草草视频在线观看| 一区二区三区在线不卡免费| 在线国产毛片手机小视频| 久久精品66| 无码精品国产VA在线观看DVD| 手机成人午夜在线视频| 欧美日韩成人| 青青青视频蜜桃一区二区| 亚洲手机在线| 成年午夜精品久久精品| 亚洲黄网在线| 麻豆精品久久久久久久99蜜桃| 国产成人高清亚洲一区久久| 韩国v欧美v亚洲v日本v| 日韩毛片基地| 激情無極限的亚洲一区免费| 亚洲欧美极品| 性做久久久久久久免费看| 久久综合婷婷| 国产丝袜无码精品| 日本人妻一区二区三区不卡影院| 91免费观看视频| 精品国产毛片| 四虎影视国产精品| 日韩福利在线观看| 99re免费视频| 2020久久国产综合精品swag| 在线观看91香蕉国产免费| 亚洲综合亚洲国产尤物| 午夜福利无码一区二区| 亚洲天堂精品视频| 欧美成人午夜视频免看| 国产美女精品一区二区| 色天天综合| 人妻精品全国免费视频| 欧美黄网在线| 国产精品网址你懂的| 色综合五月| 黄片一区二区三区| 91口爆吞精国产对白第三集| aⅴ免费在线观看| 亚洲成年人网| 91精品久久久无码中文字幕vr| 四虎永久免费地址| 大陆精大陆国产国语精品1024| 中国成人在线视频| 国产精欧美一区二区三区| 少妇精品久久久一区二区三区| 国产清纯在线一区二区WWW| 亚洲天堂啪啪| 夜精品a一区二区三区| 国产成人夜色91| 99在线观看国产| 91精品视频在线播放| 日韩欧美国产成人| 99在线观看视频免费| 日韩一级毛一欧美一国产| 欧美日本一区二区三区免费| 91人妻日韩人妻无码专区精品| 国产00高中生在线播放| 国产精品入口麻豆| 热re99久久精品国99热| 国产一级在线播放| 青草视频在线观看国产| 国产美女精品一区二区| 日日碰狠狠添天天爽| 亚洲一区无码在线| 五月婷婷丁香综合| 亚洲AV色香蕉一区二区| 午夜无码一区二区三区| 精品一区二区三区自慰喷水| 黑人巨大精品欧美一区二区区| 亚洲人人视频|