程慧 張瑞 張世科 史冬妮 付鳳平



摘 要:當重要用戶或敏感用戶發生停電事件時,電網企業將面臨較大壓力,所以對用電敏感用戶進行準確辨識,降低停電對其帶來的損失具有重要意義。提出了采用蟻群算法優化決策樹算法,主要從屬性離散化,啟發信息,信息素更新等方面進行優化。通過UCI數據庫的分類數據建立仿真對比實驗,與傳統的SVM和決策樹方法進行實驗對比,驗證了本文所提方法具有更高的分類準確性。將所提方法與傳統的SVM和Logistic算法進行仿真對比,驗證所提方法更適用于用戶停電敏感度的分析。
關鍵詞:蟻群算法; 決策樹; 停電敏感度; 分類
中圖分類號: TM7
文獻標志碼: A
Abstract:If the power failure happens to important or sensitive users, the power grid enterprises will face on great pressure. Therefore, it is of great significance to accurately identify sensitive users and reduce the loss caused by power failure. An ant colony optimization decision tree algorithm is proposed, which is mainly optimized from the aspects of attribute discretization, heuristic information and pheromone updating. The simulation comparison experiment was established through the classification data of UCI database, and compared with the traditional SVM and decision tree methods, which verifies the higher classification accuracy of the proposed method in this paper. The proposed method in this paper is compared with the traditional SVM and Logistic algorithm to verify that it is more suitable for the analysis of user's power failure sensitivity.
Key words:Ant colony algorithm; Decision tree; Power failure sensitivity; Classification
0 引言
降低由停電導致的投訴可以大大壓縮工單受理次數,對供電質量提升影響比較大[1-2]。因此基于當前工單信息,深入建模挖掘停電敏感的規律和影響因素,評估停電敏感性,從而確定計劃停電的重要因素,實現每條線路停電計劃的安排有科學理論支撐可遵循,具有重大意義[3-4]。
敏感客戶的研究不同于一般的定性分類問題,目前研究比較少,并沒有明確的模型和可借鑒的方法?,F有的停電敏感度研究,基本都是選中影響指標,通過測試數據建立測試模型,確定指標權重,計算得到是否屬于敏感情況[5]。文獻[6]從電力公司提取客戶的用電數據,確定對用戶影響較大的屬性,采用邏輯回歸方法建立客戶用電敏感度的分析模型,仿真結果驗證了該方法能夠準確的對用戶停電敏感度進行預測[6]。文獻[7]從電網企業采集影響用戶停電的相關數據,采用優勢分析法確定主要影響因素,建立基于k-support稀疏邏輯回歸的停電敏感性預測模型[7]。文獻[8]對數據進行預處理之后,確定每隔屬性的權重,提出了一種改進的隨機森林算法,用于辨別停電用戶的敏感程度[8]。文獻[9]根據客戶的用電數據信息,采用熵值法對客戶敏感度進行分析,并將敏感用戶做標簽識別,提高電力企業服務質量[9]。
為了對客戶停電敏感程度進行分析,本文提出了一種改進的決策樹方法,建立用戶停電敏感度分析模型,以提高電力企業的服務水平。
1 停電敏感度數據預處理
采用改進的決策樹方法對用戶進行停電敏感度分析的時候,主要包括數據預處理,特征選取,建立停電敏感度分析模型。停電敏感度的流程圖如圖1所示。
3 算例仿真
3.1 算法驗證
為了驗證本文所提的蟻群算法優化決策樹算法的有效性,選取UCI數據庫10組數據進行仿真對比實驗,UCI數據庫的數據集如表1所示,ACO-C4.5, C4.5和SVM算法的分類結果如圖3所示。
3.2 基于改進決策樹的用電敏感度分析
采用本文所提方法對居民用戶進行停電敏感用戶分類。選取某地區電力公司的供電數據作為樣本數據。停電敏感度的分類結果如圖4所示。
當蟻群優化的決策樹選擇6分支,7層決策層的時候,與SVM和Logistic算法進行分類效果對比,對比結果如表2所示。
4.3 結果分析
從圖3可以看出,在處理相同的數據時,本文所提的蟻群算法優化的決策樹模型,比傳統的決策樹和SVM算法具有更高的分類準確度,驗證了本文所提方法的有效性。
如圖4所示為當分支數為固定值的時候,決策層數量從2到9時的各個指標所占百分比。圖4中的a,b,c的R值不能確定停電敏感用戶。圖4中的f,g,h層數到達6,7的時候,P,R,A能夠達到準確率。通過對比圖4中的決策層數和分支數可以發現,當調和平均數大于80%的時候,能夠達到決策樹分類的準確度。通過計算調和平均數F,可以知道,滿足條件的決策樹結構為:決策層數為6的時候,分支數為7,8,9;當決策層數為7的時候,分支數為6,7,8,9;當決策層數為8的時候,分支數為6,7,8,9;當決策層數為9的時候,分支數為4,5,6,7,8,9。
從表2可以看出,ACO-C4.5比SVM和Logistic具有更好的識別精度召回率,且FPR和FNR較小,更適用于停電敏感用戶的判定。
5 總結
為了提高停電敏感度預測精度,提出了采用蟻群算法優化決策樹模型的方法,經過UCI數據庫的仿真實驗,驗證了本文所提的改進的決策樹方法比傳統的SVM和決策樹算法具有更高的分類準確度。在采用ACO-C4.5建立停電用戶敏感度分析模型的時候,通過實驗可得分支數與決策層數和準確度之間的關系。對比實驗,驗證了ACO-C4.5更適合停電敏感用戶的判定。
參考文獻
[1]
盧恩,魯曉軍,龍霏,等.電力系統停電風險評估指標及方法[J].電力自動化設備,2015,35(3):68-74.
[2] 郭賢,郭賀,程浩忠,等.考慮用戶停電損失的微網網架規劃[J].電工技術學報,2014,29(8):301-308.
[3] 劉自發,張在寶,楊濱,等.電網大停電社會綜合損失評估[J].電網技術,2017,41(9):2928-2940.
[4] 曹一家,曹麗華,黎燦兵,等.考慮大停電風險的輸電網擴展規劃模型和算法[J].中國電機工程學報,2014,34(1):138-145.
[5] 于群,石良,曹娜,等.廣義極值理論在大停電事故損失負荷預測中的應用[J].電力系統自動化,2016,40(8):71-77.
[6] 耿俊成,張小斐,袁少光,等.基于邏輯回歸模型的電力客戶停電敏感度評分卡研究與實現[J].電力需求側管理,2018,20(3):46-50.
[7] 耿俊成,張小斐,孫玉寶,等.基于K-support稀疏邏輯回歸的停電敏感度預測[J].計算機與現代化,2018(4):68-73.
[8] 謝國榮,鄭宏,林偉圻,等.基于改進隨機森林算法的停電敏感用戶分類[J].計算機系統應用,2019,28(3):104-110.
[9] 蔡麗華.基于機器學習技術的電力停電敏感客戶標簽體系[J].農村電氣化,2018(5):40-43.
[10] 王道明,魯昌華,蔣薇薇,等.基于粒子群算法的決策樹SVM多分類方法研究[J].電子測量與儀器學報,2015,29(4):611-615.
[11] 劉曉娜,封志明,姜魯光.基于決策樹分類的橡膠林地遙感識別[J].農業工程學報,2013,29(24):163-172.
[12] 張棪,曹健.面向大數據分析的決策樹算法[J].計算機科學,2016,43(S1):374-379.
[13] 李擎,張超,陳鵬,等.一種基于粒子群參數優化的改進蟻群算法[J].控制與決策,2013,28(6):873-878.
[14] 張成,凌有鑄,陳孟元.改進蟻群算法求解移動機器人路徑規劃[J].電子測量與儀器學報,2016,30(11):1758-1764.
[15] 游曉明,劉升,呂金秋.一種動態搜索策略的蟻群算法及其在機器人路徑規劃中的應用[J].控制與決策,2017,32(3):552-556.
(收稿日期: 2019.10.16)