高宇豆,保 富,黃祖源,田 園,原 野
(云南電網有限責任公司信息中心,云南昆明 650214)
我國人口數量以及經濟發展的壓力較大,能源消耗速度快、消耗量大。我國學者對節約電力用戶識別潛力的研究已經從工業領域擴展到經濟領域和社會環境領域[1-2],在需求管理、市場開拓、客戶服務等方面取得了重大突破。文獻[3]在雙因素理論的基礎上,明確了電力服務對象。文獻[4]根據用戶聚類特點,進行了節約電力潛力測試,得出識別效果良好的結論。
但是上述研究并未涉及電力用戶高斯核密度問題,節約電力潛力用戶識別穩定性較差,對此,該文提出基于數據挖掘的節約電力潛力用戶智能識別方法,數據挖掘技術主要負責從大量數據中提取、聚類和分析數據信息,能夠將用戶分成不同類別的潛力對象,有助于業務人員縮小篩選范圍,有針對性地開展節約電力工作。
利用數據挖掘技術,通過數據預處理、數據挖掘以及數據檢驗等步驟,進行節約電力潛力測算[5]。數據挖掘流程如圖1 所示。
圖1 中,數據挖掘流程包括數據清理、數據集成以及數據分類等具體步驟,以滿足用戶需求為目標,根據當前的技術可行性、經濟可行性與環保可行性,規則驗證所獲取到的數據[6],估算出節約電力的綜合潛力值。
需要對節約電力的潛在價值進行分析,然后根據計算結果對能源消費結構類型進行劃分,步驟如下:
依照能源消費結構的組成要素即煤、石油、天然氣數量,提取替代設備的轉化常數,計算發電部分的比重,獲取現有設備的能源平均效率。節約電力潛力計算公式如下:
其中,R表示理論層面的節約電力潛力,E表示任意一種非電能的能源消耗量,c表示任意一種非電能的能源熱值,α表示用電設備與非用電設備的平均效率比值,D表示電能以千瓦·時為單位的能量轉化常數。根據消耗燃料的熱值與替代設備能效數值,進行替代設備的燃料總消耗量測算,可行潛力計算公式如下:
其中,RT表示電能技術的可行潛力,A表示任意一種非用電設備的燃料使用量,B表示該種燃料的能源熱值,α1表示任意非用電設備的效率均值,α2表示用電設備的效率均值,D表示電能以千瓦·時為單位的能量轉化常數。默認設備替代前與設備替代后的燃料使用量相同,則式(2)變成如下形式:
其中,L表示任意一種非電設備的電能容量,t表示該種非電設備的運行時長,完成了節約電力勢值的估算步驟,為智能辨識方法的設計提供了數據支持。
在電網中隨機選取一個目標[7-11],利用鄰域中最近點和最遠點之間的距離來判斷距離。將任意對象設為l,則表達公式如下:
其中,l表示是遠離簇的任意一個對象,設定最近的相鄰對象的個數k=2,dmin與dmax分別表示空間內距離樣本中心的最小距離與最大距離,具體如圖2所示。
圖2 中,在同一個空間內,任意對象l只存在兩個有效距離,即最大距離與最小距離。設定f為任意整數,則對象l的離群因子表達公式如下:
其中,Ne表示電力用戶的用電情況樣本,F(l)表示對象l的離群因子,u表示電力用戶的數量,根據式(6),得出對象l的高斯核密度公式如下:
其中,Y(l)表示任意對象l的高斯核函數,表示對象b與對象l之間的距離,Ne表示電力用戶的用電情況樣本,j表示Y(l)函數的縱向寬度,定義了函數的有效區間,當上述參數滿足的條件時,則式(7)變成如下形式:
其中,Y表示對象b與對象l之間的高斯核密度,表示對象b與對象l之間的距離,j表示Y(l)函數的縱向寬度。至此,獲取電力用戶用電高斯核密度。
為了突出節約電力潛在用戶的特征[12-13],提取出所需的用戶信息[14]。根據用電負荷曲線,得出電力負荷的變化規律,具體如圖3 所示。
圖3 中,電力負荷變化可以劃分為四個階段,并且從(h1,p1)至(h4,p4)四個階段的增長幅度與增長速度都呈遞增趨勢。將潛力用戶的綜合評價特征進行聚類,設定評價集合為并利用離散因子建立綜合評價的隸屬度矩陣Q,矩陣表達公式如下:
其中,qns表示對第n個評價因素的模糊權重,并且滿足s=1,2,…,n的條件,矩陣Q包含的集合Z的所有評價信息,當n為任意整數時,矩陣Q結合權重向量,變成如下形式:
其中,代表權重向量,M表示隸屬度矩陣,定義了節約電力潛力用戶的綜合評價方式[15-16]。
為了驗證此次設計的智能識別算法的穩定性,利用電力用戶的意向偏離度,獲取節約電力潛力用戶類型,用戶意向偏離度計算公式如下:
其中,Gp表示用戶意向的偏離度,Cp表示用戶p的用電負荷,Tpi表示用戶p的節約電力項目i的接受程度,CTi表示電力用戶中對節約電力項目i表示感興趣的用戶數量。根據式(11)的計算結果,劃分為10 組隨機攻擊類型、均值攻擊類型、流行攻擊類型、段推攻擊類型,其多次平均攻擊參數具體數值如表1所示。

表1 攻擊參數均值
將表1 中不同攻擊類型的數值的均值,代入攻擊概貌識別率的公式中,具體表達如下:
其中,H表示攻擊概貌的識別率,V表示攻擊概貌的總數量,P表示真實的攻擊概貌的數量。
基于上述攻擊類型指標,以文獻[3]方法和文獻[4]方法為現有識別方法1 和現有識別方法2,在不同的攻擊強度條件下,與該文智能識別方法對比得出實驗結果如圖4 所示。
圖4中,不同的攻擊強度條件下,兩種現有識別方法與設計的智能識別算法的測試穩定性均值如表2所示。
從表2 可以看出,此次設計的用戶智能識別方法,比其他兩種現有識別方法的穩定性均值高出12.326%~25.651%不等,證明在不同的攻擊強度下,融合了數據挖掘技術的智能識別方法穩定性更高,可以合理分配資源,更有利于識別潛在用戶,更適合應用在節約電力潛力用戶識別領域。

表2 識別算法穩定性測試結果均值(%)
文中利用數據挖掘技術提取所需的用戶信息,估計節約電力的潛在價值,準確有效地將未知屬性的數據樣本劃分為相應的類型,構造用戶隸屬度矩陣,設置與匹配智能識別模式,其應用穩定性均值比其他兩種現有識別方法高出12.326%~25.651%不等,為電力行業相關管理部門挖掘節約電力的潛在用戶,判斷節約電力市場的變化,制定相應的節約電力決策提供一定的理論支持。