付文杰,尚曉明,陳 磊,張軍朝
(國網河北省電力有限公司,石家莊 050000)
伴隨電力系統的智能化發展,智能電表計量裝置中包含越來越多的多維數據,智能電表計量數據量急劇上漲[1]。聚類算法是依據海量數據中包含的潛在規則,對數據進行分類的信息處理方法。粒子群優化算法應用于聚類算法優化時,通過設置適應度函數交叉操作粒子,提升粒子群算法內粒子種群的多樣性,避免聚類算法運行過程中,存在陷入局部最優的情況。
目前針對智能電表計量數據的研究越來越多,智能電表計量數據管理已成為電力領域的研究重點。研究高效的智能電表計量數據處理方法,已成為電力領域數據處理中亟待解決的重要問題。肖勇等人將深度信念網絡應用于智能電表數據異常檢測中[2],有效檢測智能電表中存在的異常數據,對于提升智能電表數據的應用性提供了有效的理論依據;高欣等人將CVAE-CNN模型應用于智能電表故障分類中[3],有效識別智能電表中不同類型故障,為智能電表的可靠運行提供依據。以上研究方法實現了智能電表異常以及故障的有效監測,但是無法應用于智能電表多維數據分類中。為了提升智能電表數據的應用性能,研究基于混合粒子群優化的智能電表計量多維數據聚類方法。采用混合粒子群算法對聚類算法進行優化,利用優化后的聚類算法處理智能電表多維計量數據,實現智能電表多維計量數據的有效劃分,提升智能電表多維計量數據的應用性。
選取雙模組網方式作為智能電表多維計量數據的采集方式,雙模組網方式通過無線微功率與載波方式的結合,實現智能電表海量多維計量數據的通訊。智能電表雙模組網方式的結構圖如圖1所示。

圖1 雙模組網方式
選取現有的電力線纜作為智能電表雙模組網方式的電力載波方式。雙模組網方式無需設置智能電表計量多維數據通信的通信線路,采用原有的電力線纜進行數據通信,具有較高的通信可靠性。雙模組網中的無線微功率利用無線方式完成智能電表數據的寬帶連接,具有組網速度快的特點,可以滿足智能電表多維計量數據的通信線路切換水平。雙模組網方式適用于應用距離較近,未敷設光纖,智能電表較為分散的供電區域。
智能電表計量多維數據具有較高的關聯性以及相似性,提取智能電表計量多維數據的混沌特征,為智能電表計量多維數據聚類提供依據。智能電表計量多維數據中的隨機點與中心點間距超過所設定距離標準值時,表明該隨機點與所選取中心點不存在相關性關系;智能電表計量多維數據中的隨機點與中心點間距小于所設定距離標準值,同時距離標準值與間距不為零時,表示該隨機點與智能電表計量多維數據的中心點存在相關性[4]。智能電表計量多維數據內與中心點具有相關性的點數量越多時,表示智能電表計量多維數據的多項空間內存在更多的關聯維度。

式(1)中,G與Li分別表示赫維賽德函數以及大于兩個中心點間距的隨機點至中心點距離。
用d(L)表示關聯函數,其表達式如式(2)所示:

利用包含集合Q的分數對關聯函數進行去重處理。
用W表示智能電表計量數據提取混沌特征距離的標準值,可得設定的距離標準值W表達式如式(3)所示:

式(3)中,v表示關聯維數。關聯維數可以體現智能電表計量多維數據間的混沌程度,將數據間的混沌程度設置為智能電表計量多維數據的聚類基礎。
1.3.1 計量數據的K-means聚類算法
1)完成劃分的簇并未空集,簇內的數據需要大于0。
2)所劃分的簇內的智能電表計量多維數據與該簇存在唯一的關系性,即智能電表計量多維數據僅可屬于一個簇。
K-means聚類算法是利用貪心策略進行數據劃分的重要算法,該算法通過迭代更新方式,令聚類結果逼近最優解。K-means聚類算法對智能電表計量多維數據進行聚類的聚類過程如下:
1)隨機從智能電表計量多維數據中選取初始簇質心數量為K,所選取初始簇的質心用表示。
2)設置集合Ci為智能電表計量多維數據集Z中,相比于ηj,與ηi距離更近的點的集合。
3)用ηi表示集合Ci內,全部智能電表多維數據的質心,質心ηi的計算公式如式(4)所示:

4)重復以上步驟,直至集合C內的數據不再變化為止。
1.3.2 粒子群優化計量數據聚類
設粒子群優化算法內全部粒子在n維智能電表計量數據搜索空間中的運動狀態與位置向量以及速度向量相關。用Xi=[xi1,xi2·,··xin]與Vi=[vi1,vi2·,··vin]分別表示粒子群算法的位置向量以及速度向量。
通過粒子群優化算法內粒子的位置變化,表示智能電表計量多維數據聚類問題的可行解。用Pbest=[pi1,pi2·,·pin]與gbest=[g1,g2·,··gn]分別表示粒子群內粒子個體的歷史最優解以及全局歷史最優解。
粒子群優化算法的粒子速度更新公式如式(5)所示:

粒子位置更新公式如式(6)所示:

式(6)中,c1、c2與ω分別表示加速度常數以及慣性權重;r1與r2均表示隨機常數。
粒子群優化算法的慣性權重線性遞減的表達式如式(7)所示:

式(7)中,t與tmax分別表示迭代次數以及最大迭代次數,ωmax與ωmin分別表示慣性權重最大值以及最小值。
1.3.3 混合粒子群優化計量數據K-means聚類算法
采用混合粒子群優化算法優化K-means聚類算法,獲取智能電表計量多維數據聚類結果。
設置混合粒子群優化K-means聚類算法的適應度函數表達式如式(8)所示:

式(8)中,J表示智能電表計量多維數據聚類的目標函數,設置聚類均方根誤差最小作為智能電表計量多維數據聚類的目標函數。聚類目標函數值越小,聚類的適應度值越高。
K-means聚類算法對智能電表計量多維數據進行聚類時,存在容易早熟的情況。粒子群算法內的種群多樣性伴隨迭代次數的提升而有所下降,無法快速收斂至全局最優解。伴隨粒子群算法不斷迭代,粒子群優化算法運行速度有所降低。粒子群優化算法的粒子速度下降至0時,粒子群優化算法內的粒子無法繼續在智能電表計量多維數據的搜索空間中搜索。為了避免粒子群算法內粒子無法繼續搜索,設置閾值εv以及區間為0~1范圍內,服從均勻分布的隨機變量r3。粒子運動速度vij小于閾值εv時,令vij=r3×vmax,避免粒子早熟情況。粒子以此時的位置在智能電表計量多維數據的搜索空間中重新開始搜尋[5],以新速度繼續搜尋,提升粒子群算法的收斂速度。
選取混沌系統中的Logisic映射方法優化粒子群算法,Logisic映射是混沌空間中的滿映射,具有計算量小以及使用方便的特點。Logisic映射表達式如式(9)所示:

式(9)中,μ與θik分別表示控制參數以及混沌特征向量。
引入混沌特征向量,將粒子群優化算法的位置更新公式轉化如式(10)所示:

式(10)中,xk表示混沌運算向量映射至[0,1]區間的粒子群向量;xk+1表示加入了隨機擾動后的混沌特征向量;λ表示區間為[0,1]的調節系數,該系數可以自適應變化,利用調節系數控制混沌特征向量對粒子群向量的擾動程度。
粒子群算法運行初期時,調節系數λ的值較大,伴隨粒子群算法不斷運行,調節系數逐漸降低。粒子群算法優化K-means聚類算法,對智能電表計量多維數據進行聚類的調節系數計算公式如式(11)所示。

式(11)中,t與σ分別表示粒子群優化算法的當前迭代次數以及依據智能電表計量多維數據聚類目標函數設置的整數。
將混沌算子引入粒子群優化算法,基于混合粒子群優化的智能電表計量多維數據聚類方法流程如下:
設置智能電表計量多維數據間的混沌程度作為K-means聚類的聚類依據,利用混合粒子群算法優化K-means聚類算法。隨機選取粒子,利用混沌算子擾動粒子,所選取粒子設置為粒子群優化算法的個體極值以及全局極值。
從智能電表計量多維數據聚類的解空間[ximin,ximax]中,將所確定粒子的全部分量xi映射至混沌空間表達式如式(12)所示:

將粒子的全部分量映射至混沌空間后,利用式(10)優化x′i。將完成混沌優化的粒子分量逆映射,粒子映射至解空間的表達式如式(13)所示:

采用混沌算子優化粒子群內粒子后,更新粒子位置,直至迭代次數滿足最大迭代次數,且智能電表計量多維數據聚類的目標函數滿足條件,終止粒子群算法運算,輸出智能電表計量多維數據聚類結果。
為了驗證所研究基于混合粒子群優化的智能電表計量多維數據聚類方法對于智能電表計量多維數據的聚類有效性,將該方法應用于某電力企業的智能電表計量數據管理中,通過智能電表計量數據多維聚類結果,提升智能電表計量數據應用性。
該電力企業的智能電表數據管理系統中,智能電表計量多維數據顯示界面如圖2所示。

圖2 智能電表計量多維數據顯示界面
通過圖2實驗結果可以看出,該電力企業的智能電表可以顯示不同用戶的電壓數據、電量數據等不同類型的多維數據。智能電表計量多維數據的聚類方法的聚類性能極為重要。
采用本文方法對其中10個智能電表采集的多維計量數據進行聚類,智能電表數據集的屬性如表1所示。

表1 智能電表數據集的屬性信息
采用混合粒子群優化方法對智能電表計量的多維數據進行聚類,所獲取的關聯維數如圖3所示,選取文獻[2]方法與文獻[3]方法作為對比方法。

圖3 關聯維數對比結果
通過圖3實驗結果可以看出,采用本文方法對智能電表計量多維數據進行聚類,所獲取的關聯維數具有較高的穩定性。文獻[2]方法以及文獻[3]方法對智能電表計量多維數據進行聚類的關聯維數波動性較大。圖3對比結果有效驗證本文方法對智能電表計量多維數據聚類的關聯維數具有較高的穩定性,可以滿足智能電表計量多維數據聚類的穩定性需求。
采用本文方法對智能電表計量多維數據進行聚類,獲取智能電表運行期間,不同時間時,其中三個智能電表的電壓數據結果如圖4所示。

圖4 智能電表電壓數據聚類結果
通過圖4實驗結果可以看出,采用本文方法可以實現智能電表計量多維數據的有效聚類,獲取智能電表計量多維數據中的電壓數據。智能電表管理人員可以依據通過聚類獲取的不同智能電表的電壓數據,獲取用戶用電過程中的電壓質量。
采用混合粒子群優化對智能電表計量多維數據進行聚類,獲取智能電表運行期間,不同時間時,其中三個智能電表的電流數據結果如圖5所示。
通過圖5實驗結果可以看出,采用混合粒子群優化方法可以實現智能電表計量多維數據的有效聚類,獲取智能電表計量多維數據中的電流數據。通過圖5實驗結果可以看出,序號為13845的智能電表于8時存在電流數據異常情況,智能電表計量管理人員可以依據電流變化,明確智能電表的運行狀況。
采用混合粒子群優化方法對智能電表計量多維數據進行聚類,獲取智能電表運行期間,不同時間時,其中三個智能電表的有功功率結果如圖6所示。

圖6 智能電表有功功率數據聚類結果
通過圖6實驗結果可以看出,采用混合粒子群優化方法可以實現智能電表計量多維數據的有效聚類,獲取智能電表計量多維數據中的有功功率數據。智能電表管理人員可以依據通過聚類獲取的不同智能電表的有功功率,明確用戶用電過程中的功率波動情況。
采用混合粒子群優化方法對智能電表計量多維數據進行聚類,獲取智能電表運行期間,不同時間段,其中三個智能電表的電量變化如圖7所示。

圖7 智能電表電量聚類結果
通過圖7實驗結果可以看出,混合粒子群優化方法可以對智能電表計量多維數據中的電量數據進行聚類,電量數據是智能電表計量數據中的重要數據,混合粒子群優化方法通過聚類獲取多維數據中的電表運行的電量數據,智能電表管理人員可以依據聚類結果中的電量數據直觀展示用戶的用電情況,驗證本文方法具有較高的應用性。
針對智能電表計量多維數據間的關聯程度較高,導致聚類效果較差的缺陷,將混合粒子群優化算法應用于智能電表計量多維數據聚類中,利用混合粒子群優化算法提升聚類算法對智能電表計量多維數據的聚類性能。通過實驗驗證該方法可以實現智能電表計量多維數據的有效聚類,混合粒子群優化算法可以有效改善聚類算法存在的早熟情況,提升了聚類算法的收斂速度,實用性較高,可以有效提升智能電表計量數據的應用性能。