王云艷,羅 帥,王子健
(湖北工業大學電氣與電子工程學院,湖北 武漢430068)
隨著工業3.0時代的到來,世界資源損耗在不斷加劇,國家資源發展戰略部署對光伏發電提出更高的要求,需要更加準確的光伏發電功率預測來協助國家資源管理部門宏觀協調電能分布。對光伏輸出功率的準確預測,可以更好的提高電力各部門適時對電力調整調度的效率,從而更高效率的減少光伏發電系統接入時對電網系統造成的不利影響。國內外知名學者針對光伏輸出有功功率與時間序列關系建立采取多種數據特征挖掘、數據分析、數據建模等手段來預測未來光伏發展狀態,韓思鵬等[1]人在總結近些年來光伏預測方法中主要歸類了直接法和間接法預測模型,直接預測算法基于的數據為光伏功率結果,而間接法基于的是影響光伏功率的因數,更為可靠的數據結構決定預測的準確度。毛玉賓等[3]人針對影響光伏發電的溫度和濕度利用支持向量機(SVM)來彌補直接預測算法的不足,但是對數據空間的處理比較粗糙導致遺漏了部分重要尺度空間。PULIPAKA等[3-5]人針對影響發電功率的輻照度樣本應用聚類算法,雖然建立較為可靠的數據空間來進行數據預測,但數據空間對后期的預測網咯并沒有緊密連接性。隨著人工智能時代的到來,更多的學者將圖像處理中的深度學習網絡算法直接運用到光伏發電數據預測中,譚建斌等[6]人采用改進型BP神經網絡結構來更好地預測數據,改進的過程局限在輸入與輸出結構上的加強,未涉及到中間隱含層的結構優化。吳堅等[7]人將深度置信網絡通過無監督學習過程逐層挖掘數據內部結構,深度網絡對數據的復雜度要求相對較高,對光伏發電簡單的數據空間結構適用性并非完全優于傳統的方法。結合傳統的數據分析算法[8]和近代的神經網絡算法[9]提出一種更加優越且遷移性較高的可嵌入式網絡結構[10],更加全面地考慮光伏發電數據與其它數據類型的差異性,如何更好地適應光伏發電數據值得去思考和挖掘。
綜合考慮光伏發電功率預測的數據類型和預測算法的有效性,本文提出了一種結合流形學習網絡和改進型BP網絡的光伏發電功率預測算法。通過灰度關聯算法[11]預處理數據,充分發揮流形學習網絡的數據趨向性和深度神經網絡的特征挖掘全面性,避免數據過少而導致的模型發散[12],同時考慮到數據空間過于冗余會導致訓練尺度大、模型分割能力差問題[13],一定程度上提高了模型訓練的難度和模型結構的穩定性,更大程度上提高了模型的可遷移性。
灰度關聯算法是早年提出的一種根據各因素變換曲線的相似度來判斷關聯程度科學理論,通常運用此種方法分析各種因素對結果影響的程度,此外此方法也可以解決隨時間變化產生的綜合評價類問題,此核心就是按照一定規則確立時間的母序列,然后把評估對象隨著時間變化作為子序列,根據子序列與母序列的相關程度得出結論。

圖1 灰度關聯結構
如圖1所示,首先確立分析數列分別為參考數列Y和比較數列Xi,并且將兩組數據分別作歸一化處理得到數列y和xi,然后利用式(1)、(2)計算關聯系數,關聯系數作為歸一化參考數列y和比較數列xi在各個時刻的關聯程度值,但是參數過多不利于數據分析時進行整體比較,利用式(3)利用求取平均數的方法獲得關聯度ri,最后將關聯度按照大小排序剔除掉有限個關聯度相對較小的因素,有利數據預測中的損失遞減。
ξi(k)

(1)
設Δi(k)=|y(k)-xi(k)|,則

(3)
數據空間降維處理作為數據預測的關鍵步驟,一方面預訓練數據空間結構過于復雜會導致訓練模型的過擬合,損失難以在有效時間收斂到預定值,另一方面過度的數據維度壓縮會破壞數據的內部體系結構,數據的連接性不能夠支持訓練,如圖2所示。

圖2 PCA降維傳統數據空間
常用的PCA(Principal Component Analysis,主成分分析)能夠有效地將傳統的數據空間結構進行分離,但是針對高維度復雜數據,這種常用的數據降維方式難以滿足大數據環境,如圖3所示,流形學習算法是從局部處理數據,能夠相似度較高的樣本點集中到相近的位置空間。

圖3 流形學習降維過程
其實現步驟如下:
Step1:首先構造近鄰圖,連接所有的樣本點,連接每個點最近的k個點,確定相鄰點之間的權重大小如式(4),x1與x2分別為兩個相鄰點。
(4)
Step2:讓相似的樣本點在降維后空間中距離較近,構建優化目標函數f(x)如式(5)

(5)
ya,yb是分別是特征點在n維空間中的列向量。拉普拉斯矩陣 L=D-W,其中D 為圖的度矩陣,W為圖的鄰接矩陣。然后進行圖拉普拉斯矩陣特征值分解,使用最小的n個特征值(非零)對應的特征向量作為降維后的結果。
相比傳統的光伏數據處理過程,本算法將灰度關聯算法置于網絡的前端數據預處理過程,加強了算法的可遷移性,適用于多種影響因素影響下的光伏發電功率數據預測。流形學習網絡結構嵌于改進型BP網絡的前端,增強數據的可分離性,同時過濾掉部分無關因子,BP神經的網絡輸入點控制在合適范圍。改進型BP網絡引入深度網絡中端對端的結構思想,將隱含層設計為16節點到64節點的遞推結構,考慮到隱含層結構過于復雜極容易導致維度爆炸,訓練模型的過擬合現象,在隱含節點的后端從64節點還原到16節點結構,最后輸出為一維概率。如圖4所示,整體算法流程如圖4所示。

圖4 整體算法流程
Step1:考察比較數據空間與參考數據的關聯度,通過灰度關聯分析算法獲取關聯度排序,排除三組關聯度較小的影響因素,將剩余的影響因素重新組合成新的比較數據空間。
Step2:通過流形學習網絡過濾掉一部分聯系不夠緊密的數據結構,并且將聯系非常緊密的數據粗略劃分,構成相對完備的與訓練數據空間。
Step3:構建改進型BP神經網絡結構,如式(6)所示,輸入層與隱含層、隱含層與輸出層使用S型函數作為激活函數,如式(7)所示,隱含層彼此之間使用雙極S型函數作為激活函數,利用式(8)計算全局誤差,利用全局誤差反向修正傳遞系數。

(8)
Step4:通過模型的訓練保存最優傳遞參數,修正流形學習網絡最有結構,最后利用保存模型預測未來光伏發電功率影響因數。
本文光伏預測數據來源于國家電力投資集團有限公司依據《國家電投大數據建設總體方案》、《國家電投推進大眾創業萬眾創新工業方案》策劃的光伏電站人工智能運維大數據處理分析比賽數據,如圖5所示,訓練數據的測試數據包含光伏板運行狀態參數和氣象參數,光伏板運行狀態參數包括背板溫度、光伏陣列的電壓和電流、轉換效率等,氣象參數包括太陽能輻照度、環境溫濕度、風速、風向等。

圖5 光伏預測部分數據
實驗環境在WIN10系統下,為了快速搭建改進型BP網絡,采用目前較為流行的深度學習框架Tensorflow,在實驗中,為了提高實驗網絡的訓練速度,采用單個8G容量GPU的計算模式,硬件上采用NVIDIA1080卡,利用GUP加速模式運行。
改進型BP神經網絡算法的基本性能參數如表1所示,針對改進型BP神經網絡中模擬端對端結構,16層增加到64層隱含層設置更大的損失loss1,有利于模型的快速收斂,而在后端的64層縮減過程采用loss2,防止模型的過擬合。同時光伏發電功率預測結果需要通過合理的評價參數進行定量分析。

表1 基本性能參數
目前通常使用平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)兩個有效地指標來評價預測結果,如式(9)、(10),更具光照強度來增加晴天和陰天的平均準確度參數(OA),如式(11),一定程度上加強數據分析的合理性、可靠性。

(11)

為了更好地驗證本算法有效性,通過對數據樣本準確度和損失值進行實時監控,得到損失監控結果如圖6所示,能夠明顯看出損失在前期下降較快到后期變得更加平緩。分別是用支持向量機(SVM)分類、流形學習+SVM、改進型BP三組算法與本文算法作對比,通過在所有預測樣本中隨機抽取100個樣本得到預測結果與真實結果對比如圖7所示,雖然測試結果中有個別奇點,但是整體預測結果與真實結果基本一致。顯而易見,本算法模型適應本數據結構,但是準確度存在一定的不足。如表2所示,其次根據光照強度對數據分為晴天和陰天兩種,分別計算兩組數據預測結果的準確度,晴天預測結果平均準確度比陰天預測結果平均準確度高8%左右,流形學習算法結合支持向量機進行訓練預測結果MAPE下降了9.3%、RMES降低了0.05kW,證明了流形學習網絡達到了數據預分類效果。

圖6 損失結果

圖7 預測結果與真實結果對比
相對傳統的機器學習算法,本文采取近些年深度神經網絡優化模型結構對BP神經網絡進行修正,得到改進型BP網絡的預測結果中MAPE下降了1.2%、RMES下降了0.01kw,雖然相比流形學習+SVM只是有微小的效果增益,吸取流形學習算法的優勢后的本算法效果相對有大的進步,平均絕對百分比誤差(MAPE)下降了10%左右,均方根誤差(RMSE)下降了0.2kW左右。

表2 不同模型評價指標分布
通過流形學習網絡結合支持向量機算法和單純利用數據預處理后用支持向量機分類算法結果對比,證明流形學習算法針對高維度數據空間就夠的降維和初步分層有一定效果,相比其它基于簡單線性運算的降維算法更加有效,也說明了數據空間結構對數據分類、數據挖掘有重要引導作用,大數據的挖掘需要合理的數據空間作為基礎,只要數據空間結構足夠完備而且規律性可尋,再后期的數據處理過程中才能更好地達到預想效果。本算法中BP神經網絡的改進方式首先提取有效地底層信息空間,然后學習有效空間特征后再使用相對高層信息空間,充分利用信息空間能更有效得學習特征。通過分析結果表明本算法有如下優勢:①相比傳統的預測算法,本算法加入灰度關聯算法來對數據進行篩選,剔除數據中的奇點來,訓練數據更加可靠,模型的穩定性和兼容性更高。②將流形學習框架放入網絡前端,一方面增強網絡的空間結構,另一方面降低數據空間維度,有利于網絡訓練的速度和損失的下降,模型收斂更快。③改進BP神經網絡結構,學習有效空間特征來獲取最優網絡的參數,網絡的可遷移性強,后期可將流形學習或者是其它算法嵌入其中,減少訓練時間。
光伏發電技術雖然已經相對成熟,但是發電功率的不穩定性會影響區域供電不穩定,隨著大數據、人工智能和工業3.0時代的到來,將圖像處理領域的深度學習算法遷移到光伏發電功率預測能提高預測的準確度,相比傳統的預測算法,深度學習的思想對光伏發電功率影響因素的數據空間要求更高,本文提出的結合流形學習算法和改進型BP神經網絡算法,首先用灰度關聯算法排除3項與光伏功率關聯度最差的因素,其次結合流形學習網絡將數據空間進行降維,最后采用模擬端對端結構的改進型BP神經網絡來訓練獲得影響因子,保存的算法模型可以對未來幾年的數據進行預測。本算法有望將流形學習網絡嵌入改進型BP神經網絡中,由后端的預測結果來微調流形學習網絡,應用領域上能適用于多種光伏發電數據,對多種環境下的測得影響因素預測獲取未來發電功率,協助國家資源管理部門宏觀協調電能分布。